Computer-Software gegen Grippe-Epidemien

Mit Rechenkraft rüsten Wissenschaftler zum Kampf gegen die Grippe. Experten um Alice Carolyn McHardy aus dem Max-Planck-Institut für Informatik in Saarbrücken entwickeln Software, die im Erbgut von Viren verdächtige Strukturen findet, mit denen sich der nächste Auslöser einer weltweiten Grippewelle verrät – noch ehe die Grippesaison begonnen hat.

Text: Tim Schröder

Ein Schniefen im Flugzeug, ein Husten in der Bahn: In der kalten Jahreszeit denkt man dabei sogleich an die Grippe. Und seit dem Frühjahr 2009 wandert ein neuer Erreger um die Welt. Mit dem Menschen ist er per Flugzeug und Schiff von Amerika in alle anderen Kontinente vorgestoßen. Der Erreger hat es im Herbst 2009 sogar auf die Titelseiten der Zeitungen geschafft – das H1N1-Virus.

22000 Menschen sind bis Mitte Januar 2010 weltweit an dieser „Schweinegrippe“ genannten Infektion gestorben. Wie viele infiziert sind, kann niemand sagen. Sicher aber ist, dass H1N1 der Menschheit die erste weltumspannende Grippe beschert, die erste Pandemie des 21. Jahrhunderts. Dabei ist der Erreger bisher vergleichsweise harmlos: 1918 rafft ein Vorfahr des neuen H1N1-Virus fast 50 Millionen Menschen dahin. Diese Pandemie geht als „Spanische Grippe“ in die Geschichte ein. Seltsamerweise tötet sie vor allem junge, starke Menschen. Ältere und Schwache bleiben verschont.

Impfstoffentwicklung – ein Wettlauf gegen die Zeit

Lange hatten Mediziner dafür keine Erklärung. Erst vor wenigen Jahren konnten Forscher Ähnliches bei Affen beobachten. Ganz offensichtlich lässt der Erreger das Immunsystem überkochen. Wird ein Mensch infiziert, schüttet dessen Immunabwehr über die Maßen Infektionsbotenstoffe aus – entzündungsfördernde Substanzen, die eigentlich helfen sollen, den Erreger zu bekämpfen, dabei aber auch das körpereigene Gewebe angreifen. Vor allem die Immunsysteme junger, starker Menschen leisteten hierbei zu viel des Guten.

Inzwischen kennen Wissenschaftler die Grippe-Erreger recht gut. Längst hat man sie in verschiedene Gruppen eingeteilt, säuberlich getrennt nach genetischen Eigenschaften und charakteristischen Eiweißstrukturen. Gegen menschliche Grippeviren werden jedes Jahr größere Mengen Impfstoff produziert, die vor einer Infektion schützen sollen. Manchmal aber verändern sich die Viren an irgendeinem Ort der Welt so schnell und unerwartet, dass der Mensch machtlos ist. Ein neuer Erreger verbreitet sich, gegen den der vorhandene Impfstoff nicht helfen kann. Der Kampf gegen die Grippeviren ist deshalb vor allem ein Wettlauf gegen die Zeit.

Gelingt es den Wissenschaftlern rechtzeitig, eine neue Virus-Variante aufzuspüren, die sich in der nächsten bevorstehenden Grippewelle weltweit durchsetzen wird? Nur dann können sie die Impfstoffe an die neuen Erreger anpassen, ehe diese eine große Grippewelle auslösen. Meist gewinnen die Forscher das Rennen. Durchschnittlich alle vier Jahre aber sind die Viren schneller.

Wissenschaftler aus dem Max-Planck-Institut für Informatik in Saarbrücken rüsten deshalb mit Rechenkraft zum Kampf gegen die Erreger. Die Experten um Alice Carolyn McHardy entwickeln Software, die darauf spezialisiert ist, aus dem Erbgut von Viren oder auch Bakterien Geheimnisse herauszulesen. Ein Ziel der Bioinformatiker: In Zukunft soll der Computer verdächtige Strukturen im Virenerbgut finden, mit denen sich der nächste Auslöser einer weltweiten Grippewelle verrät, noch ehe die Grippesaison begonnen hat.

Welche Mutation macht das Virus gefährlich?

Es gibt insgesamt drei Typen von Influenzaviren: Typ A, B und C. Die bedeutendsten sind die Erreger der Influenza A, zumal sie die großen Pandemien auslösen. Von der Influenza A existieren viele Dutzend verschiedener Grippevirenstämme, die in Vögeln, aber auch in Schweinen zirkulieren. Aus diesen tierischen Viren geht mitunter ein Virus hervor, das den Sprung zum Menschen schafft – so wie das Virus der aktuellen Schweinegrippe. Die gewöhnlichen menschlichen Grippeviren hingegen entwickeln sich Jahr für Jahr weiter, vor allem in Südostasien. Von dort aus verbreiten sie sich alljährlich pünktlich zur Grippesaison rund um die Welt.

Ein Grippevirus gleicht einer stachligen Kugel. Bei diesen Stacheln handelt es sich um das Eiweiß Hämagglutinin. An seiner Spitze sitzt eine Art Schlossstruktur, mit der das Virus gezielt an die Oberfläche von tierischen oder menschlichen Zellen andocken kann. Es hängt vor allem von der Feinstruktur dieser Bindestelle ab, ob die Strukturen auf der Zelloberfläche wie ein Schlüssel ins Schloss zum Viren-Hämagglutinin passen – und ob ein Virus so Zugang in eine Zelle erhält. Finden beide zueinander, nimmt das Unheil seinen Lauf. Die Membran der Wirtszelle öffnet sich, das Virus gleitet in die Zelle hinein und entlässt seine Erbgutstränge ins Zellinnere.

Das Virus programmiert die Zelle in einen willfährigen Zombie um: Die Zelle wird zur Virenproduktionsstätte. Sie synthetisiert brav Virenbestandteile, die anschließend zu Hunderten neuer Viren zusammengesetzt werden. Dann wird ein zweites wichtiges Viren-Eiweiß, die Neuraminidase, aktiv. Sie öffnet die Zellmembran, sodass die frischen Viren wie Kampfsoldaten aus einem Truppentransporter herausströmen.

Viren können verschiedene Varianten des Hämagglutinin-Proteins (H) oder der Neuraminidase (N) auf ihrer Hülle tragen, und entsprechend werden sie klassifiziert: H1N1 oder H3N2 etwa. Doch wie verwandeln sich Viren aus Schweinen in potente menschliche Krankheitserreger? Zum einen durch Veränderungen in ihrem Erbgut. Viren vermehren sich in rasender Geschwindigkeit. Infizierte Körperzellen geben schon nach wenigen Stunden Millionen neuer Viren frei. Für jede neue Virengeneration muss das Erbgut verdoppelt werden. Dabei treten häufig Fehler auf. Manche Erbgutbausteine (die Basen) werden beim Ablesen der Erbgutvorlage falsch kopiert. Gelegentlich sind solche Mutationen für das Virus selbst tödlich. Manchmal sind sie irrelevant. Von Zeit zu Zeit aber wird das Virus dadurch erst richtig gefährlich.

Und noch etwas macht die Grippeviren unerhört wandlungsfähig: Ihr Erbgut liegt nicht als einzelner Strang vor, sondern ist säuberlich zu acht einzelnen Paketen, den Segmenten, verpackt. Solche Pakete können wie die Koffer am Flughafen durchaus einmal vertauscht werden. Das kann passieren, wenn eine Zelle zugleich von zwei Viren infiziert wird – einem menschlichen Virus und einem Schweinevirus zum Beispiel. Beide Viren ergießen ihre Erbgutsegmente in die Zelle – insgesamt 16 Segmente, die in atemberaubender Geschwindigkeit vervielfältigt werden.

Ein gefährlicher Tausch

Hin und wieder passiert es dann: Beim Zusammenbau der jungen Viren bugsiert der Vervielfältigungsapparat ein Segment vom falschen Virus in die Nachkommen. Reassortment nennt man diesen Tausch. So war es möglicherweise auch bei der Schweinegrippe, verschiedene Viren trugen Segmente zum neuen Virus bei. Und das veränderte seine Eigenschaften so, dass es zu einem Krankmacher wurde, der sich auch zwischen Menschen überträgt.

Spritzt man den gegen das H1N1-Virus entwickelten Impfstoff, so produziert der Körper Abwehrstoffe, die das Hämagglutinin auf dem Virus erkennen und lahmlegen. Das Virus kann nicht mehr an die Zellen andocken. Die Infektion wird gestoppt.

Permanent halten Forscher Ausschau nach genetischen Veränderungen in Influenza-A-Viren, die gefährlich werden könnten. Nicht nur bei dem neuen H1N1-Schweinegrippe-Virus, auch bei anderen bekannten Verdächtigen wie etwa dem klassischen menschlichen H1N1 oder H3N2. Das weltweite Fahndungsraster ist dicht. Im Auftrag der Weltgesundheitsorganisation WHO werden permanent an 112 Instituten und Kliniken in 83 Ländern Blutproben von Patienten genommen, genanalysiert und an vier große Grippe-Zentren geschickt.

Alle sechs Monate tagt ein Expertengremium, das die aktuellen Genanalyse-Daten prüft, um verdächtige Mutationen oder gar Reassortments auszuspähen. Die Fachleute versuchen aus den Genabschnitten herauszulesen, wie sich dadurch die Gestalt des Virus, seiner Eiweiße, des Hämagglutinins und des Antigens verändern wird, sodass das Virus den aktuellen Impfstoff umschiffen kann. Sie versuchen vorauszusehen, wie ein neuer Impfstoff aussehen muss, um gegen ein solches Virus helfen zu können – sollte es tatsächlich gefährlich werden. Entsprechend entwickelt man die Impfstoffe sukzessive weiter, passt sie an die modernen Influenza-A-Typen an. Doch das klappt nicht immer.

„Bis heute hat man die genauen Zusammenhänge zwischen den genetischen Veränderungen und dem Auftauchen einer neuen Grippevariante nicht völlig verstanden“, sagt Alice Carolyn McHardy, Leiterin der unabhängigen Forschungsgruppe Computational Genomics & Epidemiology. „Warum führen zum Beispiel manche Reassortments dazu, dass Viren krank machen, andere Reassortments aber nicht?“ Müssen dazu noch andere genetische Merkmale vorliegen? McHardy verwandelt die Computer in ihrem Saarbrücker Büro deshalb in Prognose-Werkzeuge, die die komplexen Zusammenhänge entwirren sollen.

Dazu verwendet sie statistische Lernverfahren. „Solche Verfahren sind in der Lage, verschiedenste Datensätze miteinander in Beziehung zu setzen und verborgene Zusammenhänge aufzuspüren.“ Zunächst füttert man das Lernverfahren mit bekannten Daten – etwa der genetischen Information von Viren, die in der Vergangenheit Grippeepidemien ausgelöst haben; hinzu kommt das Wissen darüber, wann und wo die Viren aufgetaucht sind oder wie die Eiweißstruktur des Hämagglutinins aussieht. Wie ein Rasterfahnder lernt der Computer damit die Täterprofile bekannter Viren kennen.

Zuverlässigere Prognose des dominanten Virus

Hat das Verfahren mit den Datensätzen ausgiebig trainiert, geht es richtig los. McHardy füttert den Computer mit den genetischen Informationen eines Influenza-A-Virus, von dem noch niemand weiß, wie gefährlich es ist. Das Lernverfahren gleicht die neuen Daten mit dem bekannten Wissen ab, es ordnet die Information so, dass sich die aktuellen Eingabewerte möglichst stark den erlernten Mustern annähern.

Als Antwort liefert der Rechner dann einen Zahlenwert der Art: Wie stark ähnelt die neue Gensequenz den Strukturen eines erfolgreichen Virus? Wie wahrscheinlich ist es also, dass eine Krankheit ausbricht? McHardy arbeitet dabei vor allem mit „Support-Vektor-Maschinen“ (SVM). Die wandeln Information in Datenpunkte, in Zahlenwerte, die wie Sterne am Firmament in einem riesigen Zahlenraum hängen. Gibt man neue Daten in das System ein, ordnet die SVM die neuen Werte den schwebenden Zahlen zu – je näher sie einer antrainierten Zahl sind, desto mehr ähneln sich die Daten.

Noch können die Saarbrücker Forscher keine aktuellen Voraussagen für die neue Grippesaison liefern, noch werden die Programme optimiert. Doch immerhin: Als McHardy zu Testzwecken die Daten eines altbekannten Grippevirus in die SVM einspielte, antwortete die brav mit „sehr wahrscheinlich infektiös“.

„Wir wollen aber nicht nur herausfinden, ob sich eine neue Virenvariante in Zukunft durchsetzt und zum Grippeerreger der Saison wird“, sagt McHardy. „Wir wollen auch voraussagen können, wann das sein wird.“ Derzeit versuchen die Experten der WHO für etwa ein Jahr vorauszusehen, welcher neue Virenstamm dominieren und sich damit in der jeweils nächsten Grippesaison als Krankmacher über die Welt verbreiten wird. Heute liegen sie in einem von vier Fällen daneben: Dann setzt sich eine andere Virenvariante als erwartet durch, gegen die es dann oftmals keinen Impfstoff gibt.

McHardys Ziel ist es, diese Jahresvorhersage zuverlässiger zu machen. Auf der Nordhalbkugel tritt die Grippe vor allem in den Monaten November bis Februar auf, wenn es kalt und feucht ist. Auf der Südhalbkugel wiederum werden die Menschen im südlichen Winter krank – zwischen Mai und Oktober. Auch solche Daten fließen in die SVM und die anderen Lernverfahren ein, um die Viren verstehen zu können. Dass eine sichere Prognose dereinst möglich ist, daran zweifelt McHardy nicht. Immerhin wurde an ihrem Institut bereits das Software-Programm „Geno2Pheno“ entwickelt, mit dem Ärzte ermitteln können, wie schnell sich Resistenzen gegen Aids-Medikamente entwickeln (MaxPlanckForschung 3/2005, Seite 20 ff.).

Außerdem kann McHardy aus dem Vollen schöpfen, denn auf den Servern im Keller ruht die weltgrößte Viren-Gendatenbank GISAID. Seit wenigen Jahren speisen Forscher aus aller Welt Ergebnisse aus der Genanalyse von Influenza-Viren in die Datenbank ein. Andere Forscher dürfen kostenlos darauf zugreifen. „Es ist absolut sinnvoll, das Wissen über die Viren zu bündeln, um ihr Wesen gänzlich verstehen zu können“, sagt McHardy. „Die Viren sind kleine Lebensformen mit einem recht überschaubaren Genom, da bietet es sich an, direkt in ihnen nach den Ursachen der Grippe zu forschen.“

Viren sind das eine. McHardys zweites Steckenpferd ist das Erbgut von Bakterien, das sie ebenfalls mit Support-Vektor-Maschinen und verwandten Lernverfahren enträtseln will. Die Forscherin hat sich darauf spezialisiert, Ordnung in Metagenome zu bringen – in mikrobiellen Gensequenzsalat. Ein solches Metagenom enthält nicht die Erbsubstanz eines einzigen Individuums, sondern von vielen Millionen Organismen. Doch wozu das Durcheinander studieren?

Suche nach Supereiweißen

Bekannt ist, dass gerade extreme Lebensräume wie etwa heiße Quellen besondere Lebensformen hervorbringen – Bakterien etwa, die sogar in 120 Grad Celsius heißem Wasser gedeihen. Wissenschaftler und die Industrie versprechen sich davon neue Substanzen wie hitzebeständige Eiweiße. Die könnte man beispielsweise für Herstellung von Kosmetika oder Nahrungsmitteln verwenden, für Produktionsprozesse, die bei hohen Temperaturen ablaufen. Wissenschaftler suchen deshalb am Land und im Meer nach neuen außergewöhnlichen Mikroben.

Der einfachste Weg wäre es, die Einzeller im Labor zu züchten und auf Herz und Nieren nach neuen Substanzen zu durchsuchen. Doch viele Bakterien gedeihen im Reagenzglas nicht. Forscher packen deshalb seit geraumer Zeit richtig zu, sammeln schaufelweise Bodenproben ein und analysieren gleich das gesamte Erbgut aller Bewohner. Die Hoffnung: Möglicherweise findet man dabei vielversprechende Genabschnitte, die die Information für neue Superei­weiße enthalten.

Das Problem: Meist liefert die Metagenom-Analyse Tausende winziger Erbgutfragmente, von denen sich nur wenige einem Organismus zuordnen lassen. Hier kommen McHardys Verfahren zum Einsatz, die die Forscherin zunächst mit Erbgutfragmenten bekannter Bakteriengruppen gefüttert hat. Die Support-Vektor-Maschine wurde dabei vor allem auf ein Merkmal im Bakteriengenom trainiert: kurze, wiederkehrende Abfolgen von Basen – sogenannte Oligomere, wie etwa die Basenfolge ACTGAT. Faszinierenderweise sind bestimmte Oligomere charakteristisch für die Genome verschiedener Bakteriengruppen, ganz wie ein Fingerabdruck.

Diese Oligomere kommen nicht nur an einer, sondern zugleich an vielen verschiedenen Stellen des Erbgutstrangs DNA vor. Oligomere eignen sich deshalb hervorragend, um das Metagenom-Puzzle zu ordnen. Nachdem die Support-Vektor-Maschine gelernt hatte, welche Oligomere mit welcher Wahrscheinlichkeit zu bestimmten Bakteriengruppen gehören, speiste McHardy unbekannte Metagenomsequenzen ein – etwa solche aus mikrobenreichem Klärschlamm. Wieder schwebten die Daten im weiten Zahlenraum den erlernten Zahlenwerten entgegen. Das Experiment gelang: „Dank der charakteristischen Oligomere konnte das Programm viele der kurzen Metagenomsequenzen bestimmten Bakterien zuordnen.“

Verdauung ohne Methan-Ausstoß

Binning heißt das Verfahren – „Eintonnen“: Schnipsel für Schnipsel wird der richtigen Bakteriengruppe zugeordnet – der jeweiligen „Tonne“ also. In manchen Fällen können die statistischen Lernverfahren bis zu 90 Prozent der Erbgutschnipsel anhand der Oligomere richtig zuordnen. Letztlich hängt es vor allem von der Menge und Qualität der Trainingsdaten ab, wie gut die Statistik arbeitet. Gelegentlich haben die Saarbrücker daher Werte von nur 30 bis 40 Prozent erreicht.

Zu den wohl verblüffendsten Metagenom-Untersuchungen, bei denen Alice Carolyn McHardy mitgeholfen hat, gehört die Analyse von Bakteriengemeinschaften aus dem Darm von Termiten und aus dem Verdauungstrakt des australischen Wallabys, eines Buschkängurus. Beide Tierarten verdauen Holz und setzen dabei Wasserstoff frei, jenes Molekül, das die Menschheit künftig im großen Stil in Brennstoffzellen nutzen will.

Was die Verdauungsarbeit der Insekten und Säuger auszeichnet, ist, dass bei der Wasserstoffproduktion anders als beim Kuhmagen fast kein klimaschädliches Methangas frei wird. Gelänge es, das Verfahren im Labor nachzuahmen, ließe sich damit möglicherweise eine ganz neue Art der umweltfreundlichen Wasserstoffproduktion entwickeln.

Die Analyse-Ergebnisse sind vielversprechend. McHardys SVM konnte die entscheidenden Metagenomschnipsel verschiedenen Mikroorganismen zuordnen. Damit ist jetzt bekannt, welche Bakterien im Tierdarm das Wunder der klimaneutralen Wasserstofferzeugung vollbringen – und auch, welche Eiweiße und Stoffwechselprozesse zum Wasserstoff führen. „Jetzt wird daran gearbeitet, aus den Proben gezielt die beteiligten Mikroorganismen herauszufischen und weiter zu untersuchen“, sagt McHardy.

Noch steht die Metagenom-Analyse am Anfang. Viele Lebensräume wurden bislang nur holzschnittartig untersucht. „Und natürlich benötigen wir stets ein wenig Vorwissen, um unsere Verfahren anzulernen“, sagt die Max-Planck-Forscherin. „Der Vorteil der SVM besteht aber darin, dass sie nur kleine Datenmengen für das Training benötigt.“ Und was sich damit bereits erreichen lässt, hat McHardy gezeigt. Die Suche nach den Geheimnissen des Erbguts geht weiter. Mit der Suche in extremen Lebensräumen wie der Arktis, wo Bakterien bei Minusgraden gedeihen, wird die Metagenomik zunehmend interessant. Und dank der Bioinformatik dürfte sich in naher Zukunft zur Wallaby-Darmflora noch manch andere skurrile Neuentdeckung hinzugesellen.

GLOSSAR

Pandemie
Unter Pandemie versteht man eine Krankheit – meist eine Infektion –, die sich in vergleichsweise kurzer Zeit über Länder und Kontinente ausbreitet.

Reassortment
Auch Reassortierung genannt, ist die Vermischung oder Neuverteilung gene­tischer Information zwischen zwei ähn­lichen Viren. Dazu müssen sich die beiden Virustypen in derselben infizierten Zelle vermehren und muss ihr Genom aus mehreren Segmenten bestehen.

Metagenom
Als Metagenom bezeichnet man das gesamte genetische Repertoire eines Lebensraums – eines Felsens im Hoch­gebirge etwa oder des Rands einer heißen Quelle.

Neuraminidasen
Enzyme, die in der Membran vieler Viren fest verankert sind. Sie fungieren gleichsam als „Türöffner“, indem sie die Zellmembran aufschließen, sodass die frischen Viren heraus­strömen und sich verbreiten können.

Weitere interessante Beiträge

Zur Redakteursansicht