Ansprechpartner

Profile_image

Prof. Alice McHardy

Gruppenleiterin

Max-Planck-Institut für Informatik, Saarbrücken

Telefon: +49 681 9325-309
Fax: +49 681 9325-399

E-Mail: mchardy@­mpi-inf.mpg.de

Infektionsbiologie . Informatik . Medizin

Zuverlässigere Prognose des dominanten Virus

Hat das Verfahren mit den Datensätzen ausgiebig trainiert, geht es richtig los. McHardy füttert den Computer mit den genetischen Informationen eines Influenza-A-Virus, von dem noch niemand weiß, wie gefährlich es ist. Das Lernverfahren gleicht die neuen Daten mit dem bekannten Wissen ab, es ordnet die Information so, dass sich die aktuellen Eingabewerte möglichst stark den erlernten Mustern annähern.

standard Bild vergrößern
Mit Rechenkraft gegen Grippe: Die Wissenschaftler der Forschungsgruppe Computational Genomics and Epidemiology auf der Suche nach dem Auslöser künftiger Grippe-Epidemien. Unser Bild zeigt (hinten von links) Christina Tusche, Kaustubh Patil, Johannes Droege, sowie (unten von links) Lars Seinbrück, Alice McHardy und Sebastian Konietzny. [weniger]

Als Antwort liefert der Rechner dann einen Zahlenwert der Art: Wie stark ähnelt die neue Gensequenz den Strukturen eines erfolgreichen Virus? Wie wahrscheinlich ist es also, dass eine Krankheit ausbricht? McHardy arbeitet dabei vor allem mit „Support-Vektor-Maschinen“ (SVM). Die wandeln Information in Datenpunkte, in Zahlenwerte, die wie Sterne am Firmament in einem riesigen Zahlenraum hängen. Gibt man neue Daten in das System ein, ordnet die SVM die neuen Werte den schwebenden Zahlen zu – je näher sie einer antrainierten Zahl sind, desto mehr ähneln sich die Daten.

Noch können die Saarbrücker Forscher keine aktuellen Voraussagen für die neue Grippesaison liefern, noch werden die Programme optimiert. Doch immerhin: Als McHardy zu Testzwecken die Daten eines altbekannten Grippevirus in die SVM einspielte, antwortete die brav mit „sehr wahrscheinlich infektiös“.

„Wir wollen aber nicht nur herausfinden, ob sich eine neue Virenvariante in Zukunft durchsetzt und zum Grippeerreger der Saison wird“, sagt McHardy. „Wir wollen auch voraussagen können, wann das sein wird.“ Derzeit versuchen die Experten der WHO für etwa ein Jahr vorauszusehen, welcher neue Virenstamm dominieren und sich damit in der jeweils nächsten Grippesaison als Krankmacher über die Welt verbreiten wird. Heute liegen sie in einem von vier Fällen daneben: Dann setzt sich eine andere Virenvariante als erwartet durch, gegen die es dann oftmals keinen Impfstoff gibt.

McHardys Ziel ist es, diese Jahresvorhersage zuverlässiger zu machen. Auf der Nordhalbkugel tritt die Grippe vor allem in den Monaten November bis Februar auf, wenn es kalt und feucht ist. Auf der Südhalbkugel wiederum werden die Menschen im südlichen Winter krank – zwischen Mai und Oktober. Auch solche Daten fließen in die SVM und die anderen Lernverfahren ein, um die Viren verstehen zu können. Dass eine sichere Prognose dereinst möglich ist, daran zweifelt McHardy nicht. Immerhin wurde an ihrem Institut bereits das Software-Programm „Geno2Pheno“ entwickelt, mit dem Ärzte ermitteln können, wie schnell sich Resistenzen gegen Aids-Medikamente entwickeln (MaxPlanckForschung 3/2005, Seite 20 ff.).

Außerdem kann McHardy aus dem Vollen schöpfen, denn auf den Servern im Keller ruht die weltgrößte Viren-Gendatenbank GISAID. Seit wenigen Jahren speisen Forscher aus aller Welt Ergebnisse aus der Genanalyse von Influenza-Viren in die Datenbank ein. Andere Forscher dürfen kostenlos darauf zugreifen. „Es ist absolut sinnvoll, das Wissen über die Viren zu bündeln, um ihr Wesen gänzlich verstehen zu können“, sagt McHardy. „Die Viren sind kleine Lebensformen mit einem recht überschaubaren Genom, da bietet es sich an, direkt in ihnen nach den Ursachen der Grippe zu forschen.“

Viren sind das eine. McHardys zweites Steckenpferd ist das Erbgut von Bakterien, das sie ebenfalls mit Support-Vektor-Maschinen und verwandten Lernverfahren enträtseln will. Die Forscherin hat sich darauf spezialisiert, Ordnung in Metagenome zu bringen – in mikrobiellen Gensequenzsalat. Ein solches Metagenom enthält nicht die Erbsubstanz eines einzigen Individuums, sondern von vielen Millionen Organismen. Doch wozu das Durcheinander studieren?

 
loading content