Schweizer Taschenmesser für die Genomforschung
Bioinformatisches Multifunktionswerkzeug „CRUP“ verspricht schnellere Ergebnisse bei weniger Aufwand
„Die DNA ist in jeder Zelle praktisch gleich, also vergleichsweise langweilig“, sagt Martin Vingron, Direktor und Leiter der Abteilung Bioinformatik am Max-Planck-Institut für molekulare Genetik in Berlin. „Wenn man sich das Erbgut als das Kochbuch des Lebens vorstellt, dann sind doch die Notizen des Kochs am interessantesten.“ Diese „Notizen“ sind kleine chemische Markierungen an der DNA. Sie verändern nicht die genetische Information selbst, sondern beeinflussen, was mit der DNA an der jeweiligen Stelle geschieht – sie wirken also epigenetisch. Die Zelle kontrolliert mit diesen Hinweisen unter anderem Regionen im Erbgut, die für das An- und Abschalten von Genen verantwortlich sind, wie Promotoren und Enhancer.
Bei vielen komplexen Krankheiten arbeiten die epigenetischen Steuerungsprogramme nicht korrekt und sind deshalb für die Wissenschaft hochinteressant. Doch die Analyse dieser Regionen ist in der Laborpraxis umständlich, zeitraubend und kompliziert. Vingron und sein Team haben daher ein neues Programmpaket namens "Condition-specific Regulatory Units Prediction" (CRUP) entwickelt, das die Auswertung vereinfacht und gleich mehrere Probleme auf einen Schlag löst.
„Wir wollten die üblichen Arbeitsschritte bei der Analyse von Enhancer-Regionen in einem einfachen, universell verwendbaren Programm vereinen“, sagt die Bioinformatikerin Verena Heinrich. CRUP erleichtert verschiedene Aspekte der Analyse. Der Vorhersage-Algorithmus verwendet maschinelles Lernen und ist nicht auf bestimmte Zell- oder Gewebetypen beschränkt. Auch muss das Programm nicht vor jeder einzelnen Analyse auf den neuen Datensatz geeicht werden, kann eine hohe Anzahl von Datenreihen vergleichen und ist dabei trotzdem einfach zu bedienen. Heinrich entwickelte es zusammen mit der Doktorandin Anna Ramisch.
Die anregende Aktivität der Enhancer
CRUP identifiziert und charakterisiert gezielt DNA-Abschnitte im Genom, die das Ablesen von Genen anregen oder „verbessern“ (engl. enhance). Dafür locken diese Enhancer-Sequenzen Proteine zu Promotor-Regionen im Erbgut, die wie ein Schalter vor jedem Gen funktionieren. Welcher Enhancer wann welche Gene kontrolliert, ist aber häufig gar nicht bekannt. „Enhancer-Region und die zugehörigen Gene liegen räumlich manchmal recht weit voneinander entfernt“, sagt Heinrich. „Das erschwert uns die Zuordnung von Steuerelement zu Zielregion.“
Tatsächlich enthält die DNA hunderttausende Enhancer, von denen in unterschiedlichen Lebensphasen der Zelle (Wachstum, Erhaltung, Krankheit) jeweils andere aktiv sind. Im Ruhezustand ist das strangförmige Erbgut mit all den Enhancern auf Trägerproteine, die Histon-Proteine, aufgewickelt wie ein Wollfaden auf eine Spule. Erst chemische Veränderungen an den Histonen aktivieren die Enhancer. Dann lösen sich freiliegende Abschnitte aus den enggewickelten DNA-Knäueln, die mit weiteren Faktoren reagieren und so ein Gen aktivieren können. Eine Analyse der Trägerproteine durch das Verfahren der Chromatin-Immunpräzipitation (ChIP) und eine gekoppelte Erbgut-Sequenzierung verraten dann, welche Enhancer arbeiten und welche nicht.
Dreistufige Arbeitsweise des Programms
Mit diesen ChIP-Daten wird das CRUP-Tool gefüttert. Zunächst vergleicht es im ersten Schritt alle Sequenz-Abschnitte mit Hilfe von künstlicher Intelligenz und entscheidet dann, ob es sich dabei um einen Enhancer handelt. Der Algorithmus basiert zwar lediglich auf Informationen aus embryonalen Stammzellen von Mäusen, erkennt Enhancer-Regionen unabhängig von der Tierart oder Gewebe. Dies wiesen Heinrich und ihre Kolleginnen und Kollegen an Daten verschiedener Spezies und Zelltypen nach, die vom Deutschen Epigenom-Programm (DEEP) zur Verfügung gestellt wurden.
Im zweiten Schritt sucht CRUP innerhalb jeder Kategorie Veränderungen und Unterschiede zwischen den Datensätzen, wie sie etwa in Messreihen oder beim Vergleich verschiedener Gewebe anfallen. So treten epigenetische Veränderungen der Enhancer über einen gewissen Zeitraum zutage, oder auch Unterschiede zwischen gesundem oder erkranktem Gewebe. Im dritten und letzten Schritt der Analyse ordnet das CRUP-Programm die Gene ihren jeweiligen Enhancern zu. „Wir folgen der Frage: Was ist zur selben Zeit am selben Ort aktiv?“, sagt Heinrich. Der Algorithmus verknüpft die Enhancer-Analyse mit weiteren Daten, die verraten, welche Gene in der Zelle abgelesen werden. Außerdem prüft er, welche Teile des DNA-Strangs sich räumlich nah einander schmiegen.
Zuletzt testeten die Forscherinnen und Forscher ihr Programm in der Praxis. Sie analysierten das Gewebe von Mäusen mit der Immunkrankheit rheumatoide Arthritis und verglichen es mit Daten von gesunden Tieren. Dabei fanden sie mehr als 200 Unterschiede in Enhancer-Regionen, die zum Teil bereits andere Untersuchungen mit der Erkrankung in Verbindung gebracht hatten. Auch die Gene, die CRUP diesen Enhancern zuordnete, sind laut anderer Studien an der Krankheitsentwicklung beteiligt.
Arbeitserleichterung und Katalysator für die Forschung
„Unser Programm identifiziert sehr zuverlässig Kandidaten für krankheitsassoziierte Enhancer und verknüpft diese mit ihren Zielgenen“, sagt Vingron. Sein Team hoffe, mit dem neuen Werkzeug die Forschung auf dem Gebiet zu demokratisieren und zu beschleunigen, um den Ursachen von komplexen Erkrankungen beim Menschen auf die Spur zu kommen. „CRUP ist vor allem auch für all die Forschungsgruppen, die über keinen Stab an Bioinformatikern verfügen.“
blk