Forschungsbericht 2015 - Max-Planck-Institut für Pflanzenzüchtungsforschung

Neue Algorithmen enthüllen den Einfluss der Gene auf den Phänotyp

Autoren
Willing, Eva-Maria; Schneeberger, Korbinian
Abteilungen

Entwicklungsbiologie der Pflanzen, Gruppe Genome Plasticity and Computational Genetics

Zusammenfassung
Genetische Veränderungen können direkten Einfluss auf den Phänotyp eines Organismus haben. Solche Unterschiede können helfen, den ihnen zugrunde liegenden Genen eine Funktion zuzuweisen. Sie lassen sich in künstlich mutierten Organismen, aber auch zwischen unterschiedlichen Individuen einer Art oder zwischen verschiedenen Arten finden. Um solche Veränderungen aufzuspüren und um sie von genetischen Unterschieden, die sich nicht auf den Phänotyp auswirken, zu unterscheiden, wird in der Forschergruppe eine neue Art von Algorithmen entwickelt.

Vom Phänotyp zum Genotyp

Das Genom, also alle vererbbare Information jedes Organismus, ist in den Molekül-Sequenzen der einzelnen Chromosomen gespeichert. Diese Chromosomen werden an die nächste Generation weitergegeben, woraus folgt, dass individuelle Merkmale, sogenannte Phänotypen wie zum Beispiel eine bestimmte Größe oder Pigmentierung, in der nächsten Generation wieder auftreten können.

Nicht nur die Grundlagenforschung, sondern auch angewandte Wissenschaften wie die Pflanzenzüchtungforschung, haben großes Interesse daran herauszufinden, welche spezifischen Abschnitte der Chromosomen Einfluss auf den Phänotyp eines Organismus haben. Dieses Wissen macht es möglich, Pflanzen mit vorteilhaften Eigenschaften durch gezielte Kreuzungen zu züchten oder auch vorteilhafte Eigenschaften in die Genome zu implementieren. Eine der weitverbreitetsten Methoden, um die Funktionen von einzelnen Genen zu bestimmen, ist der Vergleich von unterschiedlichen Versionen, sogenannten Allelen ein und desselben Gens, und wie sie sich auf ein bestimmtes Merkmal auswirken.

In der Pflanzengenetik gibt es verschiedene Wege, um unterschiedliche Allele von Genen zu identifizieren. Alle diese Methoden setzen aber voraus, dass die Genomsequenz der betreffenden Pflanzen zumindest partiell bekannt sein muss. In den letzten Jahren hat sich die Hochdurchsatz-Genomsequenzierung (next generation sequencing), mit der man ganze Genome auf einmal analysieren kann, derart weiterentwickelt, dass sie ein integraler Bestandteil der Genetik geworden und in den meisten Genomstudien nicht mehr wegzudenken ist [1]. Allerdings ist die Stärke dieser neuen Technologie auch gleichzeitig ihre Schwäche. Sie produziert in kürzester Zeit eine riesige Menge an sehr kurzen, fehlerbehafteten DNA-Sequenzen, die nicht automatisch eine Zuordnung der betreffenden Gensequenz innerhalb eines gegebenen Genoms erlauben. Um aus solchen Rohdaten die genauen Sequenzen von Genen oder ganzen Genomen abzuleiten, werden neue Algorithmen benötigt.

Künstlich induzierte Allele

Um die DNA - und damit auch den Phänotyp - einer bestimmten Pflanze zu verändern, werden beispielsweise mutagene Chemikalien oder Radioaktivität eingesetzt. Wenn dann in der nächsten Generation interessante Veränderungen im Phänotyp, wie zum Beispiel ein anderer Blühzeitpunkt, eine andere Pigmentierung oder ein verändertes Größenwachstum beobachtet werden, unterliegen diese Veränderungen den experimentell induzierten Mutationen in genau denjenigen Genen, die für den ursprünglichen, normalen Phänotyp notwendig waren und die damit erfasst und charakterisiert werden können (Abb. 1). Dieses Konzept wird schon seit vielen Jahrzehnten erfolgreich in der Pflanzenforschung angewendet, allerdings war die Suche nach den zugrundliegenden Mutationen stets aufwändig [2].

original
Original 1508157599
Abb. 1: Vergleich der Blüte einer wilden Alpen-Gänsekresse (Arabis alpina) mit der Blüte einer ihrer Nachkommen, nachdem die Samen mit DNA-verändernden Substanzen behandelt wurden. Die genetische Mutation, also die DNA Sequenzveränderung, die für die Fehlentwicklung der Blüte verantwortlich ist, ist durch einen Vergleich mit dem Wildtyp-Genom sichtbar gemacht: Austausch der DNA Nukleobase Cytosin mit Thymin (rot).
Abb. 1: Vergleich der Blüte einer wilden Alpen-Gänsekresse (Arabis alpina) mit der Blüte einer ihrer Nachkommen, nachdem die Samen mit DNA-verändernden Substanzen behandelt wurden. Die genetische Mutation, also die DNA Sequenzveränderung, die für die Fehlentwicklung der Blüte verantwortlich ist, ist durch einen Vergleich mit dem Wildtyp-Genom sichtbar gemacht: Austausch der DNA Nukleobase Cytosin mit Thymin (rot).

Hochdurchsatzgenomsequenzierung hat die Suche nach den kausalen Mutationen drastisch beschleunigt. In Zusammenarbeit mit Detlef Weigel, Max-Planck-Institut für Entwicklungsbiologie, Tübingen, wurde ein neuer Computer-Algorithmus entwickelt, der in den Sequenzdaten kompletter Genome induzierte Veränderungen findet und vor allem die kausale Mutation von Hintergrundmutationen, also solchen, die zwar das Genom verändert haben, aber alleine zu keiner sichtbaren Veränderung führen, unterscheiden kann.

Diese Methode hat die Suche nach kausalen Mutationen revolutioniert, jedoch war deren Anwendung lediglich auf die wenigen Arten mit bereits ermittelter Genomsequenz beschränkt. In der vor ein paar Jahren etablierten Arbeitsgruppe am Kölner Max-Planck-Institut wurden die bekannten Algorithmen nunmehr weiterentwickelt und können auch auf Organismen mit gänzlich unbekannten und insbesondere komplexen Genomen, wie sie die meisten unserer Kulturpflanzen besitzen, angewendet werden [3, 4].

Jedes Individuum hat ein einzigartiges Genom

Im Gegensatz zu künstlich induzierten Veränderungen sind die natürlichen Unterschiede in den Genomen von zwei Individuen einer Art um ein Vielfaches höher und führen dementsprechend auch zu phänotypischen Unterschieden. Letztendlich ist dies der Grund dafür, warum kein Individuum dem anderen gleicht.

Da mittels der neuen Hochdurchsatzsequenzierungen nahezu alle Genomunterschiede nunmehr auch zwischen Individuen feststellbar sind, ist es naheliegend, die genetischen Unterschiede einzelner Individuen mit deren phänotypischen Unterschieden zu korrelieren, um so die relevanten Allele auffinden zu können. Obwohl ein solches Vorgehen schon vielversprechende Ergebnisse geliefert hat, leiden die herkömmlichen Methoden an den normalerweise unbekannten Verwandtschaftsgraden zwischen den zu untersuchenden Individuen, was zu falschen Assoziationen führen kann. Neue Algorithmen, die dieses Problem der Populationsstruktur lösen können, sind Gegenstand aktueller Forschung.

Zusätzlich zu den verbesserten technischen Analysemöglichkeiten hat sich in den letzten Jahren eine zweite, nicht computerbasierte Strategie entwickelt, um das oben genannte Problem zu lösen. Anstelle bestehender Pflanzenlinien werden künstliche Populationen erzeugt, indem man eine kleine Anzahl von Pflanzen gezielt miteinander kreuzt. Die daraus hervorgehenden zahlreichen Nachkommen solcher zum Teil sehr komplexen Kreuzungen haben klar definierte Verwandtschaftsgrade. Darüber hinaus können Individuen gekreuzt werden, die sich in der Natur nie miteinander fortpflanzen würden und so in ihren Nachkommen Allelkombinationen ergeben, die es so nie gegeben hätte. Dieses Kombinieren von sehr unterschiedlichen Allelen erlaubt es dann, nicht nur den Effekt von einzelnen Allelen, sondern auch die Effekte von Allelkombinationen - der sogenannten Epistase - zu untersuchen. Aber auch hier ist die Algorithmusentwicklung erst am Anfang.

Genetische Vielfalt zwischen Arten

Die Komplexität von genomischen Unterschieden zwischen verschiedenen Arten ist nochmal um ein Vielfaches höher als die zwischen den Individuen einer Art. Bis heute ist es nicht möglich, die vielfältigen phänotypischen Unterschiede zwischen Arten mit Unterschieden in ihren Genomen direkt zu korrelieren – einfach, weil es zu viele davon gibt. Nicht nur, dass die Genomsequenzen unterschiedlich sind, auch die Anordnung in Chromosomen ist unterschiedlich, genauso wie auch die Häufigkeit einzelner Gene stark variieren kann.

original
Original 1508157599

Abb. 2: Die zwei nahverwandten Kreuzblütlerarten Arabis alpina und Arabidopsis thaliana haben Genome, die eine Ähnlichkeit von über 90% zeigen. DNA-Methylierungen, die unter anderem vor genomischen Veränderungen durch DNA viralen Ursprungs schützen können, sind aber erstaunlicherweise sehr unterschiedlich. In A. thaliana sind die Methylierungen symmetrisch angeordnet, während sie in A. alpina wesentlich weniger vorkommen.

Abb. 2: Die zwei nahverwandten Kreuzblütlerarten Arabis alpina und Arabidopsis thaliana haben Genome, die eine Ähnlichkeit von über 90% zeigen. DNA-Methylierungen, die unter anderem vor genomischen Veränderungen durch DNA viralen Ursprungs schützen können, sind aber erstaunlicherweise sehr unterschiedlich. In A. thaliana sind die Methylierungen symmetrisch angeordnet, während sie in A. alpina wesentlich weniger vorkommen.

Obwohl DNA Komplettsequenzierungen schon seit einigen Jahren etabliert sind, sind bisher nur primär wirtschaftlich relevante Kulturpflanzen oder Modellorganismen analysiert worden. Die Gruppe um Korbinian Schneeberger will nun in den kommenden Jahren einen Genom-Atlas anlegen, der bis zu hundert engverwandte Pflanzenarten umfasst, unabhängig von deren Verbreitung oder landwirtschaftlicher Nutzung. Diese Daten werden nicht nur die Grundlage für eine Vielzahl an unterschiedlichen Allelen bilden, sondern auch die evolutionären Zusammenhänge dieser Genome erklären. Obwohl sich diese Pflanzenarten in evolutionären Zeiträumen erst vor sehr kurzem auseinander entwickelt haben, sind ihre phänotypischen Unterschiede extrem. Manche Pflanzen blühen nur einmal, andere sind mehrjährig und blühen somit mehrmals in den aufeinander folgenden Jahren. Einige der Arten können sich selbst bestäuben, andere brauchen dafür fremden Pollen. Das interessante an all diesen Phänotypen ist, dass sie sich wiederholt und zu verschiedenen Zeiten unabhängig voneinander entwickelt haben.

Aktuelle Untersuchungen haben gezeigt, dass sich die Pflanzen nicht nur in sichtbaren Phänotypen unterscheiden, sondern dass auch basale Funktionen wie die Genommethylierung – ein Mechanismus, der unter anderem ein Genom gegen DNA viralen Ursprungs verteidigen kann – Unterschiede aufweist (Abb. 2; [5]).

Weiterhin konnte gezeigt werden, dass wesentlich mehr DNA viralen Ursprungs im Genom von A. alpina zu finden ist - der Beweis eines kausalen Zusammenhangs zu den DNA Methylierungsmustern steht aber noch aus.

Literaturhinweise

1.
Metzker, M. L.
Sequencing technologies - the next generation
Nature Reviews Genetics 11, 31-46 (2010)
2.
Schneeberger, K.
Using next-generation sequencing to isolate mutant genes from forward genetic screens
Nature Reviews Genetics 15, 662-676 (2014)
3.
Nordström, K. J.; Albani, M. C.; James, G. V.; Gutjahr, C.; Hartwig, B.; Turck, F.; Paszkowski, U.; Coupland, G.; Schneeberger, K.
Mutation identification by direct comparison of whole-genome sequencing data from mutant and wild-type individuals using k-mers
Nature Biotechnology 31, 325-330 (2013)
4.
Hartwig, B.; James, G. V.; Konrad, K.; Schneeberger, K.; Turck, F.
Fast isogenic mapping-by-sequencing of ethyl methanesulfonate-induced mutant bulks
Plant Physiology 160, 591-600 (2012)
5.
Willing, E. M.; Rawat, V.; Mandáková, T.; Maumus, F.; James, G. V.; Nordström, K.; Becker, C.; Warthmann, N.; Chica, C.; Szarzynska, B.; Zytnicki, M.; Albani, M. C.; Kiefer, C.; Bergonzi, S.; Castaings, L.; Mateos, J. L.; Berns, M. C.; Bujdoso, N.; Piofczyk, T.; de Lorenzo, L.; Barrero-Sicilia, C.; Mateos, I.; Piednoël, M.; Hagmann, J.; Chen-Min-Tao, R.; Iglesias-Fernández, R.; Schuster, S. C.; Alonso-Blanco, C.; Roudier, F.; Carbonero, P.; Paz-Ares, J.; Davis, S. J.; Pecinka, A.; Quesneville, H.; Colot, V.; Lysak, M. A.; Weigel, D.; Coupland, G.; Schneeberger, K.
Genome expansion of Arabis alpina linked with retrotransposition and reduced symmetric DNA methylation
Nature Plants 1: 14023 (2015)
Zur Redakteursansicht