Forschungsbericht 2015 - Max-Planck-Institut für molekulare Pflanzenphysiologie

Modellierung und Vorhersagen durch Integration genomischer und metabolomischer Hochdurchsatzdaten

Autoren
Kleeßen, Sabrina; Robaina-Estevez, Semidan; Nikoloski, Zoran
Abteilungen
Molekulare Physiologie; Forschungsgruppe Systembiologie und Mathematische Modellierung
Zusammenfassung
Unter Einbeziehung umfassender genetischer Kenntnisse und biochemischem Wissen werden oftmals wesentliche Parameter eines Problems durch mathematische Formeln beschrieben, mit deren Hilfe wiederum Modelle erzeugt werden können. Nach Überprüfung ihrer Relevanz können die Modelle dazu genutzt werden, Voraussagen zu treffen. Dank der Gewinnung von Daten aus Hochdurchsatztechnologien und Inhaltsstoffbestimmungen können so neuartige Methoden entwickelt werden, die eine Charakterisierung der Aktivitätsmuster von Stoffwechselwegen ermöglichen, um beispielsweise das Zellwachstum besser zu verstehen.

Metabolische Netzwerke – systemorientierte Sicht auf den Metabolismus

Der Stoffwechsel eines Organismus ist ein komplexes Netzwerk und umfasst die Gesamtheit aller biochemischen Reaktionen. In Abhängigkeit von Genen und deren Ausprägung und Aktivität sind Enzyme verfügbar. Durch enzymkatalysierte Reaktionen werden Substrate in Zwischenprodukte und Produkte bestimmter Stoffwechselwege umgewandelt, die wiederum verschiedene Funktionen erfüllen und selbst wieder auf Gene und deren Ausprägung zurückwirken können.

Während sich in der Vergangenheit Stoffwechseluntersuchungen auf einzelne Stoffwechselwege - und darin nur auf eine Handvoll an Reaktionen und Produkte - bezog, kann inzwischen dank verbesserter Charakterisierung sequenzierter Genome die klassische stoffwechselbasierte Betrachtungsweise hin zu einer netzwerkbasierten Analyse verschoben werden. Unter Einbeziehung aller stoffwechselrelevanten DNA-Abschnitte konnten genomweite Stoffwechselmodelle (GEMs) erstellt werden, die eine systemorientierte Sicht des Metabolismus ermöglichen [1]. Durch die Erstellung von GEMs können umfassendes genetisches Wissen und biochemische Mechanismen in Form einer stöchiometrischen Matrix aufgestellt werden. Eine stöchiometrische Matrix, S, beschreibt mathematisch Substrate und Produkte jeder biochemischen Reaktion in dem jeweils zu untersuchendem Netzwerk (Abb. 1). Die Eigenschaften dieser Matrix tragen weitreichend dazu bei, den Metabolismus zu untersuchen und Entwicklungsvorhersagen zu treffen, die mit experimentellen Daten verglichen werden können. Die Arbeitsgruppe Systembiologie und Mathematische Modellierung nutzt GEMs, um die Aktivität pflanzlicher Stoffwechselwege zu analysieren.

original
Abb. 1: Biochemisches Reaktionsnetzwerk. (A) Fünf biochemische Reaktionen, an denen vier interne Metabolite (X1, X2, X3 und X4) und drei externe Metabolite (Xo1, Xo2 und Xb) beteiligt sind. (B) Graphische Darstellung des biochemischen Reaktionsnetzwerks aus (A), in dem interne Metabolite in grün und externe Metabolite in grau gekennzeichnet sind. (C) Stöchiometrische Matrix für die biochemischen Reaktionen aus (A). Substrate einer Reaktion haben negative und Produkte positive Koeffizienten. In dem Reaktionsnetzwerk wird X1 und X4 importiert, X2, X3 und X4 exportiert und es wird zudem angenommen, dass X3  und X4 zur Produktion der Biomasse Xb beitragen, wobei X2 ein Nebenprodukt des Netzwerks ist.

Der metabolische Zustand eines biologischen Systems (zum Beispiel Organellen, Zellen, Gewebe, Organe oder Organismus) kann durch seine Inhaltsstoffe (Metabolom) und deren momentaner Konzentration (Poolgröße) sowie ihrer Umsatzraten (Flüsse) charakterisiert werden. Während das Metabolom die Menge aller Stoffwechselprodukte in einem System zusammen mit ihren Poolgrößen beschreibt, entsprechen die Flüsse derjenigen Rate, mit der Metabolite ineinander umgewandelt werden. Mathematisch ist die zeitliche Änderung der Konzentration von n Metaboliten, x=[x1,...,xn], durch die Summe der Beiträge der ein- und ausgehenden Flüsse, v=[v1,...,vr], beschrieben:

dx/dt=Sv(x,k).

Dies ergibt ein System von gewöhnlichen Differentialgleichungen, die numerisch gelöst werden können, wenn die Parameter k und die Art, wie Metabolite zu einem Reaktionsfluss führen, und somit die mathematische Funktion v(x,k), bekannt ist. Mit der Annahme, dass sich das System in einem stationären Zustand befindet, bei dem die Metabolite ihre Konzentration im Laufe der Zeit nicht verändern (dx/dt=0), kann man das vereinfachte Gleichungssystem Sv=0 lösen, welches linear in Bezug auf die Flüsse ist. Auf diese Weise kann man die stationären Reaktionsflüsse charakterisieren. Da jedoch in der Regel die Anzahl der Reaktionen größer ist als die Anzahl von Stoffwechselprodukten, kann das System Sv=0 unendlich viele Lösung haben.

Eine Integration von Hochdurchsatzdaten und großen metabolischen Modellen in Flussphänotypen offenbart Aktivitätsmuster

Da ein Reaktionsfluss nicht nur von der metabolischen Poolgröße, sondern auch von der Menge der verfügbaren Enzyme abhängt, die die Reaktion katalysieren, welche wiederum abhängig von der Menge der Transkripte ist, muss berücksichtigt werden, experimentelle Daten von verschiedenen Ebenen des zu untersuchenden biologischen Systems zu verwenden. Es können zum Beispiel Transkript- oder Proteinmengen eingesetzt werden, um so genauere Vorhersagen von metabolischen Flusszuständen zu erhalten [2]. Darüber hinaus wird die Feststellung, dass einige biologische Systeme sich zwecks Optimierung von Biomasseproduktion oder Energieverbrauch entwickelt haben, zur weiteren Eingrenzung der Menge an biochemisch sinnvollen stationären Flussverteilungen in Betracht gezogen [3]. Zusammenfassend führen diese Annahmen und Beobachtungen zu einem Optimierungsproblem - einem linearen mathematischen Programm, dargestellt in Abbildung 2.

original
Abb. 2: Lineare Programmierung und biochemische Netzwerke. (A) Stöchiometrische Matrix für die biochemischen Reaktionen aus Abbildung 1. (B) Bedingungen des stationären Zustands, wobei die Summe der ein- und ausgehenden Flüsse für jeden Metaboliten Null ist. (C) Lineares Programm, in dem der Fluss R3 unter der Bedingung eines stationären Zustands sowie unterer und oberer Grenzen für die Flüsse durch Reaktion R1 und R5 maximiert wird. Die Flussgrenzen können von experimentellen Daten abgeleitet werden. (D) Graphische Darstellung des linearen Programms aus (C). Die Flussgrenzen für R1 und R5 sind in blau beziehungsweise rot dargestellt. Die Flussverteilung, die den Fluss durch R3 maximiert, ist mit „x“ markiert.

In einem systembiologischen Ansatz werden Organismen in der Regel derart analysiert, indem ihre Umwelt gestört wird und die dabei auftretenden Veränderungen auf verschiedenen Zellebenen untersucht werden. GEMs sind daher wichtig, um die gesammelten Datensätze in Zusammenhang mit den zugrunde liegenden Netzwerken zu bringen. Des Weiteren können sie genauere Vorhersagen über die Aktivität der Reaktionen treffen, da Flüsse letzten Endes integrierte Ergebnisse von Genregulation, Signalübertragung und metabolischen Umwandlungen darstellen. Die Forschungsgruppe hat diesen Ansatz verwendet, um die optimale Aktivität von Stoffwechselwegen in der Modellpflanze Arabidopsis thaliana, für die hochwertige GEMs verfügbar sind, anhand von Transkriptomdaten aus Versuchen, in denen Licht und Temperatur verändert wurden, zu bestimmen [4].

Nicht alle Komponenten eines biologischen Systems verändern allerdings ihren Zustand direkt nach einer Störung, sondern die Änderung erfolgt allmählich im Zuge eines Anpassungsprozesses, was die Gültigkeit der Annahme eines stationären Zustands in Frage stellt. Eine Möglichkeit, das Problem der Charakterisierung der Reaktionsaktivitäten in einem solchen Szenario zu bewältigen, ist, ihr Verhältnis zur metabolischen Poolgröße zu verwenden [5, 6]. Die Wissenschaftler haben dazu eine computerbasierende Methode entwickelt, die in die Änderungen der metabolischen Poolgrößen auch die Menge an Gentranskripten integriert, um Grenzen für die zeitliche Veränderung von Reaktionsflüssen zu setzen [7]. Diese bedingungsbasierte Alternative hat den Weg für die Bestimmung von zeitlich aufgelösten Aktivitäten von Stoffwechselwegen geebnet, die weiterhin durch lineare mathematische Programme zu lösen sind und damit auch auf große Netzwerke angewendet werden kann. Aus diesem Grund erweitert die Methode auch den vereinfachten Ansatz, der bei der Rekonstruktion von GEMs und dem Erhalt von stationären Flussverteilungen lediglich die Anwesenheit/Abwesenheit von Metaboliten berücksichtig [8].

Dieser neuartige Ansatz wurde in Experimenten mit der Modellalge Chlamydomonas reinhardtii verwendet, die mit Rapamycin behandelt wurde, einer Verbindung, die das Wachstum verändert. In der Folge wurden 45 Metabolite und 982 Transkripte in ein GEM integriert, das aus 2.143 Reaktionen besteht, die 1.068 Metaboliten ineinander umwandeln. Es zeigte sich, dass dieser Ansatz erfolgreich verwendet werden kann, um Stoffwechselwege auf der Basis ihrer Reaktion auf Veränderungen – hier Behandlung mit Rapamycin - einschätzen zu können. So hatte sich in diesem Experiment gezeigt, dass der metabolische Syntheseweg von Cystein und Methionin direkt an der Reaktion des Systems auf die Rapamycin Behandlung beteiligt ist [7].

Potenzial bedingungsbasierter Methoden in der Pflanzenforschung

Ein allgemeingültiges metabolisches Netzwerk, das alle bekannten biochemischen Reaktionen eines Organismus berücksichtigt, entspricht möglicherweise nicht der Realität. Es gibt nämlich Anzeichen dafür, dass Zellen ihren Stoffwechsel an die sich jeweils ergebenden Bedingungen anpassen, wie zum Beispiel Umweltveränderungen, Entwicklungsstadium oder, bei mehrzelligen Organismen, den Zelltyp. Typischerweise ist meist nur ein Teil aller möglichen Reaktionen in diesen verschiedenen Kontexten aktiv. Die Veränderung hin zur Rekonstruktion von kontextspezifischen Modellen des Metabolismus ist daher notwendig geworden, um genauere und biologisch sinnvolle Erkenntnisse zu erhalten [9]. Dies ist von besonderer Bedeutung, wenn man sich mit der Physiologie der Pflanzen auseinandersetzt, und zwar nicht nur zum besseren Verständnis ihres gewebe- oder zellspezifischen Metabolismus, sondern um in erster Linie das metabolische Netzwerk des gesamten pflanzlichen Organismus nachzuvollziehen, in welchem mehrere spezialisierte Modelle miteinander verwoben sind [10].

Darüber hinaus sind die Wissenschaftler der Forschungsgruppe an der Entwicklung von Methoden beteiligt, die anstelle der Integration absoluter Metabolitmengen - eine solche Integration wird beispielsweise bei kinetischer Modellierung vorgenommen -, leichter zu erhaltende, relative Mengen berücksichtigen, die in der Regel in Metabolomik-Studien von Pflanzen- und Tierarten bei der Analyse von Aktivitätsmustern der Reaktionen und ihrer natürlichen Variation gemessen werden. Dank dieser Herangehensweise, in Verbindung mit modernsten computerbasierten Methoden, wird es immer mehr wahrscheinlich, schon bald das Stoffwechselgeschehen eines komplexen Organismus, ob Pflanze, Tier oder Mensch, punktuell und als Ganzes in seinem Lebensgefüge zu verstehen.

Literaturhinweise

1.
Monk, J.; Nogales, J.; Palsson, B. O.
Optimizing genome-scale network reconstructions
Nature Biotechnology 32, 447–452 (2014)
2.
Machado, D.; Herrgård, M.
Systematic evaluation of methods for integration of transcriptomic data into constraint-based models of metabolism
PLoS Computational Biology 10: e1003580 (2014)
3.
Monk, J. M.; Charusanti, P.; Aziz, R. K.; Lerman, J. A.; Premyodhin, N.; Orth, J. D.; Feist, A. M.; Palsson, B. O.
Genome-scale metabolic reconstructions of multiple Escherichia coli strains highlight strain-specific adaptations to nutritional environments
Proceedings of the National Academy of Sciences USA 110, 20338–20343 (2013)
4.
Töpfer, N.; Caldana, C.; Grimbs, S.; Willmitzer, L.; Fernie, A. R.; Nikoloski, Z.
Integration of genome-scale modeling and transcript profiling reveals metabolic pathways underlying light and temperature acclimation in Arabidopsis
The Plant Cell 25, 1197–1211 (2013)
5.
Töpfer, N.; Kleessen, S.; Nikoloski, Z.
Integration of metabolomics data profiles into metabolic networks
Frontiers in Plant Science 6: 49 (2015)
6.
Kleessen, S.; Nikoloski, Z.
Dynamic regulatory on/off minimization for biological systems under internal temporal perturbations
BMC Systems Biology 6: 16 (2012)
7.
Kleessen, S.; Irgang, S.; Klie, S.; Giavalisco, P.; Nikoloski, Z.
Integration of transcriptomics and metabolomics data specifies the metabolic response of Chlamydomonas to rapamycin treatment
The Plant Journal 81, 822-835 (2015)
8.
Schmidt, B. J.; Ebrahim, A.; Metz, T. O.; Adkins, J. N.; Palsson, B. Ø.; Hyduke, D. R.
GIM3E: condition-specific models of cellular metabolism developed from metabolomics and expression data
Bioinformatics, btt493 (2013)
9.
Robaina Estévez, S.; Nikoloski, Z.
Generalized framework for context-specific metabolic model extraction methods
Frontiers in Plant Science 5: 491 (2014)
10.
Gomes De Oliveira Dal’Molin, C.; Quek, L. E.; Saa, P. A.; Nielsen, L. K.
A multi-tissue genome-scale metabolic modelling framework for the analysis of whole plant systems
Frontiers in Plant Science 6: 4 (2015)
Zur Redakteursansicht