Forschungsbericht 2009 - Max-Planck-Institut für Biologie Tübingen

Mechanismen der Evolution als Matrize für Protein Engineering

Evolutionary mechanisms as a template for protein engineering

Autoren

Höcker, Birte

Abteilungen

Gruppe Höcker - Proteindesign (Dr. Birte Höcker)
MPI für Entwicklungsbiologie, Tübingen

Zusammenfassung

Die heute bestehende Diversität der Proteine ist durch viele Veränderungen entstanden: Gen-Duplikationen lieferten das Material für Mutation und Selektion, Rekombinationen trugen zur Schaffung ihrer Vielfältigkeit bei. Basierend auf diesen evolutionären Mechanismen wurden Engineering-Experimente durchgeführt. Die Fülle verfügbarer Sequenz- und Struktur-Daten ermöglicht es, Aussagen über wichtige molekulare Faktoren in Struktur-Funktionsbeziehungen zu machen. Mittels Computer gestütztem Design können diese Kenntnisse genutzt werden, um Proteine mit neuen, gewünschten Eigenschaften zu erzeugen.

Summary

The diversity of today’s universe of proteins has developed via a multitude of small changes. Gene duplication provides the material for mutation and selection, while recombination contributes to the creation of diversity. These mechanisms are the basis for many successful protein engineering experiments. The amount of available sequence and structural data enables general assumptions about important factors in structure-function relationships. These findings are used in rational and computational design to build proteins with desired new properties.

Einleitung

Proteine besitzen ein enormes Potenzial, komplexe molekulare Prozesse mit hoher Effizienz und Präzision auszuführen. Wenn man Proteine nachbauen könnte, ergäben sich atemberaubende und ungeahnte Möglichkeiten in der Biologie, Chemie und Medizin. Schon seitdem Techniken zur gezielten Veränderung eines natürlich entstandenen Leserasters, welches ein Protein kodiert, zur Verfügung stehen, wird die Neukonstruktion von Proteinen mit veränderten und optimierten Eigenschaften durch den Menschen angestrebt. Dieses Arbeitsgebiet wird unter dem Titel Protein Engineering and Design zusammengefasst.

Ziel eines Protein-Ingenieurs ist es, ein bestehendes Protein an eine spezifische, neue Funktion anzupassen. Weil dieser Vorgang im Verlauf der Evolution kontinuierlich stattfindet, kann das Studium der Evolution und ihrer Mechanismen als Grundlage für die Konstruktion neuer Proteine durch den Menschen dienen. Viele dieser Mechanismen wurden von Protein-Ingenieuren bereits angewandt. Heutzutage werden sie häufig mit neuen Methoden aus der Bioinformatik kombiniert, denn die schnell wachsenden Sequenz- und Struktur-Datenbanken natürlich entstandener Proteine liefern reichliche Informationen für Computer-Algorithmen, die in dem noch jungen Gebiet des so genannten Proteindesigns genutzt werden.

Evolutionäre Mechanismen der Natur

Die Protein-Welt ist zwar enorm divers, bei näherem Betrachten fällt jedoch auf, dass viele Proteine deutliche Ähnlichkeiten untereinander aufweisen. Der Grund dafür ist, dass sich Proteine aus einem Grundbausatz unabhängig faltender Module, den Protein-Domänen, konstituieren. Diese strukturellen Grundeinheiten werden in verschiedene Faltungstypen eingeteilt, basierend auf der räumlichen Anordnung ihrer Sekundärstrukturelemente und deren topologischer Verknüpfung. Es wird angenommen, dass die komplexen Protein-Domänen sich wiederum aus kleineren, intrinsisch stabilen Peptiden entwickelt haben.

Ein sehr effizienter Weg, Proteine mit neuen Spezifitäten oder katalytischen Mechanismen zu erzeugen, ist, ein bereits existierendes, natürliches Protein abzuwandeln. Schon lange ist bekannt und experimentell belegt, dass viele Enzyme promiskuitiv sind und schon mittels kleinster Veränderungen für neue Substrate, Reaktionsmechanismen oder -bedingungen optimiert werden können.

Ein Hauptfaktor in der Evolution ist der horizontale Gentransfer, welcher es erlaubt, bereits existierende Proteine von anderen Organismen zu rekrutieren. Genduplikation und Diversifizierung spielen eine ebenso große Rolle. Es wird geschätzt, dass circa 50% aller mikroorganismischen Gene auf Duplikationsereignisse zurückzuführen sind. Nachfolgend verändern sich Proteine durch zufällige Mutation und natürliche Selektion mit Hilfe einer ganzen Reihe verschiedener Mechanismen.

Einige dieser Mechanismen sind verbreiteter als andere und haben daher einen größeren Beitrag in der Proteinevolution geleistet. Häufig beobachtet werden Punktmutationen, welche aber nur selten zu stark veränderten Proteinstrukturen führen. Drastische Veränderungen werden durch Neuordnungen der Proteinsequenz hervorgerufen. Hierbei stellen Rekombination, Genduplikation und Fusionen die bedeutendsten Prozesse dar.

Rekombination ist ein natürlicher Vorgang, bei dem DNA-Stränge brechen und neu verknüpft werden, wodurch neue Gen-Kombinationen und damit genetische Variation entstehen. Auch eine einfache oder mehrfache Duplikation von Protein-kodierender DNA und deren Fusion können zu neuen Genen führen. Zudem generiert Duplikation genetisches Material, welches ohne Verlust essentieller Gene durch Mutation und Selektion verändert werden kann.

Design nach Vorbild der Evolution

Protein Engineering nach Vorbild der Natur lässt sich in evolutionäre und rationale Methoden unterteilen. Erstere imitieren im Ablauf die natürlich Evolution und werden als gerichtete Evolution bezeichnet. Dabei werden durch absichtlich fehlerhafte Genamplifikationen zufällige Aminosäure-Austausche in einem Protein hervorgerufen und anschließend durch künstlichen Selektionsdruck veränderte und der Umgebung angepasste Proteine identifiziert. Solche Veränderungen lassen sich somit ohne mechanistisches Vorwissen und unvoreingenommen vornehmen. Im Gegensatz dazu werden durch rationale Methoden gezielt an einem Protein Austausche vorgenommen. Dies setzt einerseits genaues Wissen über das zu verändernde Protein voraus, hat aber den Vorteil, dass nur eine oder wenige Varianten getestet werden müssen. Rationales Protein Engineering kann auch angewandt werden, um evolutionäre Hypothesen zu testen, wie an den folgenden Beispielen zu erkennen ist.

Duplikationen von Genfragmenten in Kombination mit Fusion haben möglicherweise eine entscheidende Rolle in der frühen Evolution der Proteinfaltungen gespielt. Überbleibsel dieser Ereignisse sind beispielsweise in repetitiven Faltungen (zum Beispiel TPR, Armadillo oder LRR) deutlich zu erkennen. Auch für die Evolution der großen Familie der (βα)₈- oder TIM-barrel Proteine werden mehrere Duplikationsschritte diskutiert, wobei die sich wiederholenden Einheiten nur auf struktureller Ebene zu erkennen sind. Eine klare Sequenzsymmetrie wiederum wurde in zwei (βα)₈-barrel Proteinen aus der Histidin-Biosynthese (HisA und HisF) gefunden; diese Symmetrie spiegelt sich auch in einer erstaunlichen strukturellen Ähnlichkeit der Proteinhälften wider. Hieraus entstand die Hypothese, dass diese zwei Proteine aus einer ursprünglichen Hälfte und nach zwei aufeinanderfolgenden Duplikationsschritten entstanden sind. Dieser Evolutionsweg konnte im Labor rekonstruiert werden, indem aus zwei identischen Hälften des Proteins HisF ein stabiles und gefaltetes (βα)₈-barrel erzeugt wurde (Abb.1A) [1]. In einem weiteren Experiment konnten wir Hälften von HisA und HisF neu kombinieren, wobei ein stabiles chimäres Protein entstand. Dieses Ergebnis weist darauf hin, dass der Austausch von Halb-barrel-Domänen zur Diversifizierung der Familie der (βα)₈-barrel Proteine beigetragen hat. Auch die individuellen funktionalen Eigenschaften der Halb-barrel wurden auf diese Weise neu kombiniert und können so zu komplexeren Funktionen geführt haben.

Konstruktion von (βα)8-barrel Proteinen durch Duplikation und Fusion (A) sowie Rekombination (B). Fragmente, die von HisF stammen, sind in blau dargestellt, diejenigen von CheY in grün und das neue Sekundärstrukturelement in CheYHisF in rot. — Konstruktion von (βα)₈-barrel Proteinen durch Duplikation und Fusion (A) sowie Rekombination (B). Fragmente, die von HisF stammen, sind in blau dargestellt, diejenigen von CheY in grün und das neue Sekundärstrukturelement in CheYHisF in rot.

© Max-Planck-Institut für Entwicklungsbiologie/Höcker

Konstruktion von (βα)₈-barrel Proteinen durch Duplikation und Fusion **(A)** sowie Rekombination **(B)**. Fragmente, die von HisF stammen, sind in blau dargestellt, diejenigen von CheY in grün und das neue Sekundärstrukturelement in CheYHisF in rot.

© Max-Planck-Institut für Entwicklungsbiologie/Höcker

Gleichwohl kann auch die Rekombination von Domänen verschiedener Faltungen zu neuen Strukturen führen. Die oben beschriebene Halb-barrel-Domäne weist zum Beispiel starke strukturelle Gemeinsamkeiten zur Faltung von Flavodoxin-ähnlichen Proteinen auf. Basierend auf dieser Beobachtung haben wir den N-terminalen Teil von HisF mit Teilen des Flavodoxin-ähnlichen Proteins CheY ersetzt. Die Fusion der Fragmente β1 und α2-β5 aus CheY mit α4-α8 aus HisF resultierte in der sehr stabilen Protein-Chimäre CheYHisF [2]. Nachfolgende Kristallstrukturanalysen der Chimäre bestätigten, dass sich die Struktur der Fragmente im neuen wie im ursprünglichen Kontext sehr ähneln (Abb.1B). Da jedoch die Berührungsflächen der Fragmente nicht optimal aufeinander abgestimmt waren, hat sich das C-terminale Ende des Proteins in das Innere des Barrel eingefügt und dort einen unerwarteten neunten β-Strang gebildet. Die Entstehung dieses neuen Sekundärstrukturelements veranschaulicht, wie kurze Fragmente sich an ein existierendes Proteingerüst anpassen und zu Variationen einer existierenden Faltung führen können.

Diese Rekonstruktions-Experimente illustrieren, wie die Evolution von Protein-Domänen abgelaufen sein könnte und zeigen beispielhaft den Einsatz solcher Mechanismen im Protein-Engineering.

Computer-gestütztes Proteindesign

Die große Menge verfügbarer Sequenz- und Struktur-Daten bietet, wie bereits eingangs erwähnt, eine gute Grundlage, um die Vielfalt von Struktur-Funktionsbeziehungen zu untersuchen und daraus allgemeine Aussagen abzuleiten. Diese Aussagen sind wiederum die Voraussetzung für rationales Protein Engineering, bei dem, basierend auf genauen Annahmen, ein gezielter Austausch an einem Protein vorgenommen wird, um eine neue Eigenschaft zu etablieren. Um dieses Vorgehen zu automatisieren, wurden in den letzten Jahren Algorithmen entwickelt, mit denen sich optimale Proteinsequenzen identifizieren lassen, darunter die so genannte Dead-End-Eliminierung, Monte-Carlo-Minimierung sowie genetische Algorithmen. Die meisten dieser Ansätze nutzen hochaufgelöste Proteinstrukturen als Startgerüst, dem unter Verwendung von Rotamer-Bibliotheken Konformationen der Aminosäureseitenketten oktroyiert werden. Mittels Kristallographie determinierte Strukturen von Aminosäureketten bilden die Grundlage für die Rotamerbibliotheken und basierend auf der Häufigkeit, mit der eine bestimmte Konformation in der Natur auftritt, kann auch die Wahrscheinlichkeit des Auftretens der neuen Struktur berechnet werden.

Eines der großen Ziele ist es, mittels Computer-gestütztem Proteindesign neue Funktionen auf existierenden Proteinen zu etablieren. Der Arbeitsablauf wird in Abbildung 2 dargestellt. Dabei ist eine der ersten Fragen, welches Proteingerüst am besten für eine bestimmte Reaktion geeignet ist. Mit anderen Worten: Ist die Anzahl katalytischer Aminosäurereste und ihre räumliche Anordnung bekannt, so muss anschließend ein Protein ausfindig gemacht werden, welches das katalytische Motiv beherbergen könnte. Oder es gibt ähnliche Anordnungen in anderen Proteinen, die zumindest zum Teil für die neue Bindungstasche genutzt werden könnten. Für diese Suche wurde ein Algorithmus entwickelt, der sehr schnell eine gesamte Struktur-Datenbank nach potenziellen „Anbaustellen“ absucht [3]. Aufbauend auf einer minimalen Konstellation der wichtigsten Aminosäuren wird nachfolgend durch das Programm eine optimale Bindungstasche für den Reaktanden berechnet. Letzteres wird zurzeit von uns bearbeitet, da das Design speziell von Bindungstaschen noch nicht wirklich gelöst erscheint. Vor wenigen Jahren war bereits die Konstruktion neuer hochaffiner Bindungstaschen für verschiedene niedermolekulare Liganden publiziert worden. Ein stringenter Test mit verschiedenen komplementären biophysikalischen Methoden in unserem Labor zeigte jedoch, dass die neuartigen Proteine den Liganden nicht spezifisch binden konnten [4]. Obwohl mittlerweile erste enzymatische Katalysatoren mittels Computer-gestütztem Design geschaffen werden konnten, was einen großen Durchbruch darstellt, so ist auch in diesen Proteinen die Bindung des Substrats noch ein Schwachpunkt geblieben. Somit müssen in Zukunft die Faktoren, die bei der Bindung verschiedenster Liganden eine Rolle spielen, noch näher untersucht werden, um besser in den genutzten Algorithmen und Energieberechnungen dargestellt werden zu können.

Abschließende Bemerkungen

Die Diversität natürlich entstandener Proteine und die beobachteten Mechanismen der Evolution sind ein guter Wegweiser für die Konstruktion neuer, auf praktische Anwendungen spezialisierter Proteine. Die Rekonstruktion von Evolutionswegen stellt Möglichkeiten zum Bau neuer oder variierter Proteinstrukturen durch Duplikation oder Rekombination dar. Die Feinabstimmung, auch und besonders hinsichtlich der Funktion, wird jedoch erst durch einzelne Mutationen erreicht, deren Vorhersage mittels Computer-Algorithmen weiter vereinfacht werden soll. Die Computer-Algorithmen nutzen zwar ebenfalls Informationen aus dem vielfältigen Fundus der durch die Evolution entstandenen Proteine, sie helfen aber, Lösungen schneller zu finden.