Web-Tool erleichtert Interpretation genetischer Informationen
Forschende entwickeln neue Methode, die Mutationen in krankheitsrelevanten Genen interpretieren und klinische Entscheidungsfindung unterstützen kann
Derzeitige Prognosemodelle können bei der Interpretation von Mutationen bereits helfen, neigen aber dazu, gutartige Mutationen als krankheitsverursachend zu klassifizieren und damit als falsch Positive. Forschungsteams des Max-Planck-Instituts für molekulare Zellbiologie und Genetik in Dresden, des Zentrums für Systembiologie Dresden und der Harvard Medical School in Boston haben ein Tool entwickelt. Der Open-Source-Webserver bietet eine Interpretation von Auswirkungen aller potenziellen krankheitsverursachenden Mutationen einzelner Aminosäuren in 316 klinisch relevanten Genen für die es bereits präventive Diagnosen und Behandlungsmöglichkeiten gibt. Das Tool reduziert die Rate an falsch Positiven und erlaubt es Medizinerinnen und Medizinern somit, die Auswirkungen von Mutationen in diesen Genen genauer einschätzen, da weniger gutartige Mutationen als krankheitsverursachend eingestuft werden.
In den letzten Jahren ist die Sequenzierung von Genomen kostengünstiger und fortschrittlicher geworden. Dies ermöglicht es Medizinerinnen und Medizinern einerseits, die Sequenzierung zunehmend für diagnostische Zwecke zu nutzen, und Wissenschaftlerinnen und Wissenschaftlern andererseits, mehr Forschungsfragen zu untersuchen. Gleichzeitig gibt es für viele entdeckte Mutationen keine eindeutige klinische Interpretation.
Die Ungewissheit darüber, ob eine Mutation eine Krankheit verursacht, kann für Patientinnen und Patienten belastend sein und zu psychischer Beeinträchtigung, Morbidität und Behandlungskosten durch Unter- und Überdiagnosen führen. Zwar gibt es bereits Instrumente zur Vorhersage der funktionellen Auswirkungen dieser Varianten, doch deren Leistungsfähigkeit ist aufgrund begrenzter klinischer Daten beschränkt. Dies erschwert die Unterscheidung zwischen pathogenen (krankheitsverursachenden) und gutartigen (neutralen) Varianten innerhalb eines bestimmten Gens und führt häufig dazu, dass Mutationen, die keine Krankheit verursachen, als pathogen eingestuft werden. Für die Entwicklung eines zuverlässigen Prognoseverfahrens für klinische Anwendungen ist es von entscheidender Bedeutung, diese Schwierigkeiten zu lösen.
Hohe Genauigkeit bei Interpretation von Mutationen
Die Forschungsgruppe von Agnes Toth-Petroczy am Max-Planck-Instituts für molekulare Zellbiologie und Genetik und am Zentrum für Systembiologie hat zusammen mit Christopher Cassa und Ivan Adzhubei von der Harvard Medical School, ein statistisches Modell und den Webserver DeMAG entwickelt, die eine hohe Genauigkeit bei der Interpretation von Mutationen in Krankheitsgenen erzielen.
Um das Modell zu trainieren, wählten die Forschenden sorgfältig bereits bekannte pathogene sowie gutartige Mutationen aus. „Wir haben dazu klinische und andere Populations-Datenbanken verwendet. Dabei haben wir nur Mutationen ausgewählt, über deren klinische Interpretation sich mehrere Übermittler der Daten, wie Ärzte und Genetiklabors, einig sind. Außerdem haben wir Daten von Bevölkerungsgruppen einbezogen, die in den aktuellen Datenbanken unterrepräsentiert sind, wie z. B. koreanische oder japanische, um das Modell noch repräsentativer und genauer zu machen“, erklärt Federica Luppino, Erstautorin der Forschungsarbeit und Doktorandin in der Gruppe von Toth-Petroczy.
Aminosäuren mit gleicher klinischer Wirkung
DeMAG verfügt über eine neue Funktion, den „Partnerscore“, der Gruppen von Aminosäuren in einem Protein identifiziert, die die gleiche klinische Wirkung haben. Mit dem Partnerscore macht sich DeMAG Beziehungen zwischen Aminosäuren zunutze und stützt sich dabei auf evolutionäre Informationen aus den Genomen vieler Organismen und die jüngste Revolution in der künstlichen Intelligenz bei der Vorhersage der 3D-Formen von Proteinen unter Verwendung des von Google DeepMind entwickelten AlphaFold-Algorithmus.
Agnes Toth-Petroczy, die die Studie leitete, fasst zusammen: „Mit dem Tool bieten wir einen grundlegenden Rahmen für die Integration von klinischen Daten und Proteindaten, der die Bewertung von Auswirkungen durch Mutationen unterstützt. Wir hoffen, dass unser Tool und unser Webserver die klinische Entscheidungsfindung erleichtern werden. Die neu entwickelten Funktionen können auch für Gene und Organismen über den Menschen hinaus eingesetzt werden.“ Der DeMAG-Code ist auf GitLab (https://git.mpi-cbg.de/tothpetroczylab/DeMAG) verfügbar und alle Daten sind frei zugänglich.