MaxDIA - Proteomik auf dem nächsten Level
Neue Software verbessert die datenunabhängige Erfassung von Proteomik-Daten
Die Proteomik produziert enorme Datenmengen, deren Analyse und Interpretation sehr komplex sein kann. Die kostenlose Software-Plattform MaxQuant hat sich in den letzten 13 Jahren als äußerst hilfreich für die Datenanalyse in der Shotgun-Proteomik erwiesen. Nun stellen Jürgen Cox, Gruppenleiter am Max-Planck-Institut für Biochemie, und sein Team die neue Version 2.0 vor. Sie bietet einen verbesserten, computergestützten Workflow für die datenunabhängige Erfassung (DIA) von Proteomik-Daten, der MaxDIA genannt wird. MaxDIA umfasst bibliotheksbasierte und bibliotheksunabhängige DIA-Proteomanalysen und ermöglicht eine hochsensitive und genaue Datenanalyse. Durch die Zusammenführung von datenabhängiger und datenunabhängiger Erfassung in eine gemeinsame Arbeitsumgebung ist MaxQuant 2.0 ein großer Schritt in Richtung verbesserter Anwendungen für die personalisierte Medizin.
Proteine sind wesentlich für das Funktionieren unserer Zellen, doch viele Fragen zu ihrer Synthese, ihrem Vorkommen, ihren Funktionen und Defekten sind noch unbeantwortet. Hochdurchsatztechniken können helfen, unser Verständnis dieser Moleküle zu verbessern. Für die Analyse mittels Flüssigchromatographie und anschließender Massenspektrometrie (MS) werden die Proteine in kleinere Peptide zerlegt, ein Prozess, der als "Shotgun-Proteomik" bezeichnet wird. Das Masse-Ladungs-Verhältnis dieser Peptide wird anschließend mit einem Massenspektrometer bestimmt. Als Ergebnis erhält man MS-Spektren. Aus diesen Spektren können Informationen über die Identität der analysierten Proteine rekonstruiert werden. Die enorme Menge und Komplexität der Daten macht die Datenanalyse und -interpretation jedoch zu einer Herausforderung.
Zwei Verfahren, um Proteine mittels Massenspektrometrie zu analysieren
In der Shotgun-Proteomik werden vorwiegend zwei Methoden verwendet: Die datenabhängige Erfassung (DDA) und die datenunabhängige Erfassung (DIA). Bei der DDA-Methode werden die am häufigsten vorkommenden Peptide einer Probe vorausgewählt, bevor sie fragmentiert und gemessen werden. Somit können die Sequenzen dieser wenigen, vorselektierten Peptide rekonstruiert werden, was die Analyse einfacher und schneller macht. Allerdings führt diese Methode zu einer Verzerrung der Analyse in Richtung der am häufigsten vorkommenden Peptide. Die DIA-Methode hingegen ist robuster und sensitiver. Es werden hierbei alle Peptide aus einem bestimmten Massenbereich auf einmal fragmentiert und gemessen, ohne sie vorher nach Häufigkeit vorauszuwählen. Dadurch werden große Datenmengen generiert und die Komplexität der erhaltenen Daten steigt erheblich. Die Identifizierung der ursprünglichen Proteine war bisher nur durch den Abgleich der neu gemessenen Spektren mit Bibliotheken möglich, die bereits früher gemessene Spektren umfassen.
DDA und DIA in einer Welt vereint
Jürgen Cox und sein Team haben nun eine Software entwickelt, die einen vollständigen, computergestützten Workflow für DIA-Daten bietet. Diese ermöglicht es erstmals, Algorithmen auf DDA- und DIA-Daten in gleicher Art und Weise anzuwenden. Somit werden Studien, die entweder auf DDA oder DIA basieren, nun leichter vergleichbar. MaxDIA analysiert Proteomik-Daten mit und ohne Verwendung spektraler Bibliotheken. Mithilfe von maschinellem Lernen sagt die Software die Peptidfragmentierung und die spektralen Intensitäten voraus. Sie erzeugt somit präzise spektrale MS-Bibliotheken in silico.
MaxDIA beinhaltet auch einen bibliotheksfreien Discovery-Modus mit zuverlässiger Kontrolle von falsch-positiven Protein-Identifikationen. Darüber hinaus unterstützt die Software neue Technologien wie Bootstrap DIA, BoxCar DIA und Trapped Ion Mobility Spectrometry DIA. Was folgt als Nächstes? Das Team arbeitet bereits an der weiteren Verbesserung der Software. Es werden mehrere Erweiterungen entwickelt, zum Beispiel zur Verbesserung der Analyse posttranslationaler Modifikationen und zur Identifizierung von quervernetzten Peptiden.
Selbständige Analyse komplexer Proteomik-Daten
MaxDIA ist eine kostenlose Software, die Wissenschaftler:innen weltweit zur Verfügung steht. Sie ist eingebettet in die etablierte Software-Umgebung MaxQuant. "Wir möchten die Datenanalyse in der Proteomik allen Forscher:innen ermöglichen", sagt Pavel Sinitcyn, Erstautor der Publikation über MaxDIA. Darum bieten Cox und sein Team bei der MaxQuant-Sommerakademie allen interessierten Forscher:innen ein Hands-on-Training in dieser Software an. Damit schlagen sie die Brücke zwischen der Arbeit im Labor und komplexer Datenanalyse.
Ziel ist es, so Sinitcyn, "die Massenspektrometrie vom Max-Planck-Institut für Biochemie in die Kliniken zu bringen". Anstatt nur einige wenige Proteine zu messen, können nun Tausende von Proteinen gemessen und analysiert werden. Damit eröffnen sich neue Möglichkeiten für medizinische Anwendungen, insbesondere im Bereich der personalisierten Medizin.