Forschungsbericht 2021 - Max-Planck-Institut für Dynamik komplexer technischer Systeme
Maschinelles Lernen von dynamischen Systemen
Einleitung
Mathematische Modelle dynamischer Systeme spielen eine entscheidende Rolle für die Vorhersage und Überwachung komplexer technischer Prozesse, naturwissenschaftlicher Phänomene, sowie gesellschaftlicher, ökonomischer und ökologischer Entwicklungen. Ebenso werden sie benötigt, um Systeme zu optimieren, zu steuern und zu regeln. Aktuelle, gesellschaftlich relevante Beispiele sind z.B. Modelle zur Vorhersage des Klimas und der damit verbundenen Erderwärmung.
Das Verständnis physikalischer Phänomene und dynamischen Verhaltens mittels datengesteuerter mathematischer Modelle ist seit Jahrhunderten ein aktives Forschungsgebiet. Zum Beispiel leitete Kepler seine drei Gesetze der Planetenbewegung im 17. Jahrhundert aus der Analyse der astronomischen Beobachtungen von Brahe her. Diese Art der Modellierung war und ist unerlässlich für die Entdeckung grundlegender naturwissenschaftlicher Gesetze und für die Lösung moderner technischer Aufgabenstellungen wie Prozessdesign, Steuerung und Regelung sowie die Vorhersage komplexer ingenieur- und sozialwissenschaftlicher Systeme. Traditionelle Ansätze zur Modellierung basieren auf bekannten physikalischen Gesetzen und empirischem Wissen. Dies ist jedoch für viele komplexe Systeme schwierig, z. B. für das Verständnis der Dynamik des arktischen Eispakets, die Dynamik von Robotern oder komplexe biochemische Reaktionen, um nur einige Anwendungen zu nennen. Mit datengesteuerten Methoden, die Fortschritte in der künstlichen Intelligenz nutzen, können heutzutage dynamische Modelle für solche komplexen Prozesse identifiziert werden, um zugrundeliegende technisch-physikalische Phänomene zu verstehen, oder technische Anlagen zu optimieren und per digitalen Zwillingen zu überwachen und in Echtzeit zu regeln.
Physikalisches Verständnis aus Daten ableiten
Die Identifikation physikalischer Gesetze aus Daten hat in der Wissenschaftsgeschichte vielfach ihr Potenzial bewiesen. Neben den bereits oben genannten Keplerschen Gesetzen sind z.B. die von Isaac Newton auf der Grundlage gemessener Daten entwickelten fundamentalen Gesetze zu nennen. Dieser Bereich ist für die Wissenschaft nach wie vor von großer Bedeutung, um physikalische Prozesse besser zu verstehen und zu gestalten. Eine wesentliche Voraussetzung dafür ist es, einen analytischen mathematischen Ausdruck zu finden, der die zugrunde liegende Dynamik beschreibt und den Experten und Expertinnen interpretieren können. Mit dieser Zielsetzung haben symbolische Regressionsverfahren zur Identifikation dynamischer Systeme in den letzten Jahren an Popularität gewonnen [1]. Die Anwendbarkeit dieser Methode bei verrauschten Daten konnten wir erheblich verbessern, indem ein klassisches numerisches Integrationsverfahren in das Regressionsproblem integriert wurde, wodurch keine Ableitungsdaten (welche schwer zu erzeugen und bei verrauschten Daten zu unzuverlässigen Ergebnissen führen können) mehr erforderlich sind [2].
Physikalisch unterstützte Modellierung von Surrogaten
Numerische Simulationen sind die Grundlage für den technischen Entwurfsprozess komplexer Systeme. Diese Systeme werden in der Regel mit numerischen Verfahren wie finiten Elementen und finite Volumen modelliert, die dann während der Simulation oft mehrfach abgerufen werden. Allerdings führen die für eine hohe Genauigkeit der Modelle notwendige Komplexität oft zu nicht akzeptablem Rechenaufwand. Um diesen zu verringern, verwendet man oft Ersatzmodelle (Surrogate) von geringerer Komplexität, die es erlauben, die wesentlichen, interessierenden Größen mit ausreichender Präzision zu berechnen, dies aber mit deutlich reduzierter Rechenzeit. Dabei verzichtet man auf die Auflösung aller Details, wobei die Kunst darin besteht, zu identifizieren, welche Größen im Ersatzmodell vernachlässigt werden können.
Ein interessanter Ansatz zur effizienten Durchführung von Simulationen für hochaufgelöste Modelle ist die Konstruktion von Modellen reduzierter Ordnung, wobei „Ordnung“ sich hier auf die Dimension des Zustandsraums bezieht. Dies wird häufig durch Projektion der hochdimensionalen Modelle auf eine niedrigdimensionale Mannigfaltigkeit ermöglicht. In diesem Zusammenhang haben wir einen datengesteuerten Ansatz, bekannt als Operator-Inferenz (OpInf) [3], zur Erstellung solcher Modelle unter Verwendung von experimentellen oder durch Simulation gewonnenen Daten, weiterentwickelt. Ein wesentliches Merkmal von OpInf ist die abstrakte Einbeziehung von physikalischem Vorwissen, um Surrogate zu konstruieren, was in neuester Zeit auch gerne als „physikalisch informiertes Lernen“ bezeichnet wird. Hierzu haben wir eine Reihe von Methoden für nichtlineare und parametrische Systeme auf der Grundlage der OpInf-Perspektive, teilweise in Zusammenarbeit mit dem Oden Institute for Computational Engineering & Sciences der University of Texas in Austin, USA, und der Middle East Technical University, Ankara, Türkei entwickelt [4,5]. Für inkompressible Strömungen konnten wir am Beispiel der Massenerhaltung zeigen, wie die analytische Kenntnis eines physikalischen Gesetzes die Konstruktion von effizienten Ersatzmodellen unterstützen kann [6].