Forschungsbericht 2016 - Max-Planck-Institut für Mathematik in den Naturwissenschaften

Wie findet man eine geeignete Beschreibungsebene für ein komplexes System?

Autoren
Pfante, Oliver; Bertschinger, Nils; Olbrich, Eckehard; Ay, Nihat; Jost, Jürgen
Abteilungen

Max-Planck-Institut für Mathematik in den Naturwissenschaften, Leipzig

Zusammenfassung
Bei der Analyse komplexer Systeme stellt sich die Frage, welche Einzelheiten der Detailebene man kennen muss, um die Dynamik auf der Systemebene verstehen zu können. Idealerweise hätte man eine höhere Beschreibungsebene zur Verfügung, auf der nach Kenntnis des Anfangszustandes die Dynamik autonom in dem Sinne abläuft, dass man nicht ständig die Details der tieferen Ebene abfragen muss. Hierzu sind formale Methoden entwickelt worden, die insbesondere die Frage nach dem Informationsfluss zwischen verschiedenen Ebenen mit der Frage nach Gedächtniseffekten auf den jeweiligen Ebenen verknüpfen.

Gültigkeit von Modellen der Wirklichkeit auf bestimmten Skalen

Bei der Untersuchung physikalischer, biologischer oder sozialer Systeme ergibt sich typischerweise das Problem der Wahl der geeigneten Beschreibungsebene. Die richtige Auswahl kann die Beschreibung und das Verständnis des Systems außerordentlich vereinfachen. So fasst man in der Kepler-Newtonschen Theorie der Planetenbewegung die Himmelskörper als punktförmige Teilchen auf und gelangt dadurch zu einfachen und klaren Gesetzmäßigkeiten. Würde man die Zusammensetzung und die innere Struktur der Planeten berücksichtigen, würde alles viel komplizierter. Die Einfachheit der Beschreibung ginge verloren, ohne mit vertretbarem Rechenaufwand zu besseren Vorhersagen über die Bewegungen der Himmelskörper zu kommen. Auch die Schrödinger-Gleichung der Atomphysik, die beispielsweise die Grundlage für die Modelle der Quantenchemie bildet, berücksichtigt nicht die Zusammensetzung der Protonen oder Neutronen aus elementareren Bestandteilen wie den Quarks, ohne dass dies ihrer empirischen Gültigkeit Abbruch tun würde. Derartige Beispiele gibt es auch in anderen Gebieten als der Physik. So lässt sich das Schwarmverhalten von Vögeln durch einfache Wechselwirkungsregeln modellieren, die keine detaillierte Beschreibung der dem Vogelflug zugrunde liegenden Aerodynamik und Biophysik oder der dem Verhalten zugrundeliegenden Neuroanatomie und -physiologie der Vögel benötigen. Auch die Hodgkin-Huxley-Gleichungen der Neurobiologie beschreiben quantitativ das Feuerverhalten von Neuronen, ohne dabei auf die molekularen Details eingehen zu müssen, und die Mendelschen Vererbungsgesetze kümmern sich nicht um das biochemische Substrat der Gene. Und selbst die Gesetzmäßigkeiten der Makroökonomie sehen von den individuellen Eigenschaften, variablen Fähigkeiten und unterschiedlichen kulturellen Milieus der Wirtschaftssubjekte ab.

Wahl der Detailebene

Leider ist die Sachlage nicht immer so einfach. Die vorstehend skizzierten Beispiele stellen zwar Glanzpunkte wissenschaftlicher Erkenntnis dar, sind aber nicht unbedingt typisch für den wissenschaftlichen Alltag. In vielen Fällen scheinen Einzelheiten der feineren Detailebene der einzelnen Elemente oder Agenten eine solche Rolle für das auf der gröberen Systemebene aggregierte Verhalten des Gesamtsystems zu spielen, dass dieser Einfluss nicht vernachlässigt werden kann, wenn man das Systemverhalten verstehen und prognostizieren will. Es stellt sich daher die Frage, welche Details man ignorieren und wie man eine geeignete intermediäre Beschreibungsebene finden kann.

Im Falle eines biologischen Organismus beispielsweise setzt eine vollständige Beschreibung voraus, dass die Zustände aller Zellen erfasst und deren Dynamiken auf molekularer Ebene beschrieben werden können. Und die Vorgänge auf der molekularen Ebene erfordern vielleicht wiederum die Kenntnis atomarer Details. Dies ist unmöglich, und es stellt sich die Frage, ob beispielsweise eine Beschreibung auf der zellulären oder der organismischen Ebene für das Verständnis zumindest bestimmter Aspekte der Systemdynamik ausreicht. Und wann lässt sich das Verhalten von Populationen oder sozialen Gruppen ohne detaillierte Kenntnis der beteiligten Individuen nach seinen eigenen Gesetzmäßigkeiten verstehen? Denn wenn man erst die Individuen genau modellieren müsste, so müsste man dann wiederum deren biologische Details mit den eben beschriebenen Schwierigkeiten analysieren.

Dieses Problem ist bekannt und vielfältig diskutiert worden. In dem beschriebenen Projekt wurden mathematische Konzepte entwickelt, die das Problem formal fassen und dadurch besser analysierbar machen. Mit informationstheoretischen Methoden wurde untersucht, wann eine vereinfachte Beschreibung auf einer Makroebene möglich ist und wie sich geeignete intermediäre Beschreibungsebenen identifizieren lassen.

Die betrachteten Prozesse sind typischerweise stochastisch, oder müssen mangels genauerer Detailkenntnis zumindest als solche modelliert werden, auch wenn sie vielleicht auf einer fundamentaleren Ebene eigentlich deterministisch sind, und die Entwicklung des Systems ist oder erscheint daher teilweise zufällig. Vollständig präzise Vorhersagen sind deshalb nicht möglich, und es stellt sich die Frage nach den bei den vorliegenden Kenntnissen über den Zustand des Systems bestmöglichen Prognosen.

Theoretische Analyse

original
Original 1508157998
Abb. 1: Formale Darstellung der Vorgehensweise: Die Dynamik T überführt den aktuellen Zustand mit allen Details nach X', die Abbildung π ignoriert einige Details. Untersucht wird, ob die resultierende Abbildung ψ als eigenständige Dynamik verstanden werden kann.
Abb. 1: Formale Darstellung der Vorgehensweise: Die Dynamik T überführt den aktuellen Zustand mit allen Details nach X', die Abbildung π ignoriert einige Details. Untersucht wird, ob die resultierende Abbildung ψ als eigenständige Dynamik verstanden werden kann.

Es sei ein System im Zustand X gegeben, dessen zeitliche Dynamik durch einen Mechanismus T beschrieben wird. Formal ist diese Vorgehensweise in dem Diagramm illustriert (siehe Abb. 1). Dabei bezeichnet X den aktuellen Zustand mit allen Details der feinsten Ebene. Die Dynamik T überführt diesen dann in einen neuen Zustand X'. Der Zustand Y auf einer intermediären Beschreibungsebene wird dabei aus X gewonnen mittels einer Abbildung π, welche viele Details ignoriert und so eine reduzierte Beschreibung ermöglicht. Idealerweise ergibt sich eine eindeutige Dynamik auf dieser Ebene, die dann als eigenständiger Mechanismus ψ modelliert und verstanden werden kann.

Dies ist jedoch nur möglich, wenn der reduzierte Zustand Y die notwendige Information erhält, um seine eigene zeitliche Veränderung berechnen zu können. Wir haben daher zwei formale Kriterien vorgeschlagen, um diese Eigenschaft zu erfassen [2]:

  • Die induzierte Dynamik auf der oberen Ebene bildet einen Markov-Prozess, also einen Prozess ohne Gedächtniseffekte. Das bedeutet, dass sich bei Kenntnis des gegenwärtigen Zustandes die Vorhersage zukünftiger Zustände nicht mehr durch Information über vergangene Zustände verbessern lässt. In diesem Fall ist es möglich, die zeitliche Veränderung Y nach Y' als typischerweise stochastische Abbildung ψ ohne Rückgriff auf frühere Zeitpunkte zu beschreiben. Der Zustand auf der oberen Ebene kann damit als Zustand im Sinne einer eigenständigen physikalischen Beschreibung verstanden werden, da er alle Information enthält um seine eigene zeitliche Entwicklung zu berechnen.
  • Es gibt keinen weiteren Informationsfluss von der unteren auf die obere Ebene, wenn der Anfangszustand auf der oberen Ebene einmal festgelegt ist. (In diesen Anfangszustand fließt natürlich Information aus der Detailebene ein, da die Ebenen nicht völlig entkoppelt sein sollen.) In diesem Fall lässt sich die Dynamik auf der oberen Ebene unabhängig von der zugrunde liegenden detaillierten Dynamik auf der unteren Ebene beschreiben, da diese keine weitere Information beiträgt, die nicht schon auf der oberen Ebene verfügbar wäre. Wie wir zeigen konnten, impliziert dies auch eine Markov-Dynamik auf der oberen Ebene und ist daher echt stärker als die obige Bedingung.

Durch Vergröberung der Betrachtung induzierte Abhängigkeit von der Vergangenheit

original
Original 1508157998
Abb. 2a: Ein einfaches Beispiel der Vergröberung: Ein fairer Würfel wird wiederholt geworfen, und wir erhalten eine zufällige Folge von Ziffern zwischen 1 und 6. Die Vergröberung besteht aus einer Folge der Ziffern 0 und 1, die Ziffer 1, falls der Wurf eine höhere Ziffer zeigt als der vorangegangene, die Ziffer 0 sonst (also insbesondere beim ersten Wurf).
Abb. 2a: Ein einfaches Beispiel der Vergröberung: Ein fairer Würfel wird wiederholt geworfen, und wir erhalten eine zufällige Folge von Ziffern zwischen 1 und 6. Die Vergröberung besteht aus einer Folge der Ziffern 0 und 1, die Ziffer 1, falls der Wurf eine höhere Ziffer zeigt als der vorangegangene, die Ziffer 0 sonst (also insbesondere beim ersten Wurf).

Ein einfaches Beispiel kann verdeutlichen, warum sich die Markov-Eigenschaft nicht unbedingt von einer feineren auf eine gröbere Ebene überträgt [1]. Wir würfeln wiederholt mit einem nicht gezinkten Würfel und erhalten als Ergebnisse eine Folge, deren Glieder sich aus den Ziffern von 1 bis 6 rekrutieren. Dieser Prozess ist völlig zufällig, und selbst die Kenntnis des gegenwärtigen Wurfes oder auch beliebig vieler vergangener Würfe hilft uns nicht dabei, die nächste Ziffer vorauszusagen. Nun bilden wir eine gröbere Folge, die nur aus den beiden Ziffern „0“ und „1“ besteht. Wir setzen eine „1“, wenn der gegenwärtige Wurf ein höheres Ergebnis als der letzte geliefert hat, und ansonsten eine „0“ (siehe Abb. 2a). Nun hilft uns plötzlich die Kenntnis der Vergangenheit bei der Vorhersage der nächsten Ziffer. Je mehr Einsen schon hintereinander aufgetreten sind, umso unwahrscheinlicher wird es, im nächsten Schritt wieder eine „1“ zu bekommen. Und wenn sogar schon fünf Einsen hintereinander aufgetreten sind, wissen wir mit Sicherheit, dass als nächstes eine „0“ kommen muss, denn wenn die Augenzahl fünfmal hintereinander höher als die vorhergehende war, sind wir bei der 6 angekommen, und eine höhere Augenzahl kann der Würfel dann nicht mehr liefern (siehe Abb. 2b). Wenn also, um dies abstrakt zu interpretieren, in jedem Schritt nur partielle Information auf die gröbere Beschreibungsebene gelangt, so kann auf dieser Ebene das Gedächtnis dann nützliche Zusatzinformationen bereitstellen.

original
Original 1508157999
Abb. 2b: Beim Übergang zur Vergröberung geht die Markov-Eigenschaft verloren: Während die Folge der Würfelaugen rein zufällig ist, also nicht von der Vergangenheit abhängt, kann man in der vergröberten Betrachtung aus der Vergangenheit Rückschlüsse auf die Zukunft ziehen.
Im obersten Fall der vergessenen Vergangenheit "weiß" der Prozess lediglich, wenn er eine "1" sieht, dass der aktuelle Wurf mindestens eine 2 sein muss und kann nur wenig Rückschlüsse auf die Wahrscheinlichkeit einer "1" im nächsten Schritt ziehen.
Hat man zweimal hintereinander die "1" gesehen, so "weiß" der Prozess, dass der aktuelle Wurf mindestens eine 3 sein muss, was eine "1" in der gröberen Folge schon unwahrscheinlicher macht.
Erinnert der Prozess sich an die letzten 5 Würfe, und ist fünfmal hintereinander die "1" aufgetreten, so "weiß" der Prozess, das der aktuelle Wurf eine 6 sein muss und daher zwingend eine "0" im nächsten Schritt folgen muss.
Abb. 2b: Beim Übergang zur Vergröberung geht die Markov-Eigenschaft verloren: Während die Folge der Würfelaugen rein zufällig ist, also nicht von der Vergangenheit abhängt, kann man in der vergröberten Betrachtung aus der Vergangenheit Rückschlüsse auf die Zukunft ziehen.
Im obersten Fall der vergessenen Vergangenheit "weiß" der Prozess lediglich, wenn er eine "1" sieht, dass der aktuelle Wurf mindestens eine 2 sein muss und kann nur wenig Rückschlüsse auf die Wahrscheinlichkeit einer "1" im nächsten Schritt ziehen.
Hat man zweimal hintereinander die "1" gesehen, so "weiß" der Prozess, dass der aktuelle Wurf mindestens eine 3 sein muss, was eine "1" in der gröberen Folge schon unwahrscheinlicher macht.
Erinnert der Prozess sich an die letzten 5 Würfe, und ist fünfmal hintereinander die "1" aufgetreten, so "weiß" der Prozess, das der aktuelle Wurf eine 6 sein muss und daher zwingend eine "0" im nächsten Schritt folgen muss.

Das vorstehende Beispiel ist nun recht banal, aber durch systematische Exploration von solchen auf höheren Beschreibungsebenen auftretenden Gedächtniseffekten lassen sich auch neue Erkenntnisse über chaotische Dynamiken gewinnen; also Dynamiken, bei denen sich Ungenauigkeiten von Schritt zu Schritt aufschaukeln. Das macht langfristige Prognosen unmöglich [3].

In aktuellen Forschungsprojekten werden die vorstehend geschilderten Konzepte und Methoden theoretisch weiter analysiert, in Simulationen ausgetestet und auf reale Daten angewandt.

Förderung

Die Forschungsarbeiten, die zu diesen Ergebnissen geführt haben, wurden gemäß der Finanzhilfevereinbarungen Nr. 267087 und Nr. 318723  im Zuge des Siebten Rahmenprogramms der Europäischen Gemeinschaft (RP7/2007-2013) gefördert.
Nils Bertschinger wurde durch die Klaus Tschira Stiftung unterstützt.

Literaturhinweise

1.
Atay, F.; Jalan, S.; Jost, J.
Randomness, chaos, and structure.
Complexity 15, 29-35 (2009)
DOI
2.
Pfante, O.; Bertschinger, N.; Olbrich, E.; Ay, N.; Jost, J.
Comparison between different methods of level identification.
Advances in Complex Systems 17, 1450007 (2014)
DOI
3.
Pfante, O.; Olbrich, E.; Bertschinger, N.; Ay, N.; Jost, J.
Closure measures for coarse-graining of the tent map.
Chaos: An Interdisciplinary Journal of Nonlinear Science 24(1), 013136 (2014)
DOI
Zur Redakteursansicht