Forschungsbericht 2015 - Assoziierte Einrichtung - Ernst Strüngmann Institute (ESI) for Neuroscience
Die Großhirnrinde, ein hochdimensionales, dynamisches System
Wahrnehmen beruht auf Rekonstruktion
Damit Sinnessignale Wahrnehmungen werden können, müssen sie unter Hinzuziehung von Vorwissen, das im Gehirn gespeichert ist, geordnet und interpretiert werden. Ein erheblicher Anteil dieser Rekonstruktionen wird von der Großhirnrinde erbracht. Wie einzigartig diese Leistung ist, wird deutlich, wenn man bedenkt, dass zum Beispiel auf der Netzhaut des Auges durch den optischen Apparat lediglich eine zweidimensionale, kontinuierliche Verteilung elektromagnetischer Wellen erzeugt wird, die sich in ihrer Intensität und Wellenlänge unterscheiden. Aus dieser Information, die über die Nervenzellen in der Netzhaut in neuronale Erregungen verwandelt und an die Hirnrinde weitergeleitet wird, erzeugt das Gehirn dann das, was wir wahrnehmen: dreidimensionale Objekte, die voneinander und dem Hintergrund deutlich abgegrenzt und damit identifizierbar sind. Es ist dies eine Leistung, die selbst von den besten derzeit verfügbaren technischen Mustererkennungssystemen nur unter eingeschränkten und relativ stereotypen Bedingungen erbracht werden kann. Unser Gehirn löst diese Aufgabe mühelos und in Bruchteilen einer Sekunde.
Eine notwendige Voraussetzung für diesen Verarbeitungsschritt, der als Szenen- oder Bildsegmentierung benannt wird, ist der Vergleich der einlaufenden Sinnessignale mit gespeicherten Modellen über die Struktur der Sehwelt. Das Gehirn weiß bereits, wie Objekte beschaffen sind und nutzt dieses Vorwissen, um die verfügbaren Sinnessignale zu ordnen und miteinander so zu verbinden, dass voneinander abgegrenzte Gestalten erkennbar werden. Schon in den Dreißigerjahren des letzten Jahrhunderts haben Gestaltpsychologen wie Wertheimer, Koffka und Köhler, die unter anderem in Frankfurt tätig waren, diejenigen Gestaltprinzipien herausgearbeitet, nach denen unsere Gehirne Objekte voneinander abgrenzen. So zeichnet sich ein Objekt dadurch aus, dass es eine kontinuierliche, geschlossene Umrandung aufweist, dass sich alle seine Konturen mit der gleichen Geschwindigkeit in die gleiche Richtung bewegen, wenn sich das Objekt bewegt, dass seine Bestandteile gewisse Merkmale gemein haben, beispielsweise miteinander verbunden zu sein, oder die gleiche Farbe oder Textur zu haben. Viele psychophysische Experimente verweisen darauf, dass diese Regeln im Gehirn abgespeichert sind und über alle Spezies hinweg große Ähnlichkeiten aufweisen. Letzteres ist nicht verwunderlich, da wir alle in der gleichen Welt leben, mit den gleichen Wahrnehmungsproblemen konfrontiert sind und sich im Laufe der Evolution der Arten eine optimale Strategie herausgebildet hat. Das Wissen über Gestaltprinzipien ist zum großen Teil angeboren und in der Verschaltung der Großhirnrindenareale niedergelegt, die sich mit der Verarbeitung von Sinnessignalen befassen. Uns ist nicht bewusst, dass wir über diese Regeln verfügen, da sie über evolutionäre Ausleseprozesse optimiert, in den Genen gespeichert und in der Architektur unseres Nervensystems niedergelegt wurden. Ein Teil der Gestaltkriterien wird jedoch im Laufe der frühen Hirnentwicklung durch Erfahrung erlernt und ebenfalls durch strukturelle Veränderungen in den entsprechenden Neuronennetzen gespeichert und steht dann genauso wie das angeborene Vorwissen für die Interpretation von Sinnessignalen zur Verfügung.
Eine zentrale und noch weitestgehend ungelöste Frage ist nun, wie die Verrechnung der eingehenden Sinnessignale mit dem gespeicherten Vorwissen erfolgt. Einige Randbedingungen, die im Folgenden erläutert werden, lassen erahnen, dass es sich hier um einen ganz außergewöhnlichen Vorgang handeln muss, für den es keine triviale Erklärung geben kann.
Ein geheimnisvolles Speichermedium
Zur Veranschaulichung des Problems muss in Erinnerung gerufen werden, dass Menschen, aber das gilt auch für die meisten anderen Tierarten mit hoch differenzierten Sehsystemen, etwa viermal in der Sekunde die Blickrichtung wechseln, um die Sehwelt zu erkunden oder Bilder auf ihren Gehalt hin abzutasten. Dies bedeutet, dass die Vergleichsoperationen zwischen einlaufenden Sinnessignalen und dem gespeicherten Vorwissen in etwa 200 Millisekunden erfolgen muss. Wenn der Segmentierungsprozess ein vertrautes Objekt isoliert, ist auch der Erkennungsprozess innerhalb von wenigen hundert Millisekunden abgeschlossen. Dies bedeutet, dass auch das gesamte im Gehirn gespeicherte Wissen über Objekte, denen man im Laufe des Lebens begegnet ist, in einem Speicher abgelegt sein muss, der es erlaubt, auf beliebige Inhalte innerhalb von Bruchteilen einer Sekunde zuzugreifen.
In den heute für die Musterverarbeitung verwendeten Computersystemen ist für jeden gespeicherten Inhalt ein adressierbarer Speicherplatz reserviert und die Suche nach dem gewünschten, für den Abgleich erforderlichen Speicherinhalt erfolgt im Wesentlichen seriell. Diese einfache Strategie ist hoch effizient, weil Elektronenrechner mit sehr hoher Taktfrequenz arbeiten können und deshalb die Suchzeiten erträglich sind. Im Gehirn kann eine solche Strategie keinesfalls realisiert sein, da die Zeitkonstanten, mit denen Neuronen arbeiten, um viele Größenordnungen länger sind als die von Transistoren. Es muss also ein anderes Prinzip verwirklicht sein. Es muss ein Speicherplatz konfiguriert werden, in dem eine unvorstellbare Zahl von Inhalten so gestapelt werden kann, dass auf sie ein parallel strukturierter Suchprozess angewandt werden kann, sodass die Zugriffszeit nur unwesentlich von der Lage des zu suchenden Inhaltes abhängt. Bei einer seriellen Anordnung wie in den Speichern von Elektronenrechnern dauert die Suche nach Inhalten am Ende der Liste naturgemäß länger als für solche, die am Anfang stehen. Dies scheint bei dem im Gehirn realisierten Speicherprozess nicht der Fall zu sein. Es muss also ein Raum geschaffen werden, der die Überlagerung einer sehr großen Zahl von Inhalten erlaubt und es ist leicht zu sehen, dass ein solcher Raum eine sehr hohe Dimensionalität aufweisen muss. Der dreidimensionale kartesianische Raum, in diesem Fall also eine anatomisch segregierte Anordnung von Inhalten, scheidet aus. Hochdimensionale Räume können jedoch erschlossen werden, wenn die Zeit als Kodierungsdimension hinzugezogen wird und der Raum durch distinkte Zustände eines dynamischen Systems definiert wird. In diesem Fall muss dafür gesorgt werden, ein dynamisches System zu erzeugen, dass eine sehr, sehr große Zahl unterschiedlicher Zustände annehmen kann. Jedem dieser Zustände könnte dann ein ganz bestimmter Inhalt zugeordnet werden. Es muss dann lediglich eine Möglichkeit gefunden werden, dass dieses System beim Eintreffen der Suchsignale, in unserem Fall der Signale von Sinnesorganen, sehr schnell in den Zustand einschwingt, der einem gespeicherten Inhalt entspricht.
Die Arbeitshypothese, die wir in Frankfurt seit geraumer Zeit verfolgen, geht davon aus, dass die Großhirnrinde als ein dynamisches System verstanden werden kann, das die geforderten Eigenschaften aufweist. Eines der dominierenden Verschaltungsprinzipien ist, dass Neuronengruppen in der Großhirnrinde reziprok miteinander verbunden sind, sich also gegenseitig beeinflussen können. Wegen der riesigen Zahl von Neuronen, die in einem bestimmten Hirnrindenareal miteinander wechselwirken können, entsteht eine ungeheuer komplexe, hochdimensionale Dynamik, die den erforderlichen Kodierungsraum bereitstellen könnte. Hinzukommt, und das ist eine Entdeckung, die wir in Frankfurt vor mehr als zwanzig Jahren machten, dass lokale Gruppen von Neuronen – die Knoten im Netzwerk – wie Oszillatoren schwingen können (Abb. 1). Dies erhöht noch einmal mehr die Komplexität der möglichen Dynamik, da auch der Phasenraum zur Kodierung mit genutzt werden kann.
Falls die Großhirnrinde tatsächlich hochdimensionale Dynamik nutzt, um den Abgleich von einlaufenden Signalen mit gespeicherten Inhalten vorzunehmen, dann müssen eine Reihe von überprüfbaren Voraussagen zutreffen. Bei der Formulierung dieser Voraussagen standen die Ergebnisse von theoretischen Arbeiten und Simulationsstudien über künstliche neuronale Netzwerke Pate.
Die Eigenschaften solcher Netzwerke werden seit etwa einer Dekade untersucht, weil sie wegen ihrer hochdimensionalen Dynamik bestimmte Vorteile für die maschinelle Klassifizierung von raumzeitlich strukturierten Mustern aufweisen. Diese informationsverarbeitende Strategie wurde unter dem Namen reservoir computing bekannt. Wenn raumzeitlich strukturierte Eingangssignale an einige Knoten solcher Netzwerke verteilt werden, findet man, dass aufgrund der Wechselwirkungsdynamik die Information über den verwendeten Reiz eine Weile gespeichert bleibt und dass sich die Aktivitätsmuster von sequenziell dargebotenen Reizen überlagern, sodass zu einem bestimmten Zeitpunkt die Informationen über mehrere Reize gleichzeitig verfügbar ist. Und schließlich erweist sich, dass solche Systeme wegen der hohen Dimensionalität ihres Zustandsraumes die Trennung und Klassifizierung von Eingangsmustern sehr erleichtern.
Bestätigte Voraussagen und Überraschungen
Ein Schwerpunkt unserer Arbeiten lag in den vergangenen Jahren darauf, die oben aufgeführten Voraussagen zu testen. Hierzu ist es erforderlich, die Aktivität einer großen Zahl (>50) von Neuronen (Knoten) der Großhirnrinde gleichzeitig zu erfassen, Sinnesreize darzubieten, die resultierende Netzwerkdynamik zu analysieren und mit Hilfe von Methoden aus dem Bereich des maschinellen Lernens dahingehend zu prüfen, ob reizspezifische Informationen in der raumzeitlichen Verteilung der neuronalen Aktivitätsmuster zu finden sind. Um diese Messungen durchführen zu können, werden Tieren in Vollnarkose haarfeine Elektroden in die Großhirnrinde implantiert, über die später die Aktivität der Nervenzellen registriert werden kann. Die hierbei eingesetzten Verfahren ähneln im Detail jenen, die bei Patienten angewandt werden, die aus diagnostischen Gründen Elektroden implantiert bekommen oder um Hirnstrukturen zu reizen, wie das bei der Therapie der Parkinsonschen Erkrankung routinemäßig erfolgt. Die Messungen selbst sind schmerzfrei und bedeuten für die Tiere keine wesentliche Einschränkung, da das Gehirn schmerzunempfindlich ist und die sehr feinen und flexiblen Elektroden bei sachgemäßer Implantation keine Schäden verursachen. Mit Hilfe solcher Untersuchungen konnten wir im Laufe der letzten Jahre die oben aufgeführten Voraussagen bestätigen und die eingangs formulierte Hypothese stützen (Abb. 2).
Wie so oft in der Grundlagenforschung zeigten die Daten aber auch vollkommen Unerwartetes. Es stellte sich heraus, dass es im Verlauf der Untersuchungen zunehmend leichter wurde, die von den dargebotenen Reizen erzeugten Aktivitätsmuster zu klassifizieren und den Reizen zuzuordnen (Abb. 3). Dies konnte nur bedeuten, dass das kortikale Netzwerk bestimmte, reizspezifische Merkmalskombinationen gelernt und dem Fundus von Vorwissen hinzugefügt hat. Offenbar bewirkte die wiederholte Darbietung der Reizmuster eine Veränderung der Netzwerkeigenschaften, die ihrerseits dafür sorgten, dass die entstehenden hochdimensionalen Muster im Netzwerk weniger überlappten und deshalb besser voneinander unterscheidbar wurden. Diese Vermutung erhält ihre direkte Bestätigung durch eine mathematische Analyse der respektiven Muster. Es zeigte sich tatsächlich, dass sich die durch verschiedene Reize erzeugten Muster immer weiter voneinander entfernten, je öfter die Reize dargeboten wurden.
Als Mechanismus für diese lernbedingten Veränderungen vermuten wir eine aktivitätsabhängige Veränderung der Effizienz der reziproken Verbindungen zwischen den Knoten. Hinweise für solche erfahrungsabhängigen Veränderungen der synaptischen Effizienz eben dieser Verbindungen hatten wir bereits vor Jahren in Experimenten erhalten, bei denen die Auswirkung von Umweltreizen auf die Ausreifung der Großhirnrinde untersucht wurde. Einen direkten und komplementären Hinweis für das Vorliegen eines solchen Mechanismus lieferte schließlich die Beobachtung, dass die neuronalen Netzwerke auch spontan und ohne jede Reizung die Aktivitätsmuster erzeugen, die von oft gesehenen Reizen hervorgerufen werden. Obgleich weder antizipiert noch gezielt gesucht, bilden diese zusätzlichen Befunde eine starke Stütze für die Hypothese, dass die hochdimensionale Dynamik kortikaler Netzwerke tatsächlich genutzt wird, um sensorische Signale mit gespeicherten Vorwissen zu vergleichen und im Falle der Stimmigkeit zu klassifizieren.
Plausibilitätskontrollen durch Simulationen
Jetzt stand es an zu klären, ob reizspezifische Veränderungen in der Stärke der reziproken Koppelungsverbindungen zwischen den Knoten tatsächlich eine Verbesserung der Klassifizierungsleistungen solcher Netzwerke mit sich bringen. Hierzu haben Andreea Lazar und Jochen Triesch auf konventionellen Rechnern rekurrent gekoppelte Netzwerke simuliert und die Koppelverbindungen mit adaptiven Synapsen ausgestattet, die ihre Effizienz in Abhängigkeit von der Struktur der auftretenden Aktivierungsmuster verändern können (Abb. 4).
Diese Modifikationen erfolgten nach Regeln, die bereits bei Untersuchungen von Lernvorgängen an realen neuronalen Strukturen erarbeitet worden waren. Die simulierten Netzwerke mit adaptiven Verbindungen wurden daraufhin mit unterschiedlichen Reizsequenzen aktiviert und es zeigte sich, dass sich die Klassifizierungsleistung dieser sich selbst adaptierenden Netzwerke mit wiederholter Reizdarbietung, man könnte auch sagen mit zunehmender Erfahrung, deutlich verbesserte und weit über das hinaus ging, was konventionelle rekurrierende Netzwerke zu leisten vermögen. Diese Kongruenz von experimentellen und simulierten Daten macht es in unseren Augen sehr wahrscheinlich, dass in der Großhirnrinde ein Kodierungsprinzip verwirklicht ist, das sich deutlich von allen bisher entweder postulierten oder in künstlichen Systemen realisierten Musterverarbeitungsprozessen unterscheidet. Sollte sich diese Vermutung in zukünftigen Untersuchungen bestätigen, wären wir einen Schritt weiter im Verständnis der nach wie vor rätselhaften Funktion der Großhirnrinde. Vielleicht, so die Hoffnung, wird uns das helfen, die ebenfalls rätselhaften Mechanismen besser zu verstehen, die jenen psychischen Erkrankungen zu Grunde liegen, die auf Störungen von Großhirnrindenfunktionen beruhen. Mit Sicherheit wird es möglich sein, die gewonnenen Erkenntnisse für die Entwicklung völlig neuartiger informationsverarbeitender Systeme zu nutzen.