Forschungsbericht 2014 - Max-Planck-Institute für experimentelle Medizin

Gedankenlesen: Wie Nervenzellen Sinnesreize darstellen und auslesen

Thought-reading: Decoding spike-based neuronal representations

Autoren

Gütig, Robert

Abteilungen

Max Planck Forschungsgruppe Theoretische Neurowissenschaften

Zusammenfassung

In welcher Weise verarbeiten die knapp 100 Milliarden Nervenzellen des menschlichen Gehirns Sinnesreize und Gedanken? Diese Frage zu beantworten ist eine der faszinierendsten Herausforderungen der Neurowissenschaften. Entgegen der Lehrbuchmeinung, dass Nervenzellen Informationen durch die Raten von Aktionspotenzialen darstellen, stärken experimentelle und theoretische Befunde in zunehmendem Maße alternative Hypothesen, nach denen neuronale Codes deutlich raffinierter sein könnten und z. B. auch die zeitlichen Intervalle zwischen Aktionspotenzialen verschiedener Zellen miteinbeziehen könnten.

Summary

The question how the almost 100 billion nerve cells of the human brain represent and process sensory stimuli and thoughts is one of the most fascinating challenges in neuroscience. Contrary to common belief that nerve cells encode information by the rate of action potential firing, a growing number of experimental and theoretical accounts is strengthening alternative hypotheses that neural codes could be more refined and for instance incorporate also temporal intervals between action potentials of different neurons.

Stellen Sie sich vor …

Stellen Sie sich vor, Sie wären heute Abend bei Ihrer besten Freundin Alice zu einem Videoabend eingeladen. Alice ist erst vor kurzem von einer Forschungsexpedition vom Planeten Mars zurückgekehrt und möchte Ihnen nun einige der auf dieser Reise entstandenen Videoaufzeichnungen vorführen. Allerdings hat die Sache einen Haken: Alice hat nämlich bei ihrer Expedition eine Videokamera der neuesten Generation verwendet. Diese Kamera vom Typ „RetinaCam“ unterscheidet sich erheblich von vorhergehenden Kamera-Generationen. Anstatt einfallendes Licht mittels eines Objektivs auf einen Film oder einen lichtempfindlichen Mikrochip zu fokussieren und aufzuzeichnen, bedient sich die RetinaCam der Optik und der Photorezeptoren des menschlichen Auges und erfasst lediglich die im optischen Nerv der Kamerafrau entstehende neuronale Aktivität. Alices RetinaCam-Videos bestehen also aus derjenigen neuronalen Aktivität, welche ihre Netzhaut während ihrer „Filmaufnahmen“ an ihr übriges zentrales Nervensystem gesandt hat. Um sich nun während des Videoabends ein Bild von Alices Reiseeindrücken machen zu können, müssen Sie sich, wie viele Neurowissenschaftler auch, als Codeknacker betätigen und versuchen, die neuronalen Codierungsprinzipien des menschlichen Gehirns zu entziffern.

Neuronale Codierung und Decodierung

Obwohl RetinaCams heute vermutlich noch einige Jahrzehnte von ihrer Markteinführung entfernt sind, gehört die Frage, in welcher Weise die knapp 100 Milliarden Nervenzellen des menschlichen Gehirns Sinnesreize und Gedanken repräsentieren, also mit neuronalen Signalen darstellen, und verarbeiten, zu einer der grundlegendsten und faszinierendsten Herausforderungen der Neurowissenschaften. Schon lange ist bekannt, dass ein Großteil der Kommunikation zwischen Nervenzellen über „Aktionspotenziale“ oder auch „Spikes“ genannte, elektrische Impulse vermittelt wird. So empfängt eine typische Nervenzelle die Aktivität von mehreren tausend ihr vorgeschalteten Zellen und summiert diese zu einem intrazellulären Spannungssignal, dem Membranpotenzial, auf. Anhand dieses zeitabhängigen Spannungssignals „entscheidet“ die Zelle von Moment zu Moment, ob sie aufgrund des eingehenden raum-zeitlichen Musters von Spikes selbst aktiv wird. Welche Eingangsaktivität eine Nervenzelle dazu veranlasst, selbst einen Spike zu erzeugen, hängt im Wesentlichen von ihren synaptischen Gewichten ab, also der individuellen Stärke mit denen Spikes, die auf den verschiedenen Eingangsleitungen der Zelle eintreffen, zum intrazellulären Membranpotenzial beitragen.

Aus Sicht einer einzelnen Nervenzelle erfordert eine erfolgreiche Decodierung ihrer Eingangsaktivität also das genaue Einstellen derjenigen synaptischen Konfiguration, mit der die Zelle ein gewünschtes Antwortverhalten realisieren kann. Bei menschlichen Versuchspersonen hat man zum Beispiel über Nervenzellen berichtet, die ihre Synapsen so eingestellt hatten, dass sie immer dann aktiv wurden, wenn bestimmte berühmte Personen des öffentlichen Lebens in ihrem “Sichtfeld” erschienen. Die so genannte “Bill-Clinton-Zelle” begann immer dann – und anscheinend auch nur dann – Spikes zu generieren, wenn dem Probanden eine Abbildung des ehemaligen US-Präsidenten Bill Clinton vorgelegt wurde [1]. In einer anderen Hirnregion, der primären Sehrinde, findet man weniger stark spezialisierte Zellen, die einfachere Bildmerkmale auslesen. So erforschten die späteren Nobelpreisträger David H. Hubel und Thorsten N. Wiesel in den 60er Jahren des vergangenen Jahrhunderts Zellen, welche auf gerichtete Balken oder Streifenmuster innerhalb ihrer rezeptiven Felder reagieren [2]. Die von ihnen gefundenen “simple cells” und “complex cells” unterscheiden sich dahingehend, dass simple cells nur auf bestimmte räumliche Positionierungen eines Musters reagieren, während die complex cells diesbezüglich deutlich weniger wählerisch sind.

Die synaptischen Gewichte, mit denen ein Neuron eine bestimmte Decodierungsfunktion realisieren kann, hängen empfindlich davon ab, in welcher Weise die auszulesende Information codiert ist. Seit vielen Jahrzehnten ist die hier vorherrschende Lehrbuchmeinung, dass Neurone Informationen maßgeblich durch ihre „Feuerraten“ codieren, also durch die mittlere Anzahl von Spikes innerhalb eines bestimmten Zeitfensters [3]. Auf der Grundlage dieser einfachen Ratenhypothese konnte das Verhalten vieler Nervenzellen erfolgreich beschrieben und erklärt werden. Jedoch haben Forschungsergebnisse innerhalb der vergangenen zwei Jahrzehnte in zunehmenden Maße ein komplexeres Bild neuronaler Repräsentationen gezeichnet, in dem auch andere Parameter der Aktivität, wie zum Beispiel die genauen zeitlichen Abstände zwischen den Spikes verschiedener Zellen erhebliche Information über physikalische Reize mit sich führen können [4; 5]. Die schon lange und kontrovers geführte Debatte, ob und wie Nervenzellen solche komplizierteren Repräsentationen von Informationen überhaupt auslesen können, wurde durch diese Ergebnisse weiter angefacht.

Das Tempotron-Neuronenmodell

Abb. 1: Schematisch Darstellung eines Tempotron-Neuronenmodells. Neuronale Aktivitätsmuster (links oben) erreichen das Nervenzellenmodell (rechts) über verschiedene Eingänge, welche jeweils die Spikeaktivität einzelner Ganglienzellen übertragen. In den zwei dargestellten Aktivitätsmustern (rot und blau) repräsentiert jeder Strich einen Spike der Netzhaut. Die Nervenzelle gewichtet jeden ankommenden Spike mit dem synaptischen Gewicht des entsprechenden Eingangs und summiert die erzeugten postsynaptischen Potentiale (rechtes Schema) zum zeitabhängigen intrazellulären Spannungssignal auf (unten rechts). Die Spannungssignale (rote und blaue Kurven) sind in Einheiten der neuronalen Feuerschwelle ϑ (gepunktete Line) dargestellt. Während die Nervenzelle bei dem visuellen Reiz, welcher das blaue Aktivitätsmuster erzeugt hat, die Feuerschwelle überschreitet, also selbst einen Spike generiert, bleibt die neuronale Antwort auf den Reiz, welcher das rote Aktivitätsmuster erzeugt hat, unterschwellig, sodass die Zelle inaktiv bleibt. — **Abb. 1**: Schematisch Darstellung eines Tempotron-Neuronenmodells. Neuronale Aktivitätsmuster (links oben) erreichen das Nervenzellenmodell (rechts) über verschiedene Eingänge, welche jeweils die Spikeaktivität einzelner Ganglienzellen übertragen. In den zwei dargestellten Aktivitätsmustern (rot und blau) repräsentiert jeder Strich einen Spike der Netzhaut. Die Nervenzelle gewichtet jeden ankommenden Spike mit dem synaptischen Gewicht des entsprechenden Eingangs und summiert die erzeugten postsynaptischen Potentiale (rechtes Schema) zum zeitabhängigen intrazellulären Spannungssignal auf (unten rechts). Die Spannungssignale (rote und blaue Kurven) sind in Einheiten der neuronalen Feuerschwelle ϑ (gepunktete Line) dargestellt. Während die Nervenzelle bei dem visuellen Reiz, welcher das blaue Aktivitätsmuster erzeugt hat, die Feuerschwelle überschreitet, also selbst einen Spike generiert, bleibt die neuronale Antwort auf den Reiz, welcher das rote Aktivitätsmuster erzeugt hat, unterschwellig, sodass die Zelle inaktiv bleibt.

© Max-Planck-Institut für experimentelle Medizin/Gütig; mit freundlicher Genehmigung aus [8]

**Abb. 1**: Schematisch Darstellung eines Tempotron-Neuronenmodells. Neuronale Aktivitätsmuster (links oben) erreichen das Nervenzellenmodell (rechts) über verschiedene Eingänge, welche jeweils die Spikeaktivität einzelner Ganglienzellen übertragen. In den zwei dargestellten Aktivitätsmustern (rot und blau) repräsentiert jeder Strich einen Spike der Netzhaut. Die Nervenzelle gewichtet jeden ankommenden Spike mit dem synaptischen Gewicht des entsprechenden Eingangs und summiert die erzeugten postsynaptischen Potentiale (rechtes Schema) zum zeitabhängigen intrazellulären Spannungssignal auf (unten rechts). Die Spannungssignale (rote und blaue Kurven) sind in Einheiten der neuronalen Feuerschwelle ϑ (gepunktete Line) dargestellt. Während die Nervenzelle bei dem visuellen Reiz, welcher das blaue Aktivitätsmuster erzeugt hat, die Feuerschwelle überschreitet, also selbst einen Spike generiert, bleibt die neuronale Antwort auf den Reiz, welcher das rote Aktivitätsmuster erzeugt hat, unterschwellig, sodass die Zelle inaktiv bleibt.

© Max-Planck-Institut für experimentelle Medizin/Gütig; mit freundlicher Genehmigung aus [8]

Ein wichtiger Schritt zur Beantwortung der Frage, welche Codierungsprinzipien dem Gehirn zur Verfügung stehen, wurde durch die Entwicklung des so genannten Tempotrons vollzogen (Abb. 1). Kern dieses lernenden Neuronenmodells ist eine synaptische Lernregel, die es ermöglicht, die Synapsen des Neurons so zu verändern, dass dieses ein gewünschtes, von außen vorgegebenes Antwortverhalten anstrebt. Die Lernregel ist insbesondere darauf ausgelegt, Neuronenmodelle zu trainieren, sodass sie binäre Klassifikationsaufgaben lösen, also bei bestimmten Aktivitätsmustern Spikes generieren, bei anderen hingegen inaktiv bleiben.

Mit Hilfe von speziell konstruierten Aktivitätsmustern und über diese definierte Klassifikationsaufgaben lässt sich nun systematisch prüfen, welche Arten von Repräsentationen von einem gegebenen Neuronenmodell decodiert werden können und welche nicht. In einer der ersten Anwendungen gelang es mit Hilfe des Tempotrons zu zeigen, dass selbst einfache, biologisch plausible Nervenzellmodelle sehr wohl in der Lage sind, Informationen auszulesen, die durch relative Spikezeiten repräsentiert sind. Insbesondere funktionierte diese spikezeitbasierte Verarbeitung auch dann, wenn die Feuerraten der zu klassifizierenden Aktivitätsmuster keinerlei Information über deren Klassenzugehörigkeit beinhalteten [6]. Darüber hinaus ermöglichte das Tempotron die Untersuchung der intrazellulären Verarbeitungsmechanismen, mit denen bestimmte Decodierungsleistungen innerhalb einzelner Zellen implementiert werden können [7].

Spikezeitbasierte visuelle Informationsverarbeitung

Um zu zeigen, dass spikezeitbasierte neuronale Informationsverarbeitung nicht nur eine theoretische Möglichkeit ist, sondern auch zu erheblich verbesserten Verarbeitungsleistungen echter neuronaler Aktivität führen kann, konfrontierten Max-Planck-Forscher das Tempotron mit dem eingangs beschriebenen “RetinaCam-Problem” [8].

Sie bedienten sich hierzu eines an der Harvard Universität erhobenen Datensatzes [4], welcher die Aktivitätsmuster von retinalen Ganglienzellverbänden beinhaltete, also von spikenden Neuronen der Ausgangszellschicht der Netzhaut. Anhand der verschiedenen visuellen Reize, welche zu den gemessenen Aktivitätsmustern geführt hatten, definierten die Forscher zwei verschiedene Diskriminationsaufgaben für nachgeschaltete Neuronenmodelle. Die erste, einfachere Aufgabe erforderte die Unterscheidung zwischen Reizen, die an einer bestimmten Bildstelle hell bzw. dunkel waren (Helligkeitsdiskrimination). Im Gegensatz dazu erforderte die zweite, schwierigere Aufgabe das Detektieren einer visuellen Kante (Kantendetektion) und zwar in Analogie zu den oben erwähnten complex cells unabhängig davon, ob die Kante von hell nach dunkel oder von dunkel nach hell ausgerichtet war. Für die Helligkeitsdiskrimination benötigte ein Neuronenmodell deutlich weniger Eingangsspikes, wenn es für die Klassifikation der Aktivitätsmuster auf die Spikezeiten zurückgreifen konnte. Die gemessenen neuronalen Repräsentationen könnten im Gehirn also wesentlich schneller verarbeitet werden, wenn die entsprechenden Neurone eine spikezeitbasierte Decodierung anstelle eines ratenbasierten Decodierungsansatzes implementierten. Darüber hinaus war die schwierigere Kantendetektionsaufgabe mit dem ratenbasierten Decodierungsansatz von einer Zelle alleine überhaupt nicht zu lösen und würde stattdessen, wie bereits von Hubel und Wiesel vorgeschlagen, mehrschichtige Netzwerkstrukturen erfordern. Durch Verwendung der zeitlichen Repräsentation jedoch wurde die Unterscheidung zwischen den verschiedenen Stimuli sehr viel leichter und konnte ohne Schwierigkeiten von einem einzelnen Tempotron gelöst werden. Schließlich konnten die Max-Planck-Forscher zeigen, dass, zumindest in dem vorliegenden Datensatz, die spikezeitbasierte Decodierung wesentlich robuster in Bezug auf Kontrastvariationen der visuellen Reize ist als die ratenbasierte Alternative. Dies liegt daran, dass Kontrastvariationen zwar deutliche Auswirkungen auf die Anzahl der erzeugten Spikes haben, aber die relativen zeitlichen Abstände zwischen den frühesten Spikes verschiedener Ganglienzellen nur unwesentlich beeinflussen.

Ausblick

Die Forschungsgruppe Theoretische Neurowissenschaften am Max-Planck-Institut für experimentelle Medizin hat das hier vorgestellte binäre Tempotron inzwischen bedeutend weiterentwickelt. Dieser Fortschritt beruht auf einer neuartigen Lösung des wichtigen “temporal credit assignment”-Problems, also der Frage, wie lernende Neurone vergangene sensorische Reize mit später eintreffendem Verhaltensfeedback assoziieren können. Netzwerke von Tempotrons sind heute in der Lage, auch selten auftretende, komplexe sensorische Merkmale innerhalb langer Aktivitätssequenzen ohne jegliche äußere Überwachung ausfindig zu machen. Während modernste Bildgebungstechnologien die RetinaCam an die Grenze des technisch Machbaren gerückt haben, machen die Fortschritte der Theorie spikender neuronaler Netze ihr Gegenstück zumindest vorstellbar: den “RetinaPlayer”.