Forschungsbericht 2013 - Max-Planck-Institut für Psycholinguistik

Computermodelle für Spracherwerb und Sprachproduktion

Autoren

Fitz, Hartmut

Abteilungen

Neurobiologie der Sprache, Nijmegen

Zusammenfassung

Relativsätze sind ein syntaktisches Mittel, um komplexe Satzstrukturen zu erzeugen, und machen Sprache strukturell produktiv. Wie Kinder Relativsätze erlernen und wie diese im Sprachsystem verarbeitet werden, ist trotz einer Vielzahl experimenteller Studien weitestgehend unklar. Durch den Einsatz eines computerbasierten Lernmodells haben Wissenschaftler des MPI für Psycholinguistik neue Aufschlüsse erlangt. Das Modell erklärt die unterschiedliche Entwicklung von Relativsätzen im Englischen sowie sprachübergreifende Unterschiede.

Der Satzbau natürlicher Sprachen ist kombinatorisch, das heißt Sätze sind aus einfacheren Bausteinen zusammengesetzt, und dies unterscheidet sie von Kommunikationsformen im Tierreich [1]. Ein Beispiel hierfür sind Relativsätze, die es erlauben, verschachtelte Satzstrukturen zu bilden. Wie lernen Kinder diesen komplexen sprachlichen Mechanismus, welche Faktoren spielen bei der Verarbeitung solcher Sätze eine Rolle und welche Unterschiede gibt es zwischen typologisch verschiedenen Sprachen? Um diese Fragen zu untersuchen, bauen Forscher am MPI für Psycholinguistik Computermodelle, die die Verarbeitung komplexer Syntax simulieren sollen.

Nutzen und Notwendigkeit von Computermodellen

Computermodelle sind vollständig explizite Theorien, die keine begriffliche Vagheit oder unzureichend spezifizierte Bestandteile zulassen. Mit Hilfe solcher Modelle können Eigenschaften des Sprachsystems simuliert und psycholinguistische Hypothesen getestet werden. Die Modellbildung erfordert eine Reduktion der enormen Komplexität sprachverarbeitender Prozesse und lenkt den Blick auf das Wesentliche. Computermodelle liefern exakt replizierbare Daten und oftmals neuartige, transparente Erklärungsansätze. Darüber hinaus ermöglichen sie präzise, quantitative Vorhersagen, die dann experimentell überprüft werden können [2].

Kinder lernen ihre Muttersprache durch Erfahrung und den Gebrauch von Sprache in kommunikativer Interaktion. Dabei scheint die relative Häufigkeit von Worten, Phrasen und Satzkonstruktionen in ihrer Lernumgebung eine zentrale Rolle zu spielen [3]. Es ist jedoch praktisch unmöglich oder zumindest unethisch, die natürliche Sprachumgebung eines Kindes zu manipulieren. Insbesondere für unser Verständnis des kindlichen Spracherwerbs ist der Einsatz von computerbasierten Lernmodellen daher unerlässlich. Um kausale Erklärungen zu erhalten, die über Input-output-Korrelationen hinausgehen, ist es notwendig, die Parameter eines Lernmodells sowie die Zusammensetzung von dessen Sprachumgebung systematisch variieren zu können.

Das Dual-path-Modell ist ein strukturiertes neuronales Netz, das sowohl die Sprachproduktion als auch Teilaspekte des Spracherwerbs simulieren kann [4]. Es besteht aus zwei getrennten, interaktiven Systemen zur Verarbeitung sprachlicher Information (Abb. 1).

Abb.1: Schematische Darstellung der Architektur des Dual-path-Modells (vereinfacht) [4]. Der Informationsfluss erfolgt in Pfeilrichtung. — **Abb.1:** Schematische Darstellung der Architektur des Dual-path-Modells (vereinfacht) [4]. Der Informationsfluss erfolgt in Pfeilrichtung.

© Max-Planck-Institut für Psycholinguistik/ Fitz

**Abb.1:** Schematische Darstellung der Architektur des Dual-path-Modells (vereinfacht) [4]. Der Informationsfluss erfolgt in Pfeilrichtung.

© Max-Planck-Institut für Psycholinguistik/ Fitz

Der semantische Pfad repräsentiert satzspezifische Bedeutungen (z. B. Begriffe und semantische Rollen), der sequenzielle Pfad abstrakte syntaktische Konstruktionen (z. B. die Abfolge von Wortklassen in transitiven Sätzen). Als Eingabe erhält das Modell die semantische Struktur eines Ereignisses und es lernt dieses durch einen grammatisch wohlgeformten Satz der englischen Sprache zu beschreiben. Dabei wird die Diskrepanz zwischen den aktivierten und den tatsächlich korrekten Wörtern als Fehlersignal benutzt, um die synaptischen Verbindungen zwischen Neuronen des Modells anzupassen. Allmählich werden die Äußerungen des Modells dadurch zielgenauer. Am Ende des Lernprozesses ist die syntaktische Struktur der erlernten Sprache in den synaptischen Verbindungen kodiert und das Modell in der Lage, auch neuartige Sätze zu generieren.

Der Erwerb komplexer Syntax

Der unterschiedliche Erwerb von Relativsätzen wurde in einem Elicited-production-Experiment getestet [5]. Englischsprachige Kinder im Alter von circa viereinhalb Jahren sollten Äußerungen nachsprechen, die auch Relativsätze enthalten konnten. Dabei unterscheiden die Autoren zwischen intransitiven (S) und transitiven Subjekt-Relativsätzen (A) sowie zwischen Relativsätzen mit direkten (P), indirekten (IO) und obliquen (OBL) Objekten:

(S) There is the cat that slept.

(A) There is the cat that chased the dog.

(P) There is the cat that the dog chased.

(IO) There is the cat that the man gives the toy to.

(OBL) There is the cat that the man plays with.

Die Ergebnisse dieser Studie sind in Abbildung 2 zusammengefasst.

Abb. 2: Der Erwerb von Relativsätzen bei Kindern [5] im Vergleich zum Dual-path-Modell [8]. — **Abb. 2**: Der Erwerb von Relativsätzen bei Kindern [5] im Vergleich zum Dual-path-Modell [8].

© Max-Planck-Institut für Psycholinguistik/ Fitz

**Abb. 2**: Der Erwerb von Relativsätzen bei Kindern [5] im Vergleich zum Dual-path-Modell [8].

© Max-Planck-Institut für Psycholinguistik/ Fitz

In der Sprachproduktion folgen Erwachsene einem ähnlichen Muster und überraschenderweise auch deutschsprachige Kinder, obwohl Relativsätze im Deutschen sich vom Englischen deutlich unterscheiden. Die zwei wichtigsten psycholinguistischen Theorien zur Relativsatzverarbeitung besagen, dass die relative Schwierigkeit von (A) der linearen, bzw. (B) der syntaktischen Distanz der modifizierten Nominalphrase zu seiner kanonischen Position im Relativsatz abhängt [6]. Beide Theorien können jedoch die Ergebnisse in [5] nicht zufriedenstellend erklären.

Das Dual-path-Modell wurde zunächst erweitert, um den Erwerb komplexer Syntax zu ermöglichen [7]. Es wurde dann trainiert, um die oben genannten Satzkonstruktionen zu generieren, und periodisch getestet. Nach 10.000 Trainingsepisoden erreichte es eine Genauigkeit von über 90 Prozent [8]. In einem frühen Entwicklungsstadium zeigte das Modell differenzielle Lernfortschritte, die dem der in [5] getesteten Kinder sehr nahe kommen (Abb. 2).

In der Analyse dieser Simulation zeigte sich, dass keine uniforme Erklärung, wie sie die Theorien (A) und (B) postulieren, für alle Relativsatztypen zu erwarten ist. Das Modell beginnt den Lernprozess bei null, es muss zeitgleich Repräsentationen für alle Strukturen in seiner Sprachumgebung erlernen und deren Syntax kodieren. Das hat zur Folge, dass diese Strukturen auf vielfältige Weise miteinander um die verfügbaren synaptischen Ressourcen konkurrieren. Beispielsweise können transitive Strukturen im Aktiv oder Passiv auftreten, wohingegen Intransitive nicht alternieren. Dies erklärt, warum S-Relativsätze schneller gelernt wurden als A- und P-Relativsätze. Zugleich teilen S-Relativsätze Substrukturen mit A-Relativsätzen und diese Übereinstimmung erklärt, warum Letztere für das Modell einfacher zu lernen waren als P-Relativsätze. Das Dual-path-Modell legt eine multifaktorielle Erklärung nahe, die sich nicht auf eine einfache Metrik reduzieren lässt.

Für Theorien des Spracherwerbs bedeutet dies zweierlei. Satzkonstruktionen lassen sich nicht ohne Weiteres von der Gesamtheit des sprachlichen Inputs isolieren und getrennt betrachten. Warum Kinder eine Struktur X eher lernen als Y hängt von Faktoren ab, die nicht intrinsisch X und Y betreffen, sondern auch andere Strukturen Z, die den Erwerb von X und Y in unterschiedlicher Form beeinflussen können. Und zweitens sind Erklärungsansätze, die auf linguistisch motivierten syntaktischen Strukturen beruhen, für die Erforschung des Spracherwerbs eventuell nur von begrenztem Nutzen. Letztlich können nur konkrete, mechanistische Lernmodelle Aufschluss darüber geben, wie Syntax erlernt und im Gehirn repräsentiert wird.

Typologische Unterschiede

Die Syntax von Relativsätzen variiert stark in typologisch verschiedenen Sprachen. In europäischen Sprachen sind Relativsätze Nominalphrasen nachgeordnet und modifizieren diese. In ostasiatischen Sprachen hingegen sind sie Nominalphrasen oft vorgelagert und ähneln in ihrer Funktion Adjektiven. Hinzu kommt, dass Sprachen sich in ihrer dominanten Wortstellung unterscheiden können. Trotz dieser Unterschiede bleibt die syntaktische Komplexität von Objekt-Relativsätzen größer als die von Subjekt-Relativsätzen. Die Theorie (B) (siehe oben) besagt daher, dass es eine universelle Präferenz für Subjekt-Relativsätze geben müsse.

Um diese Hypothese zu testen, wurde das Dual-path-Modell trainiert, um Relativsätze in vier verschiedenen Sprachen zu produzieren, Japanisch, Chinesisch (Mandarin), Englisch und Deutsch. Alle vier Modelle hatten identische Parameter, die gleiche Semantik, erhielten denselben Sprachinput, und beide Typen von Relativsätzen waren gleich häufig. Lediglich die zu lernenden Satzformen waren unterschiedlich und sprachspezifisch. Die Resultate dieser Simulation zeigen, dass im Englischen und Deutschen Subjekt-Relativsätze, im Chinesischen dagegen Objekt-Relativsätze schneller und besser gelernt wurden. Im Japanischen wurde kein statistisch signifikanter Unterschied festgestellt.

Folglich sagt das Modell voraus, dass es keine universelle Präferenz gibt; die relative Schwierigkeit in der Verarbeitung komplexer Satzkonstruktionen ist von Sprache zu Sprache unterschiedlich. Diese Ergebnisse werden auch durch Daten aus der Korpuslinguistik gestützt. Die Anzahl der von Kindern spontan geäußerten Subjekt- bzw. Objekt-Relativsätze folgt in allen vier Sprachen den Vorhersagen des Modells. Der Grund für die beobachteten sprachspezifischen Unterschiede liegt erneut in der Tatsache begründet, dass das Dual-path-Modell sein sprachliches Wissen erlernen muss und hierfür stehen nur begrenzte synaptische Ressourcen zur Verfügung. Da sowohl einfache Satzkonstruktionen als auch Relativsätze in verschiedenen Sprachen unterschiedlich realisiert sind, erzeugt der syntaktische Kodierungsprozess sprachspezifische Lernkurven.

Adaptation bei Erwachsenen

Eine stetig steigende Anzahl von Studien zeigt, dass auch das Sprachvermögen von Erwachsenen flexibel und adaptiv bleibt. Sprachliche Repräsentationen können durch Erfahrung und den Gebrauch von Sprache auch im erwachsenen Gehirn verändert werden. Ein Beispiel hierfür ist das sogenannte syntaktische priming. Das Dual-path-Modell erklärt diese adaptiven Effekte als eine Form des impliziten Lernens [4]. Es stellt somit ein Bindeglied dar zwischen kindlichem Spracherwerb und der Sprachverarbeitung bei Erwachsenen, die in der Psycholinguistik zumeist getrennt betrachtet worden sind [9].

Allerdings können gegenwärtige Modelle – das Dual-path-Modell eingeschlossen – Aspekte des menschlichen Sprachvermögens lediglich auf der Verhaltensebene erklären, sie modellieren nicht die neuronale Infrastruktur des Gehirns wie etwa die Elektrodynamik von Nervenzellen oder kortikale Plastizität. Es bleibt daher eine große Herausforderung für zukünftige Forschungsprojekte, Modelle des Sprachsystems zu entwickeln, die neurobiologisch fundiert sind.

Literaturhinweise

Hauser, M.; Chomsky N.; Fitch, T.

The faculty of language: What is it, who has it, and how did it evolve?

Science 298, 1569–1579 (2002)

Chang, F.; Fitz, H.

Computational models of sentence production: A Dual-path approach

Ferreira, V.; Goldrick, M.; Miozzo, M.(Hsrg.), The Oxford Handbook of Language Production, Kapitel 4. Oxford University Press (2014)

Tomasello, M.

Constructing a language. A usage-based theory of language acquisition

Harvard University Press. Cambridge, MA (2003)

Chang, F.; Dell, G.; Bock, K.

Becoming syntactic

Psychological Review 113, 234-272 (2006)

Diessel, H.; Tomasello, M.

A new look at the acquisition of relative clauses

Language 81, 882-906 (2005)

Gordon, P.; Lowder, M.

Complex sentence processing: A review of theoretical perspectives on the comprehension of relative clauses

Language and Linguistics Compass 6(7), 403-415 (2012)

Fitz, H.

Neural syntax

Institute for Logic, Language and Computation dissertation series, University of Amsterdam (2009)

Fitz, H.; Chang, F.; Christiansen, M.

A connectionist account of the acquisition and processing of relative clauses

Kidd, E. (Hrsg), The Acquisition of Relative Clauses: Processing, Typology and Function, Kapitel 2. John Benjamins, Amsterdam (2011)

Chang, F.; Janciauskas, M.; Fitz, H.

Language adaption and learning: Getting explicit about implicit learning

Language and Linguistics Compass 6, 259-278 (2012)