Forschungsbericht 2005 - Max-Planck-Institut für Psycholinguistik

Aspekte der Sprachproduktion

Autoren

Sprenger, Simone

Abteilungen

Sprachproduktion (Prof. Dr. Peter Hagoort)
MPI für Psycholinguistik, Nijmegen

Zusammenfassung

Die Fähigkeit des Menschen, seine Gedanken in Worte zu fassen und zu artikulieren, definiert das Forschungsgebiet der Sprachproduktion. Im Mittelpunkt steht die Frage, wie kognitive Repräsentationen (also das im Hirn gespeicherte Wissen) und Denkprozesse zusammenwirken, um den so mühelos erscheinenden Prozess des Sprechens zu ermöglichen. Die hier dargestellten Untersuchungen befassen sich mit den semantischen, syntaktischen und phonologischen Teilprozessen des Sprechens sowie mit deren Beziehungen zu eng verwandten kognitiven Fähigkeiten.

Das Forschungsgebiet der Sprachproduktion beschäftigt sich mit der Fähigkeit des Menschen, seine Gedanken zu artikulieren. Die Wissenschafler untersuchen, wie kognitive Repräsentationen und Verarbeitungsschritte zusammenwirken, um den Prozess des Sprechens zu ermöglichen. Aus der Sicht der Sprachpsychologen erweist sich schon die einfache Benennung eines Objektes (z. B. einer Tasse) als komplexer, mehrstufiger Prozess, der auf eine ganze Reihe unterschiedlicher mentaler Repräsentationen zurückgreift. Im Falle der Tasse aktivieren wir nacheinander die konzeptuelle Bedeutungsrepräsentation, die Information über grammatikalische Eigenschaften des Wortes (z. B. „Einzahl“, „sächlich“, zusammengefasst im so genannten Lemma) und die Klangform des Wortes Tasse. Erst danach erfolgt die eigentliche Artikulation des Wortes. Wir verfügen als Sprecher über einen Wissensspeicher im Langzeitgedächtnis, der zu jedem Wort, das wir kennen, die notwendigen Konzepte, Lemmata und Klangformrepräsentationen bereithält: das mentale Lexikon. Anders als bei einem gewöhnlichen Lexikon muss man jedoch erst herausfinden, wie es aufgebaut ist und wie man darin ein Wort „nachschlägt”.

Der Einfluss von Kontextbildern auf die Wortbenennung

Lese- und Bildbenennungsaufgaben gehören zum Standardrepertoire der Sprachpsychologen bei der Erforschung des Sprechens. Sprecher sehen das Bild einer Tasse und antworten Tasse. Erscheint zusätzlich das geschriebene Wort Kaffee, so fällt dem Sprecher die Antwort leichter, da die Konzepte beider Wörter Teil eines gemeinsamen Netzwerks sind. Das geschriebene Wort Kaffee aktiviert sowohl seinen eigenen „Konzeptknoten“ als auch den des Konzepts Tasse. Damit steht Tasse dem Sprachverarbeitungssystem schneller zur Verfügung.

Bittet man Sprecher, das geschriebene Wort zu benennen und das Bild „außer Acht zu lassen“, so stellt man fest, dass dies meist nicht gelingt: die Art des abgebildeten Objektes beeinflusst die Reaktionszeit für das geschriebene Wort. Es war jedoch bisher strittig, wie weit genau die Aktivierung des „unbeachteten” Bildnamens reicht: wird allein sein Konzept aktiviert oder auch sein Lemma? Zeigt man Versuchspersonen Kombinationen von semantisch (Bedeutungs-)verwandten Bildern und Wörtern (zum Beispiel das Bild einer Kanne mit dem Wort Tasse), so fällt ihnen die Benennung des Wortes leichter. Auch das Konzept des Bildes ist also aktiv, obwohl es selbst nicht benannt werden soll. Dass sogar das Lemma des Bildnamens in diesem Fall aktiv wird, zeigt sich darin, dass die Benennung des Bildes als die Tasse auch dann leichter vonstatten geht, wenn das Bild einzig in Bezug auf sein grammatikalisches Geschlecht mit dem Wort Tasse übereinstimmt. Diese semantischen und grammatikalischen Effekte sind jedoch nur dann messbar, wenn die Leseaufgabe einen aktiven Zugriff auf diese Verarbeitungsebenen erfordert. Wird der geschriebene Stimulus um den bestimmten Artikel erweitert (sodass die Versuchsperson diesen nur noch ablesen muss anstatt das Lemma selbst im mentalen Lexikon nachzuschlagen), so geht der semantische Effekt verloren. Auch wenn statt eines Kontextbildes ein zweites geschriebenes Wort angeboten wird, ist kein semantischer Effekt mehr nachweisbar. Anders als bei der Verarbeitung von Kontextbildern führen Kontextwörter also nicht automatisch zu einer Konkurrenz im Lexikon.

Komposita als Teile des Netzwerks

Die Verwandtschaft zwischen Wörtern erstreckt sich nicht nur auf die Ebenen der Bedeutung und der grammatikalischen Eigenschaften, sondern auch zum Beispiel auf die der Morphologie und der Klangform. Eine Theorie des mentalen Lexikons muss diese Beziehungen abbilden, um den Zugriff auf die einzelnen Verarbeitungseinheiten während des Sprechens erklären zu können. Eine Untersuchung zur Verarbeitung morphologisch komplexer Wörter am Beispiel von Komposita – zusammengesetzte Wörter – wirft neues Licht auf diese Prozesse. Dabei wurde die Tatsache genutzt, dass ein häufig vorkommendes Wort wie Hand sehr viel einfacher zu benennen ist als ein seltenes Wort wie Haube. Der Häufigkeitseffekt ist damit ein wichtiger Indikator für die relative Verfügbarkeit der verschiedenen Einträge im mentalen Lexikon. Angesichts der enormen Speicherkapazität des mentalen Lexikons wäre es denkbar, dass Komposita über einen eigenen Eintrag verfügen. Die Verfügbarkeit von Komposita für den Sprecher müsste sich dann mithilfe der Vorkommenshäufigkeit des Kompositums selbst vorhersagen lassen, nicht jedoch mit der seiner Einzelmorpheme. Alternativ wäre denkbar, dass nur ein Verweis auf die Einzelmorpheme (Hand, Ball) gespeichert ist und dass diese dann bei Bedarf miteinander kombiniert werden (zu Handball).

Sowohl die Frequenz der Einzelmorpheme als auch die des Kompositums selbst lassen sich im Experiment systematisch manipulieren. So konnten Komposita verglichen werden, die sich nur bezüglich des ersten Morphems unterscheiden (z. B. Handball und Softball) und die beide dieselbe Auftretenswahrscheinlichkeit besitzen. Es zeigt sich, dass Komposita mit einem häufig vorkommenden Anfangsmorphem von Versuchspersonen signifikant schneller ausgesprochen werden als Komposita mit seltener vorkommenden Anfangsmorphemen. Ein ähnlicher, wenngleich etwas geringerer Effekt, lässt sich für die zweite Morphemposition nachweisen. Auch hier führt eine hohe Morphemfrequenz zu schnelleren Reaktionszeiten in einer Benennungsaufgabe. Die Auftretenshäufigkeit des Kompositums selbst hat jedoch kaum einen Effekt. Eine zusammenfassende Analyse der Experimentreihe mit einer Vielzahl unterschiedlicher Frequenzmaße als mögliche Einflussfaktoren ergab, dass die Verfügbarkeit eines Kompositums sich am besten mithilfe einer Kombination verschiedener Maße schätzen lässt, die sowohl die Morphemfrequenz als auch die Struktur des Lexikons berücksichtigen. Die Annahme, daß Komposita ähnlich monomorphemischer Wörter mit einem eigenen Eintrag im Lexikon gespeichert sind, kann damit verworfen werden. Die Ergebnisse bieten stattdessen weitere Evidenz für eine Theorie des mentalen Lexikons, in der Wörter nicht als isolierte Verarbeitungseinheiten gesehen werden, sondern als strukturierte Einheiten in einem Netzwerk morphologischer Verknüpfungen. Sie stützen damit auch ein kombinatorisches Modell der Sprachproduktion, in dem die paradigmatischen Beziehungen der Bestandteile eines Kompositums sowie deren strukturelle Position die Details der Planung und Artikulation mitbestimmen.

Vom abstrakten Wort zur Klangform

Beim Abruf der Klangform eines Wortes muss jedes Wort mit seinem eigenen Betonungsmuster versehen werden. Das Wort Tasse sprechen wir beispielsweise aus als TAsse, nicht jedoch als taSSE. Wenn Versuchspersonen so schnell wie möglich entscheiden müssen, ob der Name eines abgebildeten Objektes auf der ersten oder zweiten Silbe betont wird, dann zeigt sich, dass die Betonung der Anfangssilbe schneller zur Verfügung steht als die der Endsilbe. Die Information über die Betonung eines Wortes wird also nicht in einem Schritt abgerufen. Stattdessen deuten die Ergebnisse darauf hin, dass die Klangform eines Wortes immer wieder neu vom Sprachproduktionssystem berechnet werden muss. So zeigte sich zum Beispiel, dass Wörter mit einem prototypischen Betonungsmuster (z. B. TAsse) schneller artikuliert werden als solche mit einem seltener vorkommenden Betonungsmuster (z. B. kaFFEE).

Das Zusammenspiel der Sprachproduktion mit anderen kognitiven Systemen

Die experimentelle Sprachforschung ist darauf angewiesen, dass sich das komplexe System menschlicher Kognition (Wahrnehmen und Denken) und Sprache theoretisch und experimentell in eine Vielzahl von Einzelbausteinen zergliedern lässt, die sich individuell betrachten lassen. Sprachproduktion ist ein eigener Untersuchungsgegenstand, der sich vom Verstehen gesprochener Sprache unterscheidet. Dennoch ist es wichtig zu sehen, dass all diese Prozesse letztlich Teil eines allgemeinen Denk- und Sprachverarbeitungssystems sind. Insbesondere das Sprechen und das Sprachverstehen sind eng ineinander verwobene Prozesse, die zum Teil auf dieselben Ressourcen des mentalen Lexikons zurückgreifen. Aber auch zum Beispiel Aufmerksamkeitsprozesse spielen eine Rolle in der Sprachverarbeitung. Dies lässt sich anhand vier verschiedener Projekte illustrieren.

Sprachproduktion und Sprachverstehen als eng verknüpfte Systeme

Sowohl das Produktionssystem als auch das Verstehenssystem verfügen über eigenständige Lautrepräsentationen, aus denen sich ein Wort zusammensetzt: Als Sprecher müssen wir wissen, wie man die einzelnen Laute im Wort Tasse produziert. Als Hörer müssen wir sie erkennen und zum Wort Tasse zusammensetzen. Willem Levelt [1; 2] hat in seiner Theorie der Sprachproduktion beschrieben, wie dieser Umstand genutzt werden kann, um bereits vor der Artikulation eines Wortes mögliche Sprechfehler aufzudecken. Er geht davon aus, dass die Lautrepräsentationen beider Systeme eng miteinander verknüpft sind und sich gegenseitig aktivieren. Wird also der Sprechlaut „T“ in Tasse geplant, so wird auch der Laut „T“ im Sprachverstehenssystem aktiv, ohne dass der Sprecher sich tatsächlich schon selbst hat hören können. Neue Untersuchungen der Sprachproduktionsgruppe stützen diese Theorie. Wenn ein Sprecher ein Wort plant, das zum Beispiel den Klang „p“ enthält, so fällt es ihm leichter, ein (gehörtes) Wort daraufhin zu beurteilen, ob es ebenfalls den Klang „p“ enthält. Dieser Effekt ist sogar dann messbar, wenn es gar nicht zur Artikulation des geplanten Wortes kommt. Es handelt sich also um einen Effekt der Vernetzung zwischen phonologischen Repräsentationen des Produktions- und des Verstehenssystems.

Ebenso lässt sich zeigen, dass die interne Kontrolle der Klangform eines auszusprechenden Wortes (zu einem Zeitpunkt vor der Artikulation) wie vorhergesagt den Gesetzmäßigkeiten des Sprachverstehens folgt. Aus der Sprachverstehensforschung wissen wir, dass ein Wort schneller erkannt wird, je weiter vorne im Wort es sich von allen anderen Wörtern unterscheidet (uniqueness point effect). Bittet man Sprecher, so schnell wie möglich anzugeben, ob der Name eines Objektes einen bestimmten Klang enthält (z. B. ein „l“ am Wortende), dann variieren die Reaktionszeiten systematisch mit der Position des uniqueness point. Je eher sich ein Wort eindeutig identifizieren lässt, desto schneller die Antwort. Auf die Geschwindigkeit, mit der die Sprecher die gleichen Bilder benennen können, hat der uniqueness point dagegen keinen Einfluss.

Ein gemeinsamer Arbeitsspeicher beim Sprechen und beim Sprachverstehen

Es wird in vielen Untersuchungen angenommen, dass sich das Produktions- und das Verstehenssystem eines gemeinsamen grammatikalischen Arbeitsspeichers bedienen. Bisher gab es dafür jedoch nur indirekte Evidenz. Neue Experimente zeigen erstmals, dass Sprecher nicht in der Lage sind, gleichzeitig zwei unterschiedliche syntaktische Strukturen aktiv im Arbeitsspeicher zu halten. Sprechern fällt das Lesen fehlerhafter Sätze leichter als das Lesen korrekter Sätze, solange der Fehler der „Erwartung“ des Produktionssystems entspricht. Dies ist beispielsweise der Fall, wenn man als Sprecher direkte Rede in indirekte Rede umsetzen soll und dabei auf ein Reflexivpronomen trifft, das bereits der indirekten Rede entspricht. Fragt man dieselben Sprecher jedoch nur, das fehlerhafte Reflexivpronomen zu korrigieren, so zeigen sich erwartungsgemäß längere Reaktionszeiten für die fehlerhaften Pronomina.

Die Rolle von Aufmerksamkeitsprozessen bei der Sprechplanung

Die Benennung mehrerer Objekte erfordert vom Sprecher, dass er seine Aufmerksamkeit von einem Objekt zum nächsten verschiebt. Dabei stellt sich die Frage, welche Aspekte der Stimulusverarbeitung diesen Aufmerksamkeitsprozess beeinflussen und wie es zur gegenseitigen (negativen) Beeinflussung verschiedener Prozesse bei Doppelaufgaben kommt. Bei Bildbenennungsaufgaben ist der Zeitpunkt der Verschiebung der Aufmerksamkeit von einem Objekt auf das nächste eng mit dem Abruf des Objektnamens aus dem mentalen Lexikon verknüpft. Neue Experimente zeigen, dass dieser Effekt selbst dann zu beobachten ist, wenn das zweite Objekt nicht benannt werden soll, sondern einzig eine manuelle Reaktion erfordert (z. B. Knopfdruck). Die Interferenz bei Doppelaufgaben ist demnach darauf zurückzuführen, dass der Sprecher konkurrierende Ziele verwirklichen muss. Die Aufmerksamkeit kann erst dann auf das zweite Objekt verschoben werden, wenn das erste Ziel (Aktivierung des Objektnamens) erreicht ist.

Die Planung komplexer Äußerungen

Einfache Aufgaben wie die Bildbenennung ermöglichen es, die verschiedenen Stadien der Wortplanung detailliert zu untersuchen. Sie stoßen jedoch an Grenzen, wenn man die Produktion längerer und komplexerer Äußerungen untersuchen möchte, da komplexe Bilder auch eine Vielzahl verschiedener Antworten hervorrufen. Es gibt jedoch Ausnahmen von dieser Regel. Zeigt man einem Sprecher ein Ziffernblatt und bittet ihn, zu sagen wie spät es ist, so kann man seine Antwort mit hoher Treffsicherheit vorhersagen (z. B. Zehn vor Acht). Der Vergleich mit einer Digitaluhr zeigt, dass er auch dann mit Zehn vor Acht antwortet, wenn in Wirklichkeit keine dieser Ziffern selber zu sehen ist (9:50). Die Antwort des Sprechers ist demnach das Ergebnis eines Zusammenspiels einer Vielzahl kognitiver und linguistischer Faktoren. In einer Experimentreihe konnten Simone Sprenger (MPI für Psycholinguistik) und Hedderik van Rijn (Rijksuniversiteit Groningen) zeigen, dass sowohl die Berechnung der Minuten als auch die Vorkommenshäufigkeit der Äußerung wichtige Prädiktoren für die gemessenen Reaktionszeiten sind. Aufgrund dieser Daten entwickelten sie ein neues Modell der „Uhrzeitbenennungsaufgabe“. Es beschreibt den vollständigen Weg von der Konzeptualisierung des Stimulus (dem Ziffernblatt) bis zur Abfrage der kompletten Äußerung (bzw. seiner Einzelelemente) aus dem mentalen Lexikon.

Originalveröffentlichungen

W. J. M. Levelt:

Monitoring and self-repair in speech.

Cognition 14, 41-104 (1983).