Forschungsbericht 2008 - Max-Planck-Institut für Psycholinguistik

Der Ton macht nicht nur die Musik

Autoren
Braun, Bettina
Abteilungen

Sprachverstehen (Prof. Dr. Anne Cutler)
MPI für Psycholinguistik, Nijmegen

Zusammenfassung
Die Sprachmelodie einer Äußerung vermittelt dem Hörer unter anderem, ob ein und dieselbe Äußerung als Frage oder Aussage gemeint ist und welche Information der Sprecher als neu oder verschieden vom Vorkontext ansieht. Untersuchungen am MPI für Psycholinguistik zeigen, dass Hörer in der Lage sind, diese Information effizient zu nutzen, um beispielsweise Vorhersagen über den weiteren Verlauf der Sprecheräußerung zu treffen oder zu erschließen, welche kontextuellen Alternativen den Sprecher zu einer kontrastiven Äußerung bewegten. Diese Fähigkeit könnte unter anderem dafür verantwortlich sein, dass sprachliche Kommunikation so effizient ist.

Jede Äußerung, auch wenn sie nur aus einem einzigen Wort besteht, wird mit einer bestimmten Sprachmelodie oder Intonation ausgesprochen. Sprachmelodie-Bewegungen finden sich vor allem am Anfang und am Ende von Äußerungen (um zum Beispiel Fragen von Aussagen zu unterscheiden) und auf prominenten Wörtern (um z. B. eine bestimmte Information hervorzuheben). Identische Sätze können mit sehr unterschiedlicher Intonation produziert werden, was die Bedeutung eines Satzes entscheidend verändern kann. Je nach Betonung bedeutet der Satz „Peter hat nur einen Kuchen gekauft“, dass Peter nur einen und nicht mehrere Kuchen gekauft hat (Betonung auf einen), dass Peter Kuchen und nicht etwas anderes gekauft hat (Betonung auf Kuchen) oder dass Peter nur einen Kuchen gekauft, ihn aber nicht selbst gebacken hat (Betonung auf gekauft).

In diesen Beispielen gibt die Sprachmelodie Aufschluss darüber, dass der Sprecher eine Alternative in Betracht zog (z. B. den Kontrast zwischen Brotlaib und Kuchen oder zwischen kaufen und backen). Wir wissen aus Vorarbeiten, dass Hörer diese Kontrastmarkierung benutzen, um Vorhersagen über den weiteren Verlauf der Sprecheräußerungung zu treffen. Delphine Dahan – ein ehemaliges Mitglied der Sprachverstehensgruppe um Anne Cutler – und Kollegen untersuchten die Augenbewegungen von Probanden bei vier verschiedenen Objekten auf einem Bildschirm, während sie eine zweiteilige Anweisung ausführten. Augenbewegungen zeigen direkt, wann ein Hörer welches Objekt versteht, während er die Anweisungen hört. Beispielanweisungen waren „Move the candle above the triangle. Now move the candle/candy below the square“ (Schiebe die Kerze über das Dreieck. Schiebe jetzt die Kerze/das Bonbon unter das Quadrat). Im ersten Teil der Instruktion sollte ein Objekt an eine andere Stelle verschoben werden. Im zweiten Teil der Anweisung sollte entweder dasselbe Objekt an eine andere Stelle verschoben werden oder es sollte ein anderes Objekt verschoben werden, das mit der gleichen ersten Silbe beginnt (z. B. candle versus candy). Die Intonation im zweiten Teil der Instruktion wurde manipuliert, sodass das Objekt entweder akzentuiert (betont) oder unakzentuiert war. Eine Analyse der Augenbewegungen zeigte, dass Hörer eine akzentuierte erste Silbe (can) eher als ein neues Objekt interpretierten (z. B. mehr Blicke zu candy, wenn sie zuvor candle verschoben hatten) und eine unakzentuierte Silbe als ein bereits erwähntes Objekt [1].

Eine neuere Studie zeigte, dass Hörer auch Akzentuierungsinformation von Adjektiven für Vorhersagen nutzen. In einem ähnlichen Augenbewegungsexperiment präsentierten Andrea Weber (Nachwuchsgruppenleiterin am MPI für Psycholinguistik), Bettina Braun und Matthew Crocker (Universität des Saarlandes) Anweisungspaare wie „Klicke die lila Schere an. Klicke jetzt die rote Schere/Vase an.“ Auf dem Bildschirm befanden sich in diesem Fall eine lila und eine rote Schere, eine rote Vase und ein gelbes Auto. Wenn das Adjektiv (rote) in der zweiten Anweisung akzentuiert war, fixierten Probanden viel häufiger die rote Schere, als wenn das Adjektiv unakzentuiert war. Dies lässt den Schluss zu, dass sie das akzentuierte Adjektiv als kontrastiv interpretieren und daher den gleichen Objekttyp erwarten wie in der ersten Anweisung – jedoch mit der kontrastierenden Eigenschaft. Dieses Ergebnis wurde noch verstärkt, wenn bereits das Adjektiv in der ersten Anweisung akzentuiert war [2].

Zusammenfassend zeigen diese Ergebnisse, dass Hörer intonatorische Kontrastmarkierung und den situationellen Kontext (in diesem Fall die Objekte auf dem Bildschirm) nutzen, um so schnell wie möglich zu bestimmen, wie der Sprecher fortfahren wird. Im alltäglichen Leben treten kontrastive Äußerungen auch dann auf, wenn dem Hörer die Alternativen unbekannt sind. Bei einer Zeugenbefragung zum Beispiel kann ein Verdächtiger die Frage nach seinem Alibi neutral beantworten (wie in Beispiel 1a, Abb. 1, und damit nur aussagen, dass er zuhause war), oder, wenn er andere der Tat verdächtigt oder bezichtigen will, kann er den gleichen Satz kontrastiv aussprechen (Beispiel 1b).

Die kontrastive Realisierung in 1b sagt nicht nur aus, dass man zuhause war, sondern deutet zugleich an, dass es einen anderen möglichen Verdächtigen gibt, der sich woanders aufgehalten hat (vielleicht am Tatort). Solche kontrastiven Intonationskonturen sind eine ausgezeichnete Möglichkeit, unangenehme Sachverhalte zu vermitteln, ohne sie direkt zu sagen, und man findet sie daher sehr häufig in zwischenmenschlichen Konfliktsituationen.

Bettina Braun und Lara Tagliapietra [3] untersuchten, ob Hörer solche kontextuellen Alternativen unmittelbar generieren, wenn sie kontrastive Äußerungen ohne jeglichen linguistischen oder situationellen Kontext angeboten bekommen. Als Methode verwendeten sie das sogenannte cross-modal associative priming. Bei dieser Methode hören Probanden zunächst einen sogenannten Prime (z. B. ein Wort) und sehen anschließend eine Sequenz von Buchstaben auf einem Bildschirm. Ihre Aufgabe besteht nun darin, so schnell und korrekt wie möglich zu entscheiden, ob diese Buchstabenkette ein Wort darstellt oder nicht. Reaktionen sind schneller nach inhaltlich verwandten als nach unverwandten Primes. So sind beispielsweise Reaktionen zu Stuhl schneller, wenn man vorher Tisch gehört hat, als wenn man vorher Blume gehört hat.

Die Wissenschaftler nahmen identische niederländische Sätze (z. B. Henk fotografeerde een flamingo; „Henk fotografierte einen Flamingo“) mit kontrastiver und nicht-kontrastiver Intonationskontur auf. Die nicht-kontrastive Version war neutral und würde als Antwort auf die Frage „Was hat er gemacht?“ passen. Die kontrastive Version hingegen akzentuierte sowohl Henk als auch flamingo. Dadurch passt es als Fortsetzung zu einer Äußerung wie „Peter fotografeerde een pelikaan, maar...“ (Peter fotografierte einen Pelikan, aber...). Im ersten Experiment sahen Probanden jeweils nach Satzende ein Wort, das mit dem letzten Wort des gesprochenen Satzes kontrastiv verwandt war (zum Beispiel Pelikan, wenn der Satz mit Flamingo endete). In der Kontrollbedingung war der visuelle Reiz nicht mit dem letzten Wort des Satzes verwandt war (z. B. Pelikan, wenn der Satz mit Berühmtheit endete). Die Ergebnisse bestätigten, dass Hörer Alternativen aktivieren, wenn eine Äußerung mit kontrastiver Intonation produziert wird. Sie reagierten bedeutend schneller auf kontrastiv verwandte visuelle Wörter, wenn der Satz mit einer kontrastiven Intonation dargeboten wurde, aber nicht, wenn der Satz neutral gesprochen wurde. Dieses Muster lässt allerdings auch die Interpretation zu, dass kontrastive Intonationskonturen jedwede Art von verwandten Wörtern aktivierten und nicht nur kontrastive Alternativen. Diese Interpretation ist vor allem daher möglich, weil kontrastive Intonationskonturen akustisch auffälliger sind als nicht kontrastive. Außerdem lassen Vorarbeiten von James McQueen und Anne Cutler (in Zusammenarbeit mit Dennis Norris in Cambridge und Sally Butterfield in Birmingham) den Schluss zu, dass eine kontrastive Intonation generell die Erkennung von verwandten Wörtern erleichtert [4].

Um diese Interpretation auszuschließen, testete das zweite Experiment von Braun und Tagliapietra, ob Hörer das gleiche Muster zeigen, wenn das visuelle Wort nicht kontrastiv, sondern allgemein mit dem Wort am Satzende verwandt ist (z. B. rosa, wenn der Satz in Flamingo endet). Die Ergebnisse zeigten, dass Hörer unabhängig von der Intonationskontur schneller reagierten, wenn das Wort auf dem Bildschirm mit dem letzten Wort des Satzes verwandt war. Dies bestätigt die ursprüngliche Hypothese, dass kontrastive Alternativen nur dann aktiviert werden, wenn der Satz kontrastiv ausgesprochen wurde.

Diese Ergebnisse sind vor allem von Bedeutung, weil sie zeigen, dass Hörer aktiv versuchen, den nicht explizit ausgedrückten, aber für den Sprecher vorhandenen Kontrast nachzuvollziehen. Diese Fähigkeit könnte unter anderem dazu beitragen, dass sprachliche Kommunikation so effizient ist.

Originalveröffentlichungen

D. Dahan, M. K. Tanenhaus, C. G. Chambers:
Accent and reference resolution in spoken-language comprehension.
Journal of Memory and Language 47, 292-314 (2002).
A. Weber, B. Braun, M. Crocker:
Finding referents in time: Eye-tracking evidence for the role of contrastive accents.
Language and Speech 49, 367-392 (2006).
B. Braun, L. Tagliapietra:
The role of contrastive intonation contours in the retrieval of contextual alternatives.
Language and Cognitive Processes (2009).
D. Norris, A. Cutler, J. McQueen, S. Butterfield:
Phonological and conceptual activation in speech comprehension.
Cognitive Psychology 53, 146-193 (2006).
Zur Redakteursansicht