Vom Sprechen und Schweigen

1. Dezember 2009

Das Telefonat zwischen zwei Freunden oder der Small Talk auf der Straße sind der Kitt jeder menschlichen Gemeinschaft. Nick Enfield und Stephen Levinson, Forscher am Max-Planck-Institut für Psycholinguistik im niederländischen Nijmegen, interessieren sich für solche alltäglichen Gesprächssituationen. Sie wollen wissen, wie Sprache, Kultur und Kognition zusammenhängen.

Text: Katrin Blawat

Wie lange ein Schüler auf die Antwort seines Meisters warten muss, hängt nicht nur von der Komplexität seiner Frage ab, sondern – wie die Linguisten aus Nijmegen herausgefunden haben – auch von seiner Sprache.

Irgendwann im Gespräch mit Nick Enfield kommen die Zweifel. Diese kleine Pause eben, bevor der gebürtige Australier geantwortet hat: War das nur ein Moment der Unachtsamkeit, des Nachdenkens? Oder steckte in der kurzen Verzögerung bereits eine Botschaft? Enfield, seine Kollegin Tanya Stivers und Direktor Stephen Levinson erforschen solche Fragen in dem Projekt „Multimodale Interaktion“. Oft mögen Alltagsgespräche inhaltlich banal und formal fehlerhaft sein, für die Psycholinguisten sind sie umso aufschlussreicher.

„Wie reine Informationen weitergegeben werden, kann man leicht anhand einzelner Sätze ohne Zusammenhang untersuchen“, sagt Enfield. „Wenn wir aber eine informelle Unterhaltung in der Gesamtsituation beobachten – also auch die Blickwechsel, Körperhaltung und -bewegungen – können wir daraus eine Menge über die Beziehung zwischen den Gesprächspartnern lernen.“

Vor neun Jahren hat Nick Enfield sein Büro im Max-Planck-Institut am Rande der Stadt Njimegen bezogen. Mitten in einem Wald steht das Institutsgebäude. Und so unscheinbar, wie es von der Straße aus wirkt, käme man nicht auf die Idee, dass ausgerechnet hier jene Essenz analysiert wird, die das Menschsein ausmacht. Denn eben dieses Ziel verfolgen Enfield und seine Kollegen, wenn sie geduldig Tage und Wochen damit verbringen, jedes „hm“ und „äh“ einer Unterhaltung in ihren Aufnahmen zu transkribieren.

Ohne Kommunikation keine Geselligkeit

Der Mensch hat es als einzige Spezies geschafft, die Interaktion mit Artgenossen zur Perfektion zu bringen. „Diese unendlichen Möglichkeiten und der Wille, mit anderen zu kooperieren, um Freundschaften zu bilden, um andere zum eigenen Vorteil zu manipulieren oder sich mit Fremden auseinanderzusetzen, das findet nirgendwo sonst so ausgiebig statt wie in der menschlichen Gesellschaft“, sagt Nick Enfield.

Kommunikation als sozialer Kitt – nach Beobachtung der Sprachforscher haben alle Sprachen den Zweck, sicherzustellen, dass der Mensch seinen Willen zur Kooperation auch ausleben kann.

Auf der Suche nach den Wurzeln dieses Geselligkeitstriebs ist Enfield schnell beim alltäglichen Sprachgebrauch gelandet – Zeichensprache, Gesten und Mimik wie das skeptische Stirnrunzeln oder die abwehrend gehobene Hand eingeschlossen. Interagieren und kooperieren können Menschen nur dank ihrer ausgeklügelten Fähigkeit zur Kommunikation, andernfalls würden sie ihre Handlungen höchstens zufällig einmal aufeinander abstimmen.

Wenn aber der Wille zur Kooperation ein Charakteristikum des Menschen ist und irgendeine Form von Sprache Ausdruck dieses Willens – liegt dann nicht die Vermutung nahe, dass es allgemeingültige Prinzipien für die menschliche Kommunikation gibt, quer durch alle Kulturkreise? Eine Art „universelle Infrastruktur“, wie der Max-Planck-Forscher es nennt, die in jeder menschlichen Gemeinschaft das Zusammenleben regelt.

Erste Anhaltspunkte, wie diese grundlegende Infrastruktur aussehen könnte, haben die Psycholinguisten bereits gefunden. Damit eine Unterhaltung problemlos funktioniert, müssen Sprecher und Zuhörer ihre Situation ähnlich einschätzen. Der Zuhörer muss erkennen, ob der Satz „Ich habe Durst“ eine reine Information darstellt – die Bitte, etwas zu trinken zu besorgen – oder die Frage, ob der andere ebenfalls durstig ist. Noch unverzichtbarer ist die Fähigkeit, die Intention des Sprechers richtig zu deuten, wenn Ironie, Sarkasmus oder einfach eine ungenaue Ausdrucksweise ins Spiel kommen – wie in beinahe jeder informellen Unterhaltung.

In einer Computertomografie-Studie haben Levinson und sein Team untersucht, wie dieses unausgesprochene gegenseitige Verstehen erzielt wird. Wenn der Sender eine kommunikative Intention unkonventionellen Charakters zu erkennen gibt, finden sich bei ihm wie auch bei seinem Empfänger die gleichen Regionen des Gehirns aktiviert, wobei der Empfänger offenbar die Intentionen des Senders simuliert.

Klatsch als Keimzelle der Kommunikation

Die Fähigkeit, sich in die Gedankenwelt des Gegenübers versetzen zu können, beschreiben Wissenschaftler mit der Theory of Mind, und für Enfield und seine Kollegen ist sie einer der wichtigsten Bestandteile im menschlichen Kommunikations- und Kooperationsverhalten.

Es braucht keine räumliche Nähe, um sich zu verstehen. Wichtiger ist es, dass die Intentionen des Redenden vom Zuhörer richtig gedeutet werden.

Woran aber erkennt etwa der Zuhörende, dass sein Gegenüber gleich zu sprechen aufhört und er selbst an der Reihe ist, etwas zu sagen? Nick Enfield untersuchte diese Frage mithilfe eines Experiments, für das er Probanden Mitschnitte eines Telefongesprächs zweier niederländisch sprechender Freunde vorspielte. Die Testpersonen sollten in dem Moment einen Knopf drücken, in dem sie glaubten, dass der Sprechende gleich enden würde.

Damit stellte der Versuch eine Situation nach, wie sie in jeder Unterhaltung auftritt: Weil man in einer einfachen, zwanglosen Unterhaltung etwa ein halbe Sekunde braucht, um eine Antwort auf das Gehörte zu produzieren, muss man das Gesprächsende seines Partners vorhersehen, um lange Pausen zu vermeiden.

„Eine ideale Unterhaltung kommt ohne Gesprächslücken und ohne Überschneidungen der Teilnehmer aus“, sagt Enfield. Natürlich gebe es dennoch immer wieder Pausen in einer Unterhaltung, aber die hätten dann meist auch eine Bedeutung. Eine Erkenntnis aus Enfields Untersuchungen lautet nämlich, dass zustimmende Antworten auf Ja-Nein-Fragen in allen Kulturen schneller geäußert werden als ablehnende Antworten. Bemerkt der Sprecher also die kurze Pause von ein paar Millisekunden, kann er wiederum die Antwort seines Partners vorausahnen.

In seinem Versuch manipulierte Enfield die Tonspuren, sodass im einen Fall die Wörter unverständlich wurden, während alle anderen Merkmale wie Tonhöhe, Lautstärke und Dauer des Gesagten konstant blieben. Daraufhin fiel es den Probanden deutlich schwerer als bei der unbearbeiteten Tonspur, das Gesprächsende zu antizipieren. Änderte Enfield hingegen die Tonhöhe, bereitete dies den Versuchspersonen keine Probleme.

Demnach geben also eher einzelne Wörter und nicht die Tonhöhe einen Hinweis darauf, dass sich ein Sprecher dem Ende seines Beitrags nähert. „Zumindest gilt das für Niederländisch und wahrscheinlich auch für andere westeuropäische Sprachen“, so Enfield. „Wie es aber zum Beispiel im Japanischen aussieht, bei dem man eine Menge Wörter einfach auslassen kann, wissen wir noch nicht.“

Dennoch gibt es eine Gemeinsamkeit, stellten die Psycholinguisten fest. „Alle Sprachen haben den Zweck, sicherzustellen, dass der Mensch seinen Willen zur Kooperation auch ausleben kann“, sagt der Max-Planck-Forscher und verweist auf den Anthropologen Robin Dunbar. Der vermutet, dass sich Sprache vor 200000 bis 400.000 Jahren als ein Instrument entwickelt hat, um in einer größeren Gemeinschaft soziale Angelegenheiten regeln zu können. Klatsch und Tratsch waren demnach der Motor jener Entwicklung, die in einer halben Million verschiedener Sprachen irgendwann ihren Höhepunkt gefunden hat.

Heute werden weltweit noch etwa 6000 Sprachen gesprochen, schätzen Linguisten. Und nur bei etwa zehn Prozent hat sich jemand die Mühe gemacht, eine Grammatik und umfangreiche Vokabellisten zu erstellen. Laut der Datenbank Ethnologue werden 82 Prozent aller Sprachen von Gemeinschaften mit weniger als 100.000 Mitgliedern gesprochen, knapp 40 Prozent gar von solchen mit weniger als 10.000 Mitgliedern.

Albtraum der Psychologen

Nick Enfield weiß nur zu gut, was es bedeutet, in solchen Gemeinschaften Sprachen wie Kri zu erforschen, das nur 300 Menschen in einem abgelegenen Teil Südostasiens sprechen. In Enfields Büro erinnern Fotos von farbenfroh gekleideten, dunkelhäutigen Kindern mit großen Strohhüten an die jährliche „Feld-Saison“, wenn der Wissenschaftler die Niederlande verlässt, um einige Wochen in der fremden Kultur zu verbringen. Anfangs hat er sich über die deutlichen Hierarchien gewundert, die in jedem scheinbar bedeutungslosem Wortgeplänkel zutage traten: Der Höherrangige thronte über seinem Gesprächspartner – selbst wenn der andere im wörtlichen Sinne auf der Straße knien musste.

Rund 250 Menschen sprechen Kri. Sie leben in kleinen Dörfern in Laos an der Grenze zu Vietnam. Kri besitzt 18 lange Vokale und unterscheidet sich auch sonst stark von anderen Sprachen Südostasiens.

Den Alltag der Menschen in Asien oder Afrika verfolgen die Wissenschaftler mit der Videokamera. Wer fängt ein Gespräch an, wohin guckt er dabei, wie und wann reagiert der Angesprochene? „Dabei wird man zwangsläufig ein Teil der fremden Gesellschaft“, sagt Enfield. „Schließlich wohnen wir bei den Menschen, über die wir forschen, wir essen und feiern mit ihnen.“ Für Psychologen seien solche Versuchsbedingungen ein Albtraum, weil sie zu unkontrolliert seien. Da alles in Echtzeit läuft, lässt sich keine Situation wiederholen.

Mit hunderten Stunden Videoaufzeichnungen kehren die Forscher schließlich an ihre Schreibtische zurück. Und dann beginnt der aufwendigste Teil der Arbeit. Wie Zoologen, die nach einer Exkursion daheim am Mikroskop die Beine der gesammelten Käfer millimetergenau vermessen müssen, übertragen die Psycholinguisten ihre Videoaufnahmen in ein Protokoll – auf Millisekunden genau. Wer ihre Aufzeichnungen betrachtet, wundert sich, wie unvollständig die Sätze eines Gesprächs meist sind. Keine Pause, kein Gestotter überspringen die Forscher, doch diese Sorgfalt kostet Zeit. Eine Minute Videoaufnahmen exakt zu transkribieren dauert etwa zwei Stunden.

Filmaufnahmen wie hier beim Gesangs­festival auf Rossel Island bilden für die Forscher eine wichtige Arbeitsgrundlage.

Wolle man hingegen reine Sachinformationen austauschen, sei zumindest die gesprochene Sprache nicht unbedingt notwendig. Der Wissenschaftler weiß das aus eigener Erfahrung, wenn er erstmals ein fremdes Land besucht und sich die neue Sprache erst aneignen muss. „Das ist immer anstrengend, aber es macht Spaß“, sagt er. „Man weiß, dass man Fortschritte machen wird, sobald man etwas Zeit investiert.“

Chomskys Tiefengrammatik ist tot

Dank ihrer Erfahrung in der Feldforschung stellen die Max-Planck-Forscher mit ihrer Theorie einer allgemeingültigen Infrastruktur des Sprachgebrauchs eine gängige Theorie der Linguistik infrage. Noch immer dominiert Noam Chomskys Idee einer einzigen, für alle Sprachen gültigen Tiefengrammatik. Die Anhänger der Chomsky-Lehre behaupten, universelle Gemeinsamkeiten in der Sprachstruktur herausarbeiten zu können. So verfügten alle Sprachen über Strukturen wie Nomen, Verben, Adjektive und Hilfsverben und über Regeln für die Wortstellung im Satz.

Bei aller Verschiedenheit dienen alle Sprachen der Welt nach Auffassung der Linguisten dem gleichen Zweck: der Organisation der Gemeinschaft.

Zudem gibt es einige Besonderheiten, die sich kein Erfinder einer künstlichen Sprache ausdenken würde, weil sie auf den ersten Blick zu abstrus erscheinen. So kennt man in der Indianersprache Kiowa keine einheitliche Form für den Plural. Stattdessen wird markiert, ob es sich um eine ungewöhnliche Anzahl für ein spezielles Objekt handelt, etwa mehr als zwei Beine oder nur zwei einzelne Kieselsteinchen.

Stephen Levinson unterstellt allen Sprachen einen gemeinsamen Zweck: die Organisation der Gemeinschaft. Doch dass es auch auf struktureller Ebene eine Universalität geben sollte, die oben beschriebene Chomsky’sche Tiefengrammatik also, halten er und Nick Enfield für einen Mythos. „Sprachen unterscheiden sich so erheblich auf jeder strukturellen Ebene, dass es uns schwer fällt, überhaupt ein Merkmal zu finden, das allen gemeinsam ist“, sagt der Max-Planck-Direktor. „Wir sind die einzige Art, deren Kommunikationssysteme sich fundamental in Form und Inhalt voneinander unterscheiden. Wer über die Evolution von Sprache nachdenkt und diesen Umstand ignoriert, übersieht genau das Merkmal, das unsere Art auszeichnet.“

Unterstützung bekommt Stephen Levinson von Michael Tomasello. Der Direktor am Leipziger Max-Planck-Institut für evolutionäre Anthropologie stellt entschieden fest: „Die Tiefengrammatik ist tot. Wissenschaftler können nicht sagen, was genau universell daran sein soll – und sie haben auch keine Methoden, um es herauszufinden.“

Mit der Stoppuhr am Puls der Sprache

Die von Levinson und Enfield postulierte universelle Infrastruktur hingegen ist tiefer liegend, das heißt, weniger offensichtlich. Sie zeigt sich etwa in der Zeitverzögerung, die bis zu einer Antwort vergeht. Und die Forscher wissen, wie sie diese universelle Infrastruktur belegen könnten: wenn sich zeigen ließe, dass es Regeln für den informellen Sprachgebrauch gibt, nach denen sich Menschen aller Kulturen richten. Um für solche interkulturellen Untersuchungen gerüstet zu sein, spricht jeder der Psycholinguisten eine Handvoll exotischer Sprachen. So ist Enfield Experte für Lao und Kri, kann sich aber auch auf Hindi und Chinesisch verständigen. Sein Chef Levinson hat sich bislang auf Sprachen der Maya und die der Bewohner Neu-Guineas spezialisiert.

Eine universelle Grammatik für alle Sprachen existiert zwar nicht, dafür gibt es womöglich allgemein gültige Regeln für den informellen Sprachgebrauch.

Doch selbst wenn die Wissenschaftler sich problemlos verständigen können, ist der Aufwand von interkulturellen Studien sehr hoch. Eine Studie nur in einer westeuropäischen Sprache zu organisieren sei hingegen kein Problem, sagt Enfield, da strömten die Probanden wie von selbst herbei. Dass aus diesem Grund die meisten Ergebnisse aus Untersuchungen dieses vergleichsweise kleinen Kulturkreises stammen, nennt er jedoch „Ethnozentrismus“.

Um dieses Problem zu vermeiden, hat Nick Enfield die Fragestellung in einer seiner zuletzt veröffentlichten Studien auf insgesamt zehn Sprachen aus fünf Kontinenten ausgeweitet: Italienisch, Englisch, Dänisch und Japanisch wurden ebenso untersucht wie Sprachen aus Mexiko, Südostasien, Namibia und Papua-Neuguinea. Die Psycholinguisten wollten wissen, wie viel Zeit in den verschiedenen Sprachräumen vergeht, ehe ein Gesprächspartner auf eine einfache Ja-Nein-Frage reagiert. Um möglichst lebensnahe Bedingungen zu untersuchen, analysierten die Forscher reale Situationen, die sie zuvor in den einzelnen Kulturen gefilmt hatten.

So diskutieren zwei Männer in Lao darüber, welche Route sie mit ihrem Lkw wählen sollen, um ins nächste Dorf zu gelangen. Die Ergebnisse unterstützen Enfields These einer grundlegenden Infrastruktur im alltäglichen Sprachgebrauch: Auf Fragen, die sich mit ja oder nein beantworten ließen, reagierten die Angehörigen aller Sprachräume im Schnitt nach 208 Millisekunden. „Diese Zeitspanne ist offenbar eine universelle Gesetzmäßigkeit“, sagt der Wissenschaftler.

Allerdings offenbarte die Studie auch geringe, kulturspezifische Unterschiede. Am schnellsten antworteten die Japaner, am langsamsten die Dänen. „Die Infrastruktur des Sprachgebrauchs, wie wir sie uns vorstellen, ist ja nichts Fixes, sondern ein Bündel von Prinzipien, die sich zu lokalen Besonderheiten auswachsen können und so eine Kultur prägen“, erläutert Stephen Levinson das Ergebnis.

Wie eng Sprachgebrauch und Kultur im Alltag miteinander verwoben sind, dafür wollen Nick Enfield und fünf weitere Wissenschaftler im Rahmen eines neuen Forschungsprojekts weitere Belege sammeln. Von Januar an leitet Enfield das vom Europäischen Forschungsrat mit zwei Millionen Euro finanzierte Projekt Human Sociality and Systems of Language Use.

Wessen Aufgabe ist es, in einer zwanglosen Unterhaltung Missverständnisse auszuräumen? Wie ausdrücklich kann ein Gesprächspartner einen Wunsch äußern? Wieder wollen die Psycholinguisten diese Fragen für insgesamt sieben verschiedene Sprachen beantworten. Enfields Technikkiste mit der Videokamera steht schon bereit. Bald wird der Forscher die Kinder in der bunten Kleidung, deren Fotos am Aktenschrank in seinem Büro hängen, in Laos wiedertreffen.

 

GLOSSAR

Theory of Mind (ToM)
Die Fähigkeit, sich in die Gedankenwelt des Gegenübers hineinzudenken, seine Absichten zu erkennen und das eigene Handeln danach auszurichten. Kinder haben erst mit etwa vier Jahren eine vollständig entwickelte ToM, wenn sie die Überzeugungen und Annahmen eines anderen Menschen als nicht zutreffend identifizieren können.

Tiefengrammatik
Angeborene Fähigkeit des Menschen, mithilfe weniger grammatischer Regeln und einem begrenzten Wortschatz neue Sätze zu bilden. Als Beleg für die Tiefengrammatik führte der Linguist Noam Chomsky an, dass jedes gesunde Kind jede beliebige Sprache als Muttersprache erlernen kann. Oft wird unter Tiefengrammatik aber auch ein Bündel von Prinzipien verstanden, die allen Sprachen der Welt gemein sind (etwa bestimmte Satzbau-Regeln, lexikalische Einheiten wie Nomen, Verb etc.). Diese Auffassung kritisieren viele Forscher aufgrund mangelnder Beweise und Gegenbeispielen.

Transkribieren
Das Übertragen von Audioaufnahmen gesprochener Sprache in die Schriftform, im Falle der Wissenschaftler Levinson und Enfield sogar inklusive aller Gesprächspausen, Füllwörter und unvollständiger Satzfragmente. Für Psycholinguisten der zeitaufwän­digste Arbeitsschritt einer Studie.

Zur Redakteursansicht