idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
11/24/2025 12:33

Sprache ist komplexer als eigentlich nötig wäre, und das hat gute Gründe

Thorsten Mohr Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Unsere Sprachen sind komplex, blumig, vielfältig – und aus informationstheoretischer Sicht nicht ideal komprimiert. Warum sprechen wir nicht „digital“, verpacken Informationen also etwa wie ein Computer in Einsen und Nullen? Dieser Frage ist der Saarbrücker Sprachwissenschaftler Michael Hahn gemeinsam mit einem US-Kollegen nachgegangen. Sie haben ein Modell entwickelt, das erklärt, warum wir sprechen, wie wir sprechen und nicht etwa piepen wie die Roboter in Star Wars. Die Arbeit wurde nun im hochrangigen Journal Nature Human Behaviour veröffentlicht.

    Die menschliche Sprache ist eine komplexe Angelegenheit. Besser gesagt, die menschlichen Sprachen. Rund 7000 werden rund um die Erde gesprochen, manche aussterbende Sprache nur von wenigen Einzelnen, andere wie Chinesisch, Englisch, Spanisch und Hindi von Milliarden Menschen. Und eines haben sie, bei allen Unterschieden, gemeinsam: Sie vermitteln Informationen, indem sie einzelne Wörter zu Phrasen, also zusammenhängenden Wortgruppen, bündeln, die dann wiederum zu Sätzen werden. Jede Einheit hat also eine eigene Bedeutung, bis am Ende ein verständlicher Satz dabei herauskommt.

    „Das ist eigentlich eine sehr komplexe Struktur. Da in der Natur alles darauf aus ist, möglichst effizient und ressourcenschonend zu sein, kann man sich hier mit Recht die Frage stellen, warum das Gehirn die Informationen in der Sprache so kompliziert codiert und nicht etwa digital wie ein Computer“, erläutert Michael Hahn diesen Umstand. Der Professor für Computerlinguistik an der Universität des Saarlandes ist gemeinsam mit seinem Kollegen Richard Futrell von der University of California in Irvine genau dieser Frage nachgegangen. Denn eine Codierung der Information zum Beispiel als klassischer Binärcode in einer Abfolge aus Einsen und Nullen wäre sehr viel effizienter, weil sie Informationen in einem weitaus höheren Maß verdichtet als unsere Sprachen. Warum also piepsen wir nicht – übertragen formuliert – wie der knuffige Roboter R2D2 aus „Star Wars“, sondern sprechen, wie wir sprechen? Darauf haben Michael Hahn und Richard Futrell eine Antwort.

    „Menschliche Sprache orientiert sich auch an der Lebenswirklichkeit um uns herum“, erklärt Michael Hahn. „Wenn ich zum Beispiel von einer halben Katze und einem halben Hund spreche, entspricht das nicht der Erfahrung der allermeisten Menschen, die mit hoher Wahrscheinlichkeit weder jemals einen halben Hund noch eine halbe Katze gesehen haben. Es hat auch keinen Sinn, die Wörter ‚Katze‘ und ‚Hund‘ derart miteinander zu vermengen, dass die Buchstaben zwar dieselben sind, aber die Bedeutung nur schwer zu fassen ist“, erklärt der Sprachwissenschaftler weiter. „Khzndatue“ würde das Gehirn überfordern, obwohl darin die Buchstaben für die Wörter „Katze“ und „Hund“ enthalten sind. „Katze und Hund“ als sprachliche Einheit hingegen verstehen wir, weil die beiden Begriffe die beiden Tiere widerspiegeln, die so gut wie jedem Menschen auf dem Planeten in ihrer nicht halbierten Erscheinungsform bekannt sein dürften.

    „Vereinfacht gesagt, ist es für unser Gehirn also leichter, den eigentlich aufwändigeren Weg zu wählen“, fasst Michael Hahn das Ergebnis der Studie zusammen. Der Rechenaufwand, den das Gehirn betreiben muss, ist trotz der nicht ganz ideal komprimierten Information sehr viel geringer, da das Gehirn niemals losgelöst von seiner gewohnten, natürlichen Umwelt arbeitet. Eine rein binäre, digitale Codierung wäre hier vielleicht auf den ersten Blick besser, weil sie mehr Information in weniger Zeit vermitteln kann. Aber sie wäre losgelöst von der natürlichen Umgebung. „Das ist sehr ähnlich mit dem Phänomen, dass unser gewohnter Fahrtweg zur Arbeit quasi im Automatikmodus abläuft, während eine vielleicht kürzere, aber ungewohnte Strecke zu fahren trotz alledem anstrengender ist. Unser Gehirn weiß auf der eingeübten Strecke genau, wo es etwas zu beachten gibt. Daher strengt es uns sehr viel weniger an, hier entlangzufahren statt auf einer neuen, ungewohnten Strecke, die viel Aufmerksamkeit verlangt, obwohl sie die kürzere ist“, vergleicht Michael Hahn den Mechanismus, der auch bei der Sprache zum Tragen kommt. Mathematisch ausgedrückt: „Die Zahl der Bits, die das Gehirn berechnen muss, ist weitaus geringer, wenn wir gewohnt sprechen.“

    Eine digitale Codierung und Decodierung derselben Information würde bei Sprecher und Zuhörer deutlich mehr Rechenaufwand im Gehirn erzeugen. Unser Gehirn berechnet die Wahrscheinlichkeiten, in denen die Wörter und Phrasen aufeinanderfolgen, und dank steten Trainings – wir sprechen unsere Muttersprache täglich für zigtausende Tage eines Lebens – werden die Wege bekannt, der Rechenaufwand sinkt.

    Michael Hahn nennt hierfür ein weiteres Beispiel: „Wenn ich sage ‚Die fünf grünen Autos‘, ergibt das im Gegensatz zu ‚Grünen fünf die Autos‘ für unser Gehirn mit hoher Wahrscheinlichkeit Sinn“, so der Wissenschaftler.

    Wenn man sich den zeitlichen Ablauf vorstellt, in welchem ein Sprecher die Phrase „Die fünf grünen Autos“ ausspricht, steht am Anfang der Artikel „Die“. Der Zuhörer weiß in diesem Moment: „Die“ kann der feminine Artikel Singular sein oder der Plural-Artikel egal welchen Genus. Daraus folgt: Es kann also nach „Die“ bereits ausgeschlossen werden, dass das Wort, welches am Ende mit dem Artikel bezeichnet wird, ein Nomen im Singular männlichen oder sächlichen Geschlechts bezeichnet. Weiter geht es mit „Fünf“. Das Zahlwort bezeichnet mit maximaler Wahrscheinlichkeit etwas, das zählbar ist, lautet die Berechnung unseres Gehirns. Also schonmal keine „Liebe“, kein „Durst“ oder andere Dinge, die nicht gezählt werden können. „Grün“ wiederum stellt eine Korrelation zwischen dem zu diesem Zeitpunkt noch nicht genannten Nomen (Autos) und dem Adjektiv („grün“) her. Die Wahrscheinlichkeit, dass es grüne Autos gibt, ist recht hoch, ebenso könnten es aber auch Bananen oder Frösche sein, von denen geredet wird. Das Wort „Autos“ am Ende löst das Rätsel für unser Gehirn dann auf. Wie in einer Art Trichter wird die Menge der möglichen Bedeutungen des Gesagten zum Ende hin immer enger, genauer.

    Im Satz „Grünen fünf die Autos“ hingegen funktioniert diese logische Kette von Rechenoperationen nicht. Unser Gehirn kann mit diesem Satz nichts anfangen, da die Kette der Korrelationen nicht funktioniert.

    Diese Zusammenhänge konnten Michael Hahn und sein US-Kollege Richard Futrell nun mathematisch beweisen. Dass diese Erkenntnis nicht trivial ist, wird von der Tatsache untermauert, dass sie ihre Untersuchungen in der hochrangigen Fachzeitschrift Nature Human Behaviour veröffentlichen konnten. Die Erkenntnisse könnten zum Beispiel Beachtung bei der weiteren Entwicklung so genannter Large Language Models (LLM) finden, wie sie zum Beispiel durch generative KI-Anwendungen wie ChatGPT oder Copilot von Microsoft bekannt sind.


    Contact for scientific information:

    Prof. Dr. Michael Hahn
    E-Mail: mhahn@lst.uni-saarland.de


    Original publication:

    Futrell, R., Hahn, M. Linguistic structure from a bottleneck on sequential information processing. Nat Hum Behav (2025). https://doi.org/10.1038/s41562-025-02336-w


    Images

    Prof. Dr. Michael Hahn
    Prof. Dr. Michael Hahn
    Source: Thorsten Mohr
    Copyright: Universität des Saarlandes/Thorsten Mohr


    Criteria of this press release:
    Journalists
    Information technology, Language / literature, Mathematics
    regional
    Research results, Scientific Publications
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).