idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
02/04/2025 11:04

Wie Sprachen Kompromisse machen: Komplexere Sprachen scheinen effizienter zu sein

Dr. Annette Trabold Presse- und Öffentlichkeitsarbeit
Leibniz-Institut für Deutsche Sprache

    Sprachen sind strukturell komplex, aber gleichzeitig müssen Menschen effektiv kommunizieren. Wie kann das in Einklang gebracht werden? Um dies zu untersuchen, trainierten Forscher am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim Computer-Sprachmodelle mit mehr als 6500 Dokumenten in über 2000 Sprachen. Das Ergebnis: Sprachen, die für die Computermodelle schwieriger zu verarbeiten sind, kompensieren diese höhere Komplexität durch eine größere Effizienz. Komplexere Sprachen benötigen also weniger Symbole, um dieselbe Nachricht zu kodieren. Die Analysen zeigen auch, dass größere Sprachgemeinschaften dazu neigen, komplexere, aber effizientere Sprachen zu verwenden.

    Sprachmodelle sind Computeralgorithmen, die lernen können, menschliche Sprache erstaunlich fehlerfrei zu verarbeiten und zu erzeugen. Sie analysieren große Textmengen und erkennen dabei Muster, ohne sich auf vordefinierte Regeln zu stützen, was sie zu wertvollen Instrumenten für die Sprachforschung macht. Doch nicht alle diese Sprachmodelle sind gleich: Ihre interne Architektur variiert und bestimmt, wie sie Sprache lernen und verarbeiten. Diese Unterschiede ermöglichen es uns, die Sprachen der Welt auf neue Art und Weise zu vergleichen und Erkenntnisse über sprachliche Vielfalt zu gewinnen.

    In einer neuartigen Studie trainierten Forscher des IDS Sprachmodelle auf einem riesigen Datensatz von über 6500 Dokumenten in mehr als 2000 Sprachen mit ca. 3 Milliarden Wörtern. Zu den Texten gehören religiöse Schriften, juristische Dokumente, Filmuntertitel, Zeitungsartikel und vielerlei mehr. Die Forscher schätzten ab, wie schwierig es für die Sprachmodelle ist, Texte zu verarbeiten oder zu produzieren. Daraus schlossen sie auf die Komplexität der jeweiligen Sprache. „Wir haben sehr unterschiedliche Sprachmodelle auf diesem Textmaterial trainiert“, sagt Koautor Sascha Wolfer. „Einige einfache Modelle berücksichtigen z. B. nur die letzten beiden Wörter. Das schränkt natürlich die Fähigkeit ein, z. B. grammatikalische Muster über große Distanzen zu erfassen. Andere, wie z. B. Transformer-Modelle, zu denen auch ChatGPT gehört, nutzen fortschrittlichere Mechanismen, um komplexe Abhängigkeiten zu analysieren und reichhaltigere sprachliche Strukturen aufzudecken.“

    Überraschenderweise waren die Ergebnisse recht konsistent: Trotz deutlicher architektonischer Unterschiede ergaben die Modelle sehr ähnliche Bewertungen der Sprachkomplexität. „Wenn eine Sprache für ein Modell in einer Textsammlung schwieriger zu verarbeiten ist als eine andere, gilt diese Beziehung auch für andere Modelle, Textsammlungen und sogar dann, wenn das Modell mit einzelnen Zeichen anstatt Wörtern arbeitet“, erklärt Koautor Peter Meyer. „Das deutet darauf hin, dass die Ergebnisse nicht nur den Rechenaufwand widerspiegeln, sondern tatsächlich auch Einblicke in die interne Komplexität menschlicher Sprachen bieten könnten.“

    Komplexere Sprachen sind also schwieriger zu verarbeiten. Warum aber entwickeln sich manche Sprachen so, dass sie komplexer werden? Man könnte meinen, dass das einen Nachteil gegenüber weniger komplexen Sprachen darstellt. Ein zentrales Ergebnis der Studie könnte eine Antwort liefern: Sprachen gehen einen „Kompromiss“ ein zwischen Komplexität und Effizienz, d. h. komplexere Sprachen benötigen tendenziell weniger Textmaterial, um den gleichen Inhalt zu vermitteln. Das könnte auf einen „Ausgleichsmechanismus“ hindeuten, bei dem höhere strukturelle Komplexität durch größere Effizienz bei der Kommunikation kompensiert wird.

    „Vielleicht hat der zusätzliche Aufwand, den das Erlernen einer komplexen Sprache erfordert, also auch seine Vorteile“, meint Alexander Koplenig, Erstautor der Studie. „Wenn man sie erst einmal beherrscht, könnte eine komplexere Sprache mehr Möglichkeiten bieten, sich auszudrücken. So ließe sich die gleiche Idee mit weniger Wörtern vermitteln. Interessanterweise können wir auch zeigen, dass größere Sprachgemeinschaften tendenziell komplexere, aber effizientere Sprachen verwenden.“

    Eventuell ermöglicht institutionalisierte Bildung und systematisches Sprachenlernen in großen Gesellschaften eine höhere sprachliche Komplexität. Gleichzeitig könnte die Relevanz schriftlicher Kommunikation in größeren Gesellschaften dazu führen, dass kürzere Nachrichten bevorzugt werden. Dadurch kann man Kosten für Produktion, Speicherung und Übertragung sparen – wie etwa Buchseiten oder Speicherplatz. „Diese Kombination, also formale Bildung, die Komplexität ermöglicht, und praktische Bedürfnisse nach mehr Effizienz, könnte erklären, warum sich Sprachen in größeren Gemeinschaften so entwickeln, wie sie es tun“, so Koplenig weiter. „Es wird faszinierend sein zu sehen, ob sich diese spekulative Hypothese durch zukünftige Forschung untermauern lässt“.

    Originalarbeit:
    Koplenig A., Wolfer S., Rüdiger J.-O., Meyer, P. (2025): Human languages trade off complexity against efficiency. PLOS Complex Systems 2(1): e0000032.
    https://journals.plos.org/complexsystems/article?id=10.1371/journal.pcsy.0000032

    Das Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim ist die gemeinsam vom Bund und allen Bundesländern getragene zentrale wissenschaftliche Einrichtung zur Dokumentation und Erforschung der deutschen Sprache in Gegenwart und neuerer Geschichte. Es gehört zu den über 90 Forschungs- und Serviceeinrichtungen der Leibniz-Gemeinschaft. Näheres unter: http://www.ids-mannheim.de, https://bsky.app/profile/idsmannheim.bsky.social, https://x.com/ids_mannheim, http://www.facebook.com/ids.mannheim, http://www.instagram.com/ids_mannheim/ und http://www.leibniz-gemeinschaft.de.


    Contact for scientific information:

    Dr. Sascha Wolfer
    Leibniz-Institut für Deutsche Sprache
    R 5, 6-13
    68161 Mannheim
    Tel.: +49 621 1581-439

    E-Mail: wolfer@ids-mannheim.de


    Original publication:

    Originalarbeit:
    Koplenig A., Wolfer S., Rüdiger J.-O., Meyer, P. (2025): Human languages trade off complexity against efficiency. PLOS Complex Systems 2(1): e0000032.
    https://journals.plos.org/complexsystems/article?id=10.1371/journal.pcsy.0000032


    Images

    Criteria of this press release:
    Journalists
    Language / literature
    transregional, national
    Research results
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).