idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
02/26/2026 15:11

Wie die KI Dialekte lernen kann

Dr. Gabriele Neumann Stabsstelle Hochschulkommunikation
Philipps-Universität Marburg

    Regionalsprachen sind blinde Flecken in Spracherkennung

    Schon mal in der telefonischen Warteschleife mit der KI Schwäbisch gesprochen? Oder Bairisch? Die Aussicht auf Erfolg scheint gering, konstatieren rund 35 Wissenschaftler*innen aus sieben Ländern unter Federführung des Forschungszentrums Deutscher Sprachatlas (DSA) an der Uni Marburg in einem Positionspapier zur „Zukunft der Regionalsprachenforschung“. Denn Sprachmodelle werden nur mit Texten und Aufnahmen in Standardsprache trainiert. Die Folge: Dialekte und Regionalsprachen sind im digitalen Raum weitgehend unsichtbar. Um das zu ändern haben die Autor*innen aus den Forschungsbereichen Regionalsprachenforschung, Computerlinguistik und KI-Forschung das „Netzwerk Regionale Sprache und Künstliche Intelligenz“ gegründet. Sie wollen die Potenziale von KI nutzen, die kulturelle Vielfalt abbilden und die digitale Transformation gestalten.

    „Dialekte sind kein Randphänomen – sie sind Träger kultureller Identität und Ausdruck regionaler Zugehörigkeit für Millionen von Menschen. Wenn KI-Systeme diese sprachliche Vielfalt nicht erkennen, nicht analysieren und nicht authentisch abbilden können, dann bleibt ein zentraler Teil unseres kulturellen Erbes im digitalen Raum schlicht unsichtbar. Wir haben als Regionalsprachenforschung die Expertise, das zu ändern – aber wir brauchen dafür bessere Daten, mehr Kooperation mit der KI-Forschung und Förderstrukturen, die langfristig angelegt sind“, sagt Prof. Dr. Alfred Lameli, Direktor des Sprachatlas.

    Für die Regionalsprachenforschung ergebe sich durch die rapide Entwicklung der KI-Technologie der letzten Jahre ein großes Innovationspotenzial. Zugleich komme dem Fach hinsichtlich der Repräsentation regionaler Sprache im digitalen Raum eine besondere Verantwortung zu. Denn Ziel sei, dass alle Menschen von digitalen Diensten und Dialogsystemen gleichbehandelt werden. Momentan werden ältere Menschen, die im Alltag Dialekt sprechen, oder Bewohner*innen ländlicher Regionen schlechter bedient als Menschen, die Hochsprache sprechen. „Das ist mehr als eine Unannehmlichkeit – es ist eine Frage gesellschaftlicher Teilhabe und kultureller Identität“, betont Lameli.

    Damit Sprachmodelle Dialekte und Regionalsprachen gut verarbeiten können, müssen die Daten standardisiert und digitalisiert vorliegen. Und da liegt nach Auffassung der Autor*innen das größte Problem: Zwar gibt es sehr viele Daten auch in internationalen Kontexten. Es fehlt aber an ausreichend großen Mengen an Daten, die rechtssicher zugänglich und nutzbar sind und in hoher Qualität aufbereitet wurden. Notwendig ist eine einheitliche Digitalisierung nach den so genannten FAIR-Prinzipien: Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (wiederverwendbar). Dazu gehören eine systematische Sammlung gesprochener Alltagssprache, umfassende Erschließung der Metadaten, offene Lizenzierung und auch die Aufbereitung historischer Bestände.

    Ein Ziel könnte ein Übersetzungstool für Dialekte sein, erklärt Prof. Dr. Hanna Fischer. „Damit könnte es möglich werden, Dialekte in Sprachinseln zu erhalten und neu sichtbar werden zu lassen. Für das Training eines solchen Modells könnte der Datenbestand des Deutschen Sprachatlas eine entscheidende Grundlage bilden. Doch dafür müssen die vorhandenen Daten erst fit für die KI gemacht werden“, erläutert die stellvertretende DSA-Direktorin.

    Hintergrund: Netzwerk Regionale Sprache und Künstliche Intelligenz

    Das Forschungszentrum Deutscher Sprachatlas an der Philipps-Universität Marburg, das in diesem Jahr sein 150-jähriges Bestehen feiert, fungiert als Kontakt- und Koordinationsstelle des neu gegründeten Netzwerks. Mit einem der weltweit größten Bestände an regionalen Sprachdaten des Deutschen nimmt Marburg eine Schlüsselrolle dabei ein, wie diese einzigartigen Ressourcen für das KI-Zeitalter erschlossen werden können. Das Netzwerk wurde bei einem interdisziplinären Scoping-Workshop gegründet, der von der VolkswagenStiftung unterstützt wurde.

    Geleitet wurde der Workshop vom Deutschen Sprachatlas unter der Federführung von Prof. Dr. Hanna Fischer und Prof. Dr. Alfred Lameli. Aus Marburg war zudem der KI-Forscher Prof. Dr. Daniel Braun beteiligt.


    Contact for scientific information:

    Prof. Dr. Alfred Lameli
    Direktor des Forschungszentrums Deutscher Sprachatlas
    Philipps-Universität Marburg
    Tel.: 06421 28-22634
    E-Mail: lameli@uni-marburg.de

    Prof. Dr. Hanna Fischer
    Stv. Direktorin des Forschungszentrums Deutscher Sprachatlas
    Philipps-Universität Marburg
    Tel.: 06421 28-24591
    E-Mail: hanna.fischer@staff.uni-marburg.de


    Original publication:

    Originalveröffentlichung im Open Access: Netzwerk für Regionale Sprache und Künstliche Intelligenz: „Regionale Sprache und Künstliche Intelligenz im Zeitalter der digitalen Transformation“. Zeitschrift für Dialektologie und Linguistik (ZDL), 2026, DOI 10.25162/zdl-2026-0001


    Images

    Criteria of this press release:
    Journalists
    Information technology, Language / literature
    transregional, national
    Transfer of Science or Research
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).