Wie die KI Dialekte lernen kann

idw-News App:

26.02.2026 15:11

Wie die KI Dialekte lernen kann

Dr. Gabriele Neumann Stabsstelle Hochschulkommunikation
Philipps-Universität Marburg

Regionalsprachen sind blinde Flecken in Spracherkennung

Schon mal in der telefonischen Warteschleife mit der KI Schwäbisch gesprochen? Oder Bairisch? Die Aussicht auf Erfolg scheint gering, konstatieren rund 35 Wissenschaftler*innen aus sieben Ländern unter Federführung des Forschungszentrums Deutscher Sprachatlas (DSA) an der Uni Marburg in einem Positionspapier zur „Zukunft der Regionalsprachenforschung“. Denn Sprachmodelle werden nur mit Texten und Aufnahmen in Standardsprache trainiert. Die Folge: Dialekte und Regionalsprachen sind im digitalen Raum weitgehend unsichtbar. Um das zu ändern haben die Autor*innen aus den Forschungsbereichen Regionalsprachenforschung, Computerlinguistik und KI-Forschung das „Netzwerk Regionale Sprache und Künstliche Intelligenz“ gegründet. Sie wollen die Potenziale von KI nutzen, die kulturelle Vielfalt abbilden und die digitale Transformation gestalten.

„Dialekte sind kein Randphänomen – sie sind Träger kultureller Identität und Ausdruck regionaler Zugehörigkeit für Millionen von Menschen. Wenn KI-Systeme diese sprachliche Vielfalt nicht erkennen, nicht analysieren und nicht authentisch abbilden können, dann bleibt ein zentraler Teil unseres kulturellen Erbes im digitalen Raum schlicht unsichtbar. Wir haben als Regionalsprachenforschung die Expertise, das zu ändern – aber wir brauchen dafür bessere Daten, mehr Kooperation mit der KI-Forschung und Förderstrukturen, die langfristig angelegt sind“, sagt Prof. Dr. Alfred Lameli, Direktor des Sprachatlas.

Für die Regionalsprachenforschung ergebe sich durch die rapide Entwicklung der KI-Technologie der letzten Jahre ein großes Innovationspotenzial. Zugleich komme dem Fach hinsichtlich der Repräsentation regionaler Sprache im digitalen Raum eine besondere Verantwortung zu. Denn Ziel sei, dass alle Menschen von digitalen Diensten und Dialogsystemen gleichbehandelt werden. Momentan werden ältere Menschen, die im Alltag Dialekt sprechen, oder Bewohner*innen ländlicher Regionen schlechter bedient als Menschen, die Hochsprache sprechen. „Das ist mehr als eine Unannehmlichkeit – es ist eine Frage gesellschaftlicher Teilhabe und kultureller Identität“, betont Lameli.

Damit Sprachmodelle Dialekte und Regionalsprachen gut verarbeiten können, müssen die Daten standardisiert und digitalisiert vorliegen. Und da liegt nach Auffassung der Autor*innen das größte Problem: Zwar gibt es sehr viele Daten auch in internationalen Kontexten. Es fehlt aber an ausreichend großen Mengen an Daten, die rechtssicher zugänglich und nutzbar sind und in hoher Qualität aufbereitet wurden. Notwendig ist eine einheitliche Digitalisierung nach den so genannten FAIR-Prinzipien: Findable (auffindbar), Accessible (zugänglich), Interoperable (interoperabel) und Reusable (wiederverwendbar). Dazu gehören eine systematische Sammlung gesprochener Alltagssprache, umfassende Erschließung der Metadaten, offene Lizenzierung und auch die Aufbereitung historischer Bestände.

Ein Ziel könnte ein Übersetzungstool für Dialekte sein, erklärt Prof. Dr. Hanna Fischer. „Damit könnte es möglich werden, Dialekte in Sprachinseln zu erhalten und neu sichtbar werden zu lassen. Für das Training eines solchen Modells könnte der Datenbestand des Deutschen Sprachatlas eine entscheidende Grundlage bilden. Doch dafür müssen die vorhandenen Daten erst fit für die KI gemacht werden“, erläutert die stellvertretende DSA-Direktorin.

Hintergrund: Netzwerk Regionale Sprache und Künstliche Intelligenz

Das Forschungszentrum Deutscher Sprachatlas an der Philipps-Universität Marburg, das in diesem Jahr sein 150-jähriges Bestehen feiert, fungiert als Kontakt- und Koordinationsstelle des neu gegründeten Netzwerks. Mit einem der weltweit größten Bestände an regionalen Sprachdaten des Deutschen nimmt Marburg eine Schlüsselrolle dabei ein, wie diese einzigartigen Ressourcen für das KI-Zeitalter erschlossen werden können. Das Netzwerk wurde bei einem interdisziplinären Scoping-Workshop gegründet, der von der VolkswagenStiftung unterstützt wurde.

Geleitet wurde der Workshop vom Deutschen Sprachatlas unter der Federführung von Prof. Dr. Hanna Fischer und Prof. Dr. Alfred Lameli. Aus Marburg war zudem der KI-Forscher Prof. Dr. Daniel Braun beteiligt.

Wissenschaftliche Ansprechpartner:

Prof. Dr. Alfred Lameli
Direktor des Forschungszentrums Deutscher Sprachatlas
Philipps-Universität Marburg
Tel.: 06421 28-22634
E-Mail: lameli@uni-marburg.de

Prof. Dr. Hanna Fischer
Stv. Direktorin des Forschungszentrums Deutscher Sprachatlas
Philipps-Universität Marburg
Tel.: 06421 28-24591
E-Mail: hanna.fischer@staff.uni-marburg.de

Originalpublikation:

Originalveröffentlichung im Open Access: Netzwerk für Regionale Sprache und Künstliche Intelligenz: „Regionale Sprache und Künstliche Intelligenz im Zeitalter der digitalen Transformation“. Zeitschrift für Dialektologie und Linguistik (ZDL), 2026, DOI 10.25162/zdl-2026-0001

Bilder

Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik, Sprache / Literatur
überregional
Forschungs- / Wissenstransfer
Deutsch

idw-News App:

Wie die KI Dialekte lernen kann

Dr. Gabriele Neumann Stabsstelle Hochschulkommunikation Philipps-Universität Marburg

Wissenschaftliche Ansprechpartner:

Originalpublikation:

Erweiterte Suche

Umfang der Suche

Datum der Veröffentlichung

Hilfe

Die Suche / Erweiterte Suche im idw-Archiv

Verknüpfungen

Klammern

Wortgruppen

Auswahlkriterien

Dr. Gabriele Neumann Stabsstelle Hochschulkommunikation
Philipps-Universität Marburg