idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
20.07.2022 16:31

Big Data zu kleinen Sprachen: Veröffentlichung der DoReCo-Online-Datenbank

Dr. Fabienne Salfner Leibniz-Zentrum Allgemeine Sprachwissenschaft (ZAS)
Geisteswissenschaftliche Zentren Berlin e.V. (GWZ)

    Am 29. Juli treffen sich Linguist:innen aus aller Welt am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin, um die Online-Veröffentlichung der DoReCo-Datenbank zu feiern. Die Datenbank bietet Zugang zu Audioaufnahmen von mehr als 50 Sprachen, zusammen mit Transkriptionen, Übersetzungen und detaillierten linguistischen Analysen. Der Eintritt zu der hybriden Veranstaltung ist frei, eine Anmeldung ist jedoch erforderlich. Journalist:innen sind zudem eingeladen, die DoReCo-Projektleiter im Vorfeld zwischen 14 und 15 Uhr zu treffen. Weitere Informationen befinden sich am Ende der Pressemitteilung.

    Die Online-Datenbank des Projekts DoReCo (Language Documentation Reference Corpus) bietet ein unvergleichliches Panorama der Vielfalt der Sprachen der Welt durch mündliche Erzählungen von Nordsibirien bis Südafrika und von Europa bis Australien. DoReCo enthält eine Auswahl der besten Ergebnisse akribischer Arbeit von Sprachwissenschaftler:innen, die jahrelang kleine und bedrohte Sprachen analysiert haben in Zusammenarbeit mit deren Sprecher:innen. Mit DoReCo haben nun Wissenschaftler:innen aus der ganzen Welt Zugang zu diesen Aufnahmen und Analysen. Der Blick durch dieses Kaleidoskop von Sprachen wird helfen, die Geheimnisse der sprachlichen Vielfalt zu entschlüsseln, aber auch ihre gemeinsamen Merkmale hervorzuheben, die trotz der Unterschiedlichkeiten bestehen.

    Frank Seifart, wissenschaftlicher Mitarbeiter am ZAS und Leiter des DoReCo-Projekts, kommentiert: "Ich freue mich sehr darüber, dass wir die Vielfalt der menschlichen Sprachen nun nicht mehr nur anhand von abstrakten Aussagen aus Grammatikbüchern untersuchen können, sondern durch die reiche Ausdruckskraft spontan produzierter Sprache."

    DoReCo hat ein Netz von fast hundert Linguist:innen aufgebaut, die sprachliche Primärdaten gesammelt und analysiert haben. Die Verarbeitung dieser Daten wurde durch ein deutsch-französisches Projekt ermöglicht, das vom ZAS in Berlin und dem Dynamic Du Langage Institut in Lyon geleitet und gemeinsam von der deutschen DFG und der französischen ANR (Agence Nationale de la Recherche) finanziert wurde. Drei Jahre lang hat das Projektteam die vielfältigen Transkriptionen, Übersetzungen und linguistischen Analysen erweitert und vereinheitlicht, um vergleichende Analysen damit zu ermöglichen. Die DoReCo-Daten entsprechen auch den ethischen und wissenschaftlichen FAIR-Prinzipien (Findability, Accessibility, Interoperability, Re-usability) und sind unter Creative Commons-Lizenzen zugänglich.

    Die DoReCo-Sammlung von 50 Sprachen ist die bisher größte und repräsentativste Stichprobe der 7.000 noch gesprochenen menschlichen Sprachen bezüglich audiovisuell aufgezeichneter und von Experten analysierten Texten. Im Vergleich zu den bisher zur Verfügung stehenden Ressourcen stellt dies für die Wissenschaftler:innen einen erheblichen Durchbruch dar, denn Daten zu den meisten DoReCo-Sprachen waren für die Forschung bisher bestenfalls nur mühsam auffindbar. Die Veröffentlichung mündlicher Aufnahmen in Verbindung mit umfangreichen linguistischen Analysen eröffnet neue Wege für die Erforschung der einzigartigen menschlichen Fähigkeit, erstaunlich vielfältige Sprachsysteme zu entwickeln, zu erhalten und zu verwenden. Für die DoReCo-Sprachen Dalabon (in Australien gesprochen), Resígaro (in Südamerika gesprochen) und Kamas (in Sibirien gesprochen) ist die Zahl der Sprecher:innen jedoch bereits dramatisch zurückgegangen, so dass es heute nur noch eine Handvoll, nur noch einen oder gar keine Sprecher:innen mehr gibt. Dies führt unweigerlich dazu, dass sich die Fenster, die sie zur kulturellen und sprachlichen Vielfalt der Menschheit geöffnet haben, bald schließen, wodurch sich die Bedeutsamkeit des von DoReCo bereitgestellten dokumentarischen Materials noch erhöht.

    Veranstaltung:
    Freitag 29.7.2022, 15:00 - 17:30 Uhr, hybrid am Leibniz Zentrum Allgemeine Sprachwissenschaft, Schützenstr. 18, 10117 Berlin. Teilnahme kostenlos, Registrierung bitte bis zum 22.7.2022 unter https://www.leibniz-zas.de/de/das-zas/veranstaltungen/details/events/new-doreco-...

    Für Journalist:innen:
    Journalist:innen sind eingeladen, sich zwischen 14 und 15 Uhr im Vorfeld der Veranstaltung mit den Projektleitern zu treffen. Für die Teilnahme schreiben Sie bitte bis zum 27. Juli eine E-Mail an Frank Seifart (seifart@leibniz-zas.de) oder François Pellegrino (francois.pellegrino@univ-lyon2.fr). Es ist möglich, persönlich oder per Zoom teilzunehmen.

    Die DoReCo-Datenbank wurde im Rahmen des DoReCo-Projekts von 2019 bis 2022 erstellt. Dieses Projekt wurde durch ein ANR-DFG-Stipendium (ANR-18-FRAL-0010-01, KR951/17-1) finanziert, das an Frank Seifart, Manfred Krifka (März bis Juli 2019) und François Pellegrino (August 2019 bis August 2022) vergeben wurde. Das Projekt war am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin und am Laboratoire Dynamique Du Langage (UMR5596, CNRS & Université Lyon 2) in Lyon angesiedelt und kooperierte mit dem Bayerischen Archiv für Sprachsignale, München. Ziel des DoReCo-Projekts war die Erforschung lokaler Variationen der Sprechgeschwindigkeit auf der Grundlage einer bisher breitesten Stichprobe der Sprachen der Welt.


    Wissenschaftliche Ansprechpartner:

    Frank Seifart
    seifart@leibniz-zas.de
    Phone: +49 30 20192 407

    François Pellegrino
    francois.pellegrino@univ-lyon2.fr


    Weitere Informationen:

    https://doreco.info Webseite des Projekts


    Bilder

    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler, jedermann
    Kulturwissenschaften, Sprache / Literatur
    überregional
    Forschungs- / Wissenstransfer, Pressetermine
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).