idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/20/2022 16:31

Big Data zu kleinen Sprachen: Veröffentlichung der DoReCo-Online-Datenbank

Dr. Fabienne Salfner Leibniz-Zentrum Allgemeine Sprachwissenschaft (ZAS)
Geisteswissenschaftliche Zentren Berlin e.V. (GWZ)

    Am 29. Juli treffen sich Linguist:innen aus aller Welt am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin, um die Online-Veröffentlichung der DoReCo-Datenbank zu feiern. Die Datenbank bietet Zugang zu Audioaufnahmen von mehr als 50 Sprachen, zusammen mit Transkriptionen, Übersetzungen und detaillierten linguistischen Analysen. Der Eintritt zu der hybriden Veranstaltung ist frei, eine Anmeldung ist jedoch erforderlich. Journalist:innen sind zudem eingeladen, die DoReCo-Projektleiter im Vorfeld zwischen 14 und 15 Uhr zu treffen. Weitere Informationen befinden sich am Ende der Pressemitteilung.

    Die Online-Datenbank des Projekts DoReCo (Language Documentation Reference Corpus) bietet ein unvergleichliches Panorama der Vielfalt der Sprachen der Welt durch mündliche Erzählungen von Nordsibirien bis Südafrika und von Europa bis Australien. DoReCo enthält eine Auswahl der besten Ergebnisse akribischer Arbeit von Sprachwissenschaftler:innen, die jahrelang kleine und bedrohte Sprachen analysiert haben in Zusammenarbeit mit deren Sprecher:innen. Mit DoReCo haben nun Wissenschaftler:innen aus der ganzen Welt Zugang zu diesen Aufnahmen und Analysen. Der Blick durch dieses Kaleidoskop von Sprachen wird helfen, die Geheimnisse der sprachlichen Vielfalt zu entschlüsseln, aber auch ihre gemeinsamen Merkmale hervorzuheben, die trotz der Unterschiedlichkeiten bestehen.

    Frank Seifart, wissenschaftlicher Mitarbeiter am ZAS und Leiter des DoReCo-Projekts, kommentiert: "Ich freue mich sehr darüber, dass wir die Vielfalt der menschlichen Sprachen nun nicht mehr nur anhand von abstrakten Aussagen aus Grammatikbüchern untersuchen können, sondern durch die reiche Ausdruckskraft spontan produzierter Sprache."

    DoReCo hat ein Netz von fast hundert Linguist:innen aufgebaut, die sprachliche Primärdaten gesammelt und analysiert haben. Die Verarbeitung dieser Daten wurde durch ein deutsch-französisches Projekt ermöglicht, das vom ZAS in Berlin und dem Dynamic Du Langage Institut in Lyon geleitet und gemeinsam von der deutschen DFG und der französischen ANR (Agence Nationale de la Recherche) finanziert wurde. Drei Jahre lang hat das Projektteam die vielfältigen Transkriptionen, Übersetzungen und linguistischen Analysen erweitert und vereinheitlicht, um vergleichende Analysen damit zu ermöglichen. Die DoReCo-Daten entsprechen auch den ethischen und wissenschaftlichen FAIR-Prinzipien (Findability, Accessibility, Interoperability, Re-usability) und sind unter Creative Commons-Lizenzen zugänglich.

    Die DoReCo-Sammlung von 50 Sprachen ist die bisher größte und repräsentativste Stichprobe der 7.000 noch gesprochenen menschlichen Sprachen bezüglich audiovisuell aufgezeichneter und von Experten analysierten Texten. Im Vergleich zu den bisher zur Verfügung stehenden Ressourcen stellt dies für die Wissenschaftler:innen einen erheblichen Durchbruch dar, denn Daten zu den meisten DoReCo-Sprachen waren für die Forschung bisher bestenfalls nur mühsam auffindbar. Die Veröffentlichung mündlicher Aufnahmen in Verbindung mit umfangreichen linguistischen Analysen eröffnet neue Wege für die Erforschung der einzigartigen menschlichen Fähigkeit, erstaunlich vielfältige Sprachsysteme zu entwickeln, zu erhalten und zu verwenden. Für die DoReCo-Sprachen Dalabon (in Australien gesprochen), Resígaro (in Südamerika gesprochen) und Kamas (in Sibirien gesprochen) ist die Zahl der Sprecher:innen jedoch bereits dramatisch zurückgegangen, so dass es heute nur noch eine Handvoll, nur noch einen oder gar keine Sprecher:innen mehr gibt. Dies führt unweigerlich dazu, dass sich die Fenster, die sie zur kulturellen und sprachlichen Vielfalt der Menschheit geöffnet haben, bald schließen, wodurch sich die Bedeutsamkeit des von DoReCo bereitgestellten dokumentarischen Materials noch erhöht.

    Veranstaltung:
    Freitag 29.7.2022, 15:00 - 17:30 Uhr, hybrid am Leibniz Zentrum Allgemeine Sprachwissenschaft, Schützenstr. 18, 10117 Berlin. Teilnahme kostenlos, Registrierung bitte bis zum 22.7.2022 unter https://www.leibniz-zas.de/de/das-zas/veranstaltungen/details/events/new-doreco-...

    Für Journalist:innen:
    Journalist:innen sind eingeladen, sich zwischen 14 und 15 Uhr im Vorfeld der Veranstaltung mit den Projektleitern zu treffen. Für die Teilnahme schreiben Sie bitte bis zum 27. Juli eine E-Mail an Frank Seifart (seifart@leibniz-zas.de) oder François Pellegrino (francois.pellegrino@univ-lyon2.fr). Es ist möglich, persönlich oder per Zoom teilzunehmen.

    Die DoReCo-Datenbank wurde im Rahmen des DoReCo-Projekts von 2019 bis 2022 erstellt. Dieses Projekt wurde durch ein ANR-DFG-Stipendium (ANR-18-FRAL-0010-01, KR951/17-1) finanziert, das an Frank Seifart, Manfred Krifka (März bis Juli 2019) und François Pellegrino (August 2019 bis August 2022) vergeben wurde. Das Projekt war am Leibniz-Zentrum Allgemeine Sprachwissenschaft in Berlin und am Laboratoire Dynamique Du Langage (UMR5596, CNRS & Université Lyon 2) in Lyon angesiedelt und kooperierte mit dem Bayerischen Archiv für Sprachsignale, München. Ziel des DoReCo-Projekts war die Erforschung lokaler Variationen der Sprechgeschwindigkeit auf der Grundlage einer bisher breitesten Stichprobe der Sprachen der Welt.


    Contact for scientific information:

    Frank Seifart
    seifart@leibniz-zas.de
    Phone: +49 30 20192 407

    François Pellegrino
    francois.pellegrino@univ-lyon2.fr


    More information:

    https://doreco.info Webseite des Projekts


    Images

    Criteria of this press release:
    Journalists, Scientists and scholars, all interested persons
    Cultural sciences, Language / literature
    transregional, national
    Press events, Transfer of Science or Research
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).