idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/10/2002 10:50

Saarbrücker Forscher bringen Wörterbücher automatisch auf aktuellsten Stand

Claudia Brettar Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Der Saar-Uni-Germanist Prof. Lutz Götze hatte in detaillierter "Handarbeit" das Bertelsmann Rechtschreibwörterbuch nach der Rechtschreibreform als Autor maßgeblich verfasst.
    Nun schreibt ein weiterer Saarbrücker Wissenschaftler "Wörterbuch-Geschichte": Der Computerlinguist und Leibniz-Preisträger Prof. Manfred Pinkal entwickelt mit seiner Firma CLT Sprachtechnologie richtungsweisende Verfahren, die vollautomatisch neue Wörter und neue Wortbedeutungen identifizieren. Ergebnisse dieser Forschung finden sich in der soeben erschienenen Neuauflage des Wörterbuchs "Wahrig. Die deutsche Rechtschreibung" des Bertelsmann Lexikon Verlages.

    Immer schnellere Entwicklungen in allen Lebensbereichen und der rasante technische Fortschritt verändern unseren Sprachgebrauch nachhaltig. Wörter wie "simsen", "Ceranfeld" oder "Beamer", "NEMAX" und "risikofreudig" sind längst Bestandteil unserer Alltagssprache. Um am Puls der Zeit zu bleiben, müssen Wörterbücher also regelmäßig überarbeitet werden.
    Wie aber findet man die neuen Wortschöpfungen und neuen Wortbedeutungen?
    In Saarbrücken werden auf diesem Gebiet Maßstäbe gesetzt: So bereits seit Jahren durch den Saarbrücker Germanist und Wörterbuch-Autor Prof. Lutz Götze - auch in der Neuauflage des Bertelsmann Rechtschreibwörterbuches vor drei Jahren trug er entscheidend dazu bei, dass neben der neuen Rechtschreibung auch die neuesten Wörter dargestellt werden konnten.
    Nun beschreitet Professor Manfred Pinkal mit dem Forscherteam der von ihm gegründeten Firma CLT Sprachtechnologie im Rahmen einer Kooperation mit dem Bertelsmann Lexikon Verlag neue Wege auf dem Gebiet des Wörterbuches: mit einem neuen computerlinguistischen Verfahren, dem WAHRIG Textkorpus digital. Diese rund 500 Millionen Wörter umfassende Datenbank brachte jetzt das neue Bertelsmann Wörterbuch "Wahrig. Die deutsche Rechtschreibung" auf aktuellsten Stand - und zwar vollautomatisch.
    Quelle der neuen Wörter und Bedeutungsvarianten sind Zeitungen und Zeitschriften des deutschsprachigen Raums. Mittels computerlinguistischer Werkzeuge und Verfahren werden die Texte und Wörter aufbereitet und analysiert - von den bislang erfassten 500 Millionen Textwörtern und Wortformen stehen viereinhalb Millionen nicht im Wörterbuch. Das System untersucht diese Wörter syntaktisch daraufhin, ob sie Artikel, Adjektiv oder Verb sind und identifiziert die Wortstämme. Unterschiedliche Filtermethoden scheiden Namen und Rechtschreibfehler aus, die verbleibenden Wörter werden nach Häufigkeit und Vorkommens-Mustern sortiert.
    5000 interessante neue Wörter wurden so für die neueste Auflage des "Wahrig. Die deutsche Rechtschreibung" ausfindig gemacht.
    Mit Hilfe von "Wortfrequenzlisten" wurde dann entschieden, welche Wörter letztendlich als Neueinträge das Rennen machen: Für jedes Wort wurde - natürlich ebenfalls vollautomatisch - eine repräsentative Liste von Belegen erstellt; 20 davon erhielt die Redaktion des Bertelsmann Lexikon Verlages pro Wort. 1100 neue Wörter nahm sie in die aktuelle Neuauflage auf.

    Der gesamte Weg - von der Konzeption und Realisierung des Korpus über die Entwicklung von Filter- und Auswahlverfahren bis zur Endredaktion des Wörterbuchs - wurde in der kurzen Zeit von einem Jahr zurückgelegt.
    Nächste Etappe der Kooperation ist die vollständige Neu-Bearbeitung des Großen Wahrig, der auch Bedeutungserklärungen und Anwendungsbeispiele gibt.

    Sie haben Fragen? Dann setzen Sie sich bitte in Verbindung mit Prof. Manfred Pinkal (Email: pinkal@coli.uni-sb.de) oder Dr. Bettina Klingner (Email: klingner@clt-st.de)
    Tel: 0681-302 3823 Fax: 0681-302 6632

    Artikel im Uni-Magazin campus:
    http://www.uni-saarland.de/verwalt/presse/campus/2002/2/07-C3-PO-f.html


    More information:

    http://www.uni-saarland.de/verwalt/presse/campus/2002/2/07-C3-PO-f.html


    Images

    Criteria of this press release:
    Economics / business administration, Information technology, Language / literature, Media and communication sciences, Social studies
    transregional, national
    Research results, Scientific Publications
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).