idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
10.07.2002 10:50

Saarbrücker Forscher bringen Wörterbücher automatisch auf aktuellsten Stand

Claudia Brettar Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Der Saar-Uni-Germanist Prof. Lutz Götze hatte in detaillierter "Handarbeit" das Bertelsmann Rechtschreibwörterbuch nach der Rechtschreibreform als Autor maßgeblich verfasst.
    Nun schreibt ein weiterer Saarbrücker Wissenschaftler "Wörterbuch-Geschichte": Der Computerlinguist und Leibniz-Preisträger Prof. Manfred Pinkal entwickelt mit seiner Firma CLT Sprachtechnologie richtungsweisende Verfahren, die vollautomatisch neue Wörter und neue Wortbedeutungen identifizieren. Ergebnisse dieser Forschung finden sich in der soeben erschienenen Neuauflage des Wörterbuchs "Wahrig. Die deutsche Rechtschreibung" des Bertelsmann Lexikon Verlages.

    Immer schnellere Entwicklungen in allen Lebensbereichen und der rasante technische Fortschritt verändern unseren Sprachgebrauch nachhaltig. Wörter wie "simsen", "Ceranfeld" oder "Beamer", "NEMAX" und "risikofreudig" sind längst Bestandteil unserer Alltagssprache. Um am Puls der Zeit zu bleiben, müssen Wörterbücher also regelmäßig überarbeitet werden.
    Wie aber findet man die neuen Wortschöpfungen und neuen Wortbedeutungen?
    In Saarbrücken werden auf diesem Gebiet Maßstäbe gesetzt: So bereits seit Jahren durch den Saarbrücker Germanist und Wörterbuch-Autor Prof. Lutz Götze - auch in der Neuauflage des Bertelsmann Rechtschreibwörterbuches vor drei Jahren trug er entscheidend dazu bei, dass neben der neuen Rechtschreibung auch die neuesten Wörter dargestellt werden konnten.
    Nun beschreitet Professor Manfred Pinkal mit dem Forscherteam der von ihm gegründeten Firma CLT Sprachtechnologie im Rahmen einer Kooperation mit dem Bertelsmann Lexikon Verlag neue Wege auf dem Gebiet des Wörterbuches: mit einem neuen computerlinguistischen Verfahren, dem WAHRIG Textkorpus digital. Diese rund 500 Millionen Wörter umfassende Datenbank brachte jetzt das neue Bertelsmann Wörterbuch "Wahrig. Die deutsche Rechtschreibung" auf aktuellsten Stand - und zwar vollautomatisch.
    Quelle der neuen Wörter und Bedeutungsvarianten sind Zeitungen und Zeitschriften des deutschsprachigen Raums. Mittels computerlinguistischer Werkzeuge und Verfahren werden die Texte und Wörter aufbereitet und analysiert - von den bislang erfassten 500 Millionen Textwörtern und Wortformen stehen viereinhalb Millionen nicht im Wörterbuch. Das System untersucht diese Wörter syntaktisch daraufhin, ob sie Artikel, Adjektiv oder Verb sind und identifiziert die Wortstämme. Unterschiedliche Filtermethoden scheiden Namen und Rechtschreibfehler aus, die verbleibenden Wörter werden nach Häufigkeit und Vorkommens-Mustern sortiert.
    5000 interessante neue Wörter wurden so für die neueste Auflage des "Wahrig. Die deutsche Rechtschreibung" ausfindig gemacht.
    Mit Hilfe von "Wortfrequenzlisten" wurde dann entschieden, welche Wörter letztendlich als Neueinträge das Rennen machen: Für jedes Wort wurde - natürlich ebenfalls vollautomatisch - eine repräsentative Liste von Belegen erstellt; 20 davon erhielt die Redaktion des Bertelsmann Lexikon Verlages pro Wort. 1100 neue Wörter nahm sie in die aktuelle Neuauflage auf.

    Der gesamte Weg - von der Konzeption und Realisierung des Korpus über die Entwicklung von Filter- und Auswahlverfahren bis zur Endredaktion des Wörterbuchs - wurde in der kurzen Zeit von einem Jahr zurückgelegt.
    Nächste Etappe der Kooperation ist die vollständige Neu-Bearbeitung des Großen Wahrig, der auch Bedeutungserklärungen und Anwendungsbeispiele gibt.

    Sie haben Fragen? Dann setzen Sie sich bitte in Verbindung mit Prof. Manfred Pinkal (Email: pinkal@coli.uni-sb.de) oder Dr. Bettina Klingner (Email: klingner@clt-st.de)
    Tel: 0681-302 3823 Fax: 0681-302 6632

    Artikel im Uni-Magazin campus:
    http://www.uni-saarland.de/verwalt/presse/campus/2002/2/07-C3-PO-f.html


    Weitere Informationen:

    http://www.uni-saarland.de/verwalt/presse/campus/2002/2/07-C3-PO-f.html


    Bilder

    Merkmale dieser Pressemitteilung:
    Gesellschaft, Informationstechnik, Medien- und Kommunikationswissenschaften, Sprache / Literatur, Wirtschaft
    überregional
    Forschungsergebnisse, Wissenschaftliche Publikationen
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).