idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
07/11/2006 08:38

Neue Version des deutschen Wortnetzes GermaNet erschienen

Michael Seifert Hochschulkommunikation
Eberhard Karls Universität Tübingen

    Tübinger Computerlinguisten optimieren den Gebrauch des deutschen Wortschatzes

    Die neue und erheblich erweiterte Version 5.0 des deutschen Wortnetzes GermaNet wurde Ende Mai dieses Jahres freigegeben. Damit wird eine knapp zehnjährige, zum großen Teil vom Land Baden-Württemberg finanzierte Entwicklung auf eine neue Stufe gehoben. Seit 1996 wird am Seminar für Sprachwissenschaft der Universität Tübingen, Lehrstuhl von Professor Dr. Erhard Hinrichs, am deutschen Wortnetz GermaNet gearbeitet. Wortnetze zeigen die häufigsten und wichtigsten Wörter einer Sprache und ihre bedeutungstragenden Beziehungen zu anderen Wörtern der Sprache auf. Der Wortschatz einer Sprache wird nach den Bedeutungen der lexikalischen Einheiten organisiert. Gleichbedeutende Wörter, z.B. Auto und Wagen, werden zu Synonymenmengen zusammengefasst, Synsets genannt. Sie sind durch eine Vielzahl von lexikalischen Relationen miteinander verbunden. Eine besonders wichtige Rolle spielt dabei die Über- und Unterordnung, z.B. zwischen Motor und Ottomotor, und die Teil-Ganzes-Beziehung, z.B. zwischen Motor und Automobil. In GermaNet ist mit nunmehr gut 76 000 Wörtern der alltagssprachliche Wortschatz der deutschen Sprache abgebildet.
    "Das Hauptmotiv für die Entwicklung eines Wortnetzes war die Erkenntnis, dass sprachtechnologische Anwendungen in einer realistischen Größe ohne lexikalisch-semantisches Wissen nicht zu haben sind", erläutert Erhard Hinrichs. "Wir Computerlinguisten mussten uns dieser Herausforderung stellen und diese Ressourcen in einem langwierigen Prozess erstellen." Computer können zwar bei der Auswahl der Wörter aus großen Textmengen und bei der formalen Prüfung der Arbeitsergebnisse helfen. Die lexikalisch-semantische Beschreibung und Verknüpfung der Wörter kann aber nicht automatisiert werden. Nur die gründliche Arbeit ausgebildeter Sprachwissenschaftler und Lexikographen im Team kann die Qualität liefern, die für sprachtechnologische Anwendungen benötigt wird.

    GermaNet wird heute in akademischen und kommerziellen Anwendungen der Informationsverarbeitung verwendet. "Die Optimierung von Suchmaschinen ist ein gutes Beispiel", erläutert Claudia Kunze, jahrelang leitende Mitarbeiterin im Projekt. "Suchbegriffe können auf eine bestimmte Bedeutung eingeengt, die Menge an Suchbegriffen durch Nachbarn im Netz erweitert werden. Auf diese Weise kann die kaum überschaubare Menge von Dokumenten, mit der der Benutzer oftmals überfordert ist, genauer auf dessen Suchbedürfnisse angepasst werden." Auch bei der computergestützten Übersetzung sind Wortnetze von großem Nutzen. : durch die Zuordnung von syntaktischen Strukturen und semantischen Interpretationen wird die Mehrdeutigkeit eines Begriffs aufgehoben und dieser eindeutig gemacht.

    Einen weiteren Entwicklungsschub erwartet das GermaNet-Team von einer Kooperation mit Dr. Iryna Gurevych vom Fachgebiet Telekooperation an der Technischen Universität Darmstadt. In einem von der DFG geförderten Projekt versucht Gurevychs Team, Berufswunschprofile von Schulabgängern besser auf die Berufsbeschreibungen der Bundesagentur für Arbeit abzubilden, um mögliche Berufe automatisch zu ermitteln. Im Rahmen dieses Projektes wird GermaNet nicht nur als lexikalische Ressource genutzt, sondern auch gezielt erweitert. Als weitere Neuerung werden dabei neue lexikalische Relationen eingeführt, die Tätigkeiten bezeichnende Verben (z.B. pflegen) mit den für diese Tätigkeiten typischen Bezugsnomen (Menschen, Pflanzen), Instrumenten (Verband, Schere) und Orten (Krankenhaus, Garten) verbinden. Dies wird nicht nur für die beiden Projektpartner, sondern auch für alle anderen Anwender von Nutzen sein.

    Kontakt und Informationen:

    Prof. Dr. Erhard Hinrichs
    Seminar für Sprachwissenschaft
    Wilhelmstr. 19, 72074 Tübingen
    Tel.: 07071/29-74279, Fax: 07071/29-5214
    E-Mail: eh@sfs.uni-tuebingen.de
    Webseite: http://www.sfs.uni-tuebingen.de


    Images

    Criteria of this press release:
    Language / literature
    transregional, national
    Research results, Scientific Publications
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).