idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
11.07.2006 08:38

Neue Version des deutschen Wortnetzes GermaNet erschienen

Michael Seifert Hochschulkommunikation
Eberhard Karls Universität Tübingen

    Tübinger Computerlinguisten optimieren den Gebrauch des deutschen Wortschatzes

    Die neue und erheblich erweiterte Version 5.0 des deutschen Wortnetzes GermaNet wurde Ende Mai dieses Jahres freigegeben. Damit wird eine knapp zehnjährige, zum großen Teil vom Land Baden-Württemberg finanzierte Entwicklung auf eine neue Stufe gehoben. Seit 1996 wird am Seminar für Sprachwissenschaft der Universität Tübingen, Lehrstuhl von Professor Dr. Erhard Hinrichs, am deutschen Wortnetz GermaNet gearbeitet. Wortnetze zeigen die häufigsten und wichtigsten Wörter einer Sprache und ihre bedeutungstragenden Beziehungen zu anderen Wörtern der Sprache auf. Der Wortschatz einer Sprache wird nach den Bedeutungen der lexikalischen Einheiten organisiert. Gleichbedeutende Wörter, z.B. Auto und Wagen, werden zu Synonymenmengen zusammengefasst, Synsets genannt. Sie sind durch eine Vielzahl von lexikalischen Relationen miteinander verbunden. Eine besonders wichtige Rolle spielt dabei die Über- und Unterordnung, z.B. zwischen Motor und Ottomotor, und die Teil-Ganzes-Beziehung, z.B. zwischen Motor und Automobil. In GermaNet ist mit nunmehr gut 76 000 Wörtern der alltagssprachliche Wortschatz der deutschen Sprache abgebildet.
    "Das Hauptmotiv für die Entwicklung eines Wortnetzes war die Erkenntnis, dass sprachtechnologische Anwendungen in einer realistischen Größe ohne lexikalisch-semantisches Wissen nicht zu haben sind", erläutert Erhard Hinrichs. "Wir Computerlinguisten mussten uns dieser Herausforderung stellen und diese Ressourcen in einem langwierigen Prozess erstellen." Computer können zwar bei der Auswahl der Wörter aus großen Textmengen und bei der formalen Prüfung der Arbeitsergebnisse helfen. Die lexikalisch-semantische Beschreibung und Verknüpfung der Wörter kann aber nicht automatisiert werden. Nur die gründliche Arbeit ausgebildeter Sprachwissenschaftler und Lexikographen im Team kann die Qualität liefern, die für sprachtechnologische Anwendungen benötigt wird.

    GermaNet wird heute in akademischen und kommerziellen Anwendungen der Informationsverarbeitung verwendet. "Die Optimierung von Suchmaschinen ist ein gutes Beispiel", erläutert Claudia Kunze, jahrelang leitende Mitarbeiterin im Projekt. "Suchbegriffe können auf eine bestimmte Bedeutung eingeengt, die Menge an Suchbegriffen durch Nachbarn im Netz erweitert werden. Auf diese Weise kann die kaum überschaubare Menge von Dokumenten, mit der der Benutzer oftmals überfordert ist, genauer auf dessen Suchbedürfnisse angepasst werden." Auch bei der computergestützten Übersetzung sind Wortnetze von großem Nutzen. : durch die Zuordnung von syntaktischen Strukturen und semantischen Interpretationen wird die Mehrdeutigkeit eines Begriffs aufgehoben und dieser eindeutig gemacht.

    Einen weiteren Entwicklungsschub erwartet das GermaNet-Team von einer Kooperation mit Dr. Iryna Gurevych vom Fachgebiet Telekooperation an der Technischen Universität Darmstadt. In einem von der DFG geförderten Projekt versucht Gurevychs Team, Berufswunschprofile von Schulabgängern besser auf die Berufsbeschreibungen der Bundesagentur für Arbeit abzubilden, um mögliche Berufe automatisch zu ermitteln. Im Rahmen dieses Projektes wird GermaNet nicht nur als lexikalische Ressource genutzt, sondern auch gezielt erweitert. Als weitere Neuerung werden dabei neue lexikalische Relationen eingeführt, die Tätigkeiten bezeichnende Verben (z.B. pflegen) mit den für diese Tätigkeiten typischen Bezugsnomen (Menschen, Pflanzen), Instrumenten (Verband, Schere) und Orten (Krankenhaus, Garten) verbinden. Dies wird nicht nur für die beiden Projektpartner, sondern auch für alle anderen Anwender von Nutzen sein.

    Kontakt und Informationen:

    Prof. Dr. Erhard Hinrichs
    Seminar für Sprachwissenschaft
    Wilhelmstr. 19, 72074 Tübingen
    Tel.: 07071/29-74279, Fax: 07071/29-5214
    E-Mail: eh@sfs.uni-tuebingen.de
    Webseite: http://www.sfs.uni-tuebingen.de


    Bilder

    Merkmale dieser Pressemitteilung:
    Sprache / Literatur
    überregional
    Forschungsergebnisse, Wissenschaftliche Publikationen
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).