idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
02/18/2003 10:05

Multilinguale Sprachtechnologie: Gegen E-Mail-Stress und Wissenslücken

Saar - Uni - Presseteam Pressestelle der Universität des Saarlandes
Universität des Saarlandes

    Internationales Kooperationsprojekt unter der Leitung von Saarbrücker Computerlinguisten entwickelt Sprachsysteme mit breitem Anwendungsspektrum

    Wie viel Zeit und Geld könnten manche Unternehmen sparen, wenn die tägliche Flut an E-Mails automatisch bearbeitet würde ... Eine gute Idee, die in der Praxis jedoch auf Probleme stößt: Das alles verstehende Programm, das der Vielfalt von E-Mails - sowohl inhaltlich als auch in der jeweiligen Ausformulierung - gewachsen ist, gibt es nicht.

    Zumindest noch nicht, denn ein neues Forschungsprojekt könnte diese Idee schon bald wahr werden lassen: Ziel der internationalen Kooperation "DeepThought: Hybride Methoden für wissensintensive Informationsextraktion" unter der Leitung des Saarbrücker Computerlinguisten Professor Hans Uszkoreit ist ein Computersystem, das zielgerichtet und zuverlässig Informationen aus Texten zieht.

    Im Konsortium sind neben der Universität des Saarlandes Universitäten aus Trondheim (Norwegen), Cambridge und Sussex (Großbritannien) sowie die Firmen XtraMind Technologies GmbH (Saarbrücken) und CELI s.r.l (Italien) vertreten. Darüber hinaus sind auch das kalifornische Center for the Study of Language and Information (CSLI) und das Deutsche Forschungsinstitut für Künstliche Intelligenz (DFKI), Saarbrücken an DeepThought beteiligt. Das Projekt, das von der Europäischen Union mit 1,7 Millionen Euro gefördert wird, läuft über einen Zeitraum von zwei Jahren und soll im Oktober 2004 abgeschlossen sein.

    Um hybride Methoden handelt es sich bei DeepThought insofern, als sich das System aus zweierlei Arten der Sprachverarbeitung zusammensetzen wird: so genannten flachen und tiefen Verfahren. Derzeit gängige Programme zur Informationsextraktion benutzen flache Verfahren. Diese haben den Vorteil, robust und schnell zu sein, doch gehen sie oberflächlich vor und stehen komplizierten Sätzen hilflos gegenüber. Benutzt man zum Beispiel eine Negation ("Ich möchte heute nicht nach München fahren"), kann das System dies nur schwer verarbeiten. Methoden der "tiefen Verarbeitung" hingegen können die Grammatik und Semantik von Sätzen erkennen, sind aber langsam und empfindlich. Eines der Ziele von DeepThought ist es deshalb, beide Verfahren kompatibel zu machen und in eine Architektur zu integrieren.

    Außerdem soll das System in verschiedenen Sprachen funktionieren. Zu diesem Zweck entwickeln die Forscher Grammatiken in den Kernsprachen des Projektes: Deutsch, Englisch, Norwegisch, Italienisch und Japanisch. Sie bilden die Basis zur Dekodierung der Textinformationen. Zurückgreifen kann das Forscherteam bei dieser Arbeit auf Erkenntnisse früherer Forschungen, wie zum Beispiel aus dem Projekt "Verbmobil" des Saarbrücker Computerlinguisten und Zukunftspreis-Trägers Professor Wolfgang Wahlster.

    Anwendung finden die Verfahren einerseits in einem System der italienischen Firma CELI s.r.l., das Newsgroups nach Produktbewertungen von Kunden durchsucht. Eine zweite Einsatzweise von DeepThought entsteht an der Universität des Saarlandes. Hier soll es Verfassern von Texten beispielsweise ermöglicht werden, Wissenslücken im Geschriebenen direkt durch Datenbankabfrage schließen zu lassen: Nach automatischer Bearbeitung mithilfe der "kontaktierten" Datenbank kehrt der Text vervollständigt zum Absender zurück. Nach gleichem Prinzip sollen auch Bilder auf mündlichen Befehl in Computerpräsentationen transportiert werden können. Mit einer dritten Anwendung nimmt sich schließlich Projektpartner XtraMind dem Problem der E-Mail-Fluten an: Die saarländische Firma will DeepThought dazu nutzen, Computer für die eigenständige Kategorisierung und Beantwortung von Anfragen und Mitteilungen fit zu machen.

    Sie haben Fragen? Dann setzen Sie sich bitte in Verbindung mit Dr. Melanie Siegel, Tel.: 0681/302-5288 oder E-mail: siegel@dfki.de


    Images

    Criteria of this press release:
    Information technology, Language / literature, Media and communication sciences
    transregional, national
    Research projects
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).