idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
01/20/2009 11:42

Computer können Textinhalte immer besser verstehen

Manuela Heberer Referat Öffentlichkeitsarbeit
Friedrich-Schiller-Universität Jena

    Computerlinguist der Universität Jena erhält erneut internationalen IBM-Wissenschaftspreis

    Jena (20.01.09) Obwohl die Zahl der wissenschaftlichen Publikationen ständig weiter steigt und viele dieser Texte digital verfügbar sind, konnten Computer bislang wenig mit ihrem Inhalt anfangen. "Das liegt daran, dass Texte aus Sicht der Informatik weithin unstrukturierte Daten und damit Rechnern nicht unmittelbar zugänglich sind", sagt Prof. Dr. Udo Hahn von der Friedrich-Schiller-Universität Jena. Der Computerlinguist ist nach 2007 auch im Jahr 2008 mit dem "IBM Unstructured Information Analytics Innovation Award" ausgezeichnet worden. Den Preis vergibt das IT-Unternehmen IBM seit 2006 jährlich an wenige, nach einem strengen Auswahlverfahren ausgesuchte Wissenschaftler aus der ganzen Welt. Grund für die Auszeichnung sind Hahns Forschungsarbeiten zum Software-Konzept UIMA (Unstructured Information Management Architecture). Es stellt den architektonischen Rahmen für die automatische inhaltliche Analyse und Weiterverarbeitung großer, unstrukturierter Textmengen bereit.

    Noch vor wenigen Jahren haben Computerlinguisten "jeder für sich alleine im stillen Kämmerlein" daran gearbeitet, solche überaus komplexen sprachtechnologischen Systeme weithin ohne Arbeitsteilung und Abstimmung miteinander zu entwickeln. Dies hat zu einem undurchschaubaren Wildwuchs an "Implementationslösungen" geführt, die wechselseitig inkompatibel zueinander waren. "Mit UIMA gibt es jetzt eine einheitliche und übergreifende Entwicklungsplattform, die es ermöglicht, auf internationaler Ebene mit anderen Experten gemeinsam an einer Lösung zu arbeiten", nennt Prof. Hahn einen wesentlichen Vorteil. Innerhalb von UIMA werden nun zunehmend Standards entwickelt, die für viele Fragestellungen der automatischen Sprachanalyse bedeutsam sind und die Wiederverwendung bereits existierender Software erlauben. "Damit bietet UIMA auch einen objektiven Testrahmen an, um die Qualität einzelner Analysekomponenten experimentell zu untersuchen und die Leistungsfähigkeit der verschiedenen sprachtechnologischen Anwendungen in ihrer gesamten softwaretechnischen Komplexität zu überprüfen", erklärt Hahn.

    Langfristiges Ziel dieser Aktivitäten sei es, mit computerlinguistischen Verfahren Datenbanken automatisch aufzubauen, welche die wesentlichen Inhalte von Dokumenten strukturiert erfassen. Damit wäre die Zufuhr von fehlenden Informationen nicht mehr von den Zufälligkeiten einer mehr oder minder geglückten Suchanfrage, wie etwa bei der Google-Suche, abhängig, so Hahn. "Mit solch einer automatisch aufgebauten Datenbank können je nach Zielvorgabe bereits jetzt Informationen mit einer Genauigkeit von bis zu 90 Prozent aus Texten herausgezogen und dann gezielt abgefragt werden. Das bedeutet neben der Automatisierung komplexer menschlicher Verstehensprozesse, einer der großen Herausforderungen der Grundlagenforschung in der Informatik, auch einen für unser Alltagshandeln bedeutsamen Zugewinn an informationeller Rationalität", fügt der Jenaer Computerlinguist an. "Denn Wissen in Texten, die Wissenschaftler aus den Augen verlieren, ist totes Wissen - so, als hätte es die darin gebündelte Forschung nie gegeben".

    Die große praktische Bedeutung dieser Aussagen beweist das enorme Interesse großer Anwenderfirmen: "Global operierende Pharmafirmen und Software-Häuser für den Klinik- und Biotech-Bereich haben schnell erkannt, dass sie auf der Basis von UIMA sowohl ihre Produktivität als auch ihre Wettbewerbsfähigkeit gravierend steigern können", sagt Prof. Hahn.

    Der Preis beweise aber auch, dass "die Jenaer Computerlinguistik vier Jahre nach ihrer Gründung an der Friedrich-Schiller-Universität im internationalen Wettbewerb weithin sichtbare Akzeptanz gewonnen hat und von Experten als gewichtiger Forschungsstandort deutlich wahrgenommen wird", bemerkt Hahn nicht ohne Stolz. Das Preisgeld in Höhe von 20.000 US-Dollar wird er zweckgebunden für die weitere Forschung in seiner Arbeitsgruppe verwenden.

    Kontakt:
    Prof. Dr. Udo Hahn
    Institut für Germanistische Sprachwissenschaft der Friedrich-Schiller-Universität Jena
    Fürstengraben 30, 07743 Jena
    Tel.: 03641 / 944320
    E-Mail: udo.hahn[at]uni-jena.de


    Images

    Der Jenaer Preisträger Prof. Dr. Udo Hahn.
    Der Jenaer Preisträger Prof. Dr. Udo Hahn.
    Foto: Anne Günther/FSU
    None


    Criteria of this press release:
    Information technology, Language / literature
    transregional, national
    Personnel announcements
    German


     

    Der Jenaer Preisträger Prof. Dr. Udo Hahn.


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).