idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
07.04.2009 13:31

Jenaer Computerlinguisten sind "Vize-Weltmeister"

Manuela Heberer Referat Öffentlichkeitsarbeit
Friedrich-Schiller-Universität Jena

    Universität Jena belegt Spitzenplatz in internationalem Software-Wettbewerb

    Jena (07.04.09) Man kennt Weltmeister im Fußball, Eiskunstlaufen oder Schach - nun ist ein Forschungsteam der Universität Jena "Vize-Weltmeister" in einer nicht alltäglichen Disziplin geworben. "Man könnte es eine Weltmeisterschaft im Darstellen wissenschaftlich relevanter Textinhalte nennen", erklärt Prof. Dr. Udo Hahn von der Friedrich-Schiller-Universität Jena. Seine Arbeitsgruppe entwickelt seit mehreren Jahren Computersysteme, die in der Lage sind, inhaltliche Aussagen vollautomatisiert aus Millionen von Dokumenten herauszuziehen und sie in Datenbanken einzuspeisen, die dann weltweit von Forschern und Entwicklern angefragt werden.

    In dem internationalen Software-Wettbewerb BioNLP'09 Shared Task, in dem die Jenaer Arbeitsgruppe mit ihrem System jetzt den zweiten Platz belegt hat, ging es um das Auffinden von wichtigen Forschungsergebnissen in biologischen Fachtexten. Damit sind etwa Regulations- und Bindungsprozesse zwischen Proteinen oder Kopiervorgänge von Genen gemeint, wie sie von Biologen täglich in Tausenden von Fachartikeln beschrieben werden.

    "Bislang scheitern Computer genau daran, womit Menschen beim Lesen solcher Texte keine Probleme haben", so Hahn. "Für einen Rechner ist ein englischsprachiger Text eine sinnfreie Abfolge einzelner Buchstaben, für die es, anders als für Zahlen, keine im Rechner eingebaute Interpretationshilfe gibt", skizziert der Jenaer Computerlinguist das grundlegende Problem. "Wir stellen Rechnern solche Hilfen bereit. Die Frage war bislang nur: Wie gut sind diese Hilfen?".

    Diese Frage wurde nun durch den internationalen Wettbewerb entschieden. Dabei lief alles wie bei einer "richtigen" Weltmeisterschaft ab. Die vereinbarte Disziplin war das Auffinden biologischer Prozesse, es gab eine öffentliche Bekanntgabe der Wettbewerbsregeln und eine Meldefrist für die Teilnehmer. Anhand gleicher "Spiel"-Daten wurde an vielen computerlinguistischen Instituten der Welt "trainiert", bis schließlich der Wettbewerb, überwacht von einem internationalen Schiedsrichtergremium, begann. "Wir hatten im Wesentlichen sechs Wochen Zeit, unser System an die Anforderungen der Organisatoren von der Universität Tokio anzupassen, bevor es in die entscheidende Endphase ging", so Hahn. "Das war eine gewaltige Herausforderung für uns und nur durch das große Engagement meines gesamten Teams zu bewältigen, das sich teilweise bis tief in die Nächte und an den Wochenenden mit viel Elan eingesetzt hat", freut sich Prof. Hahn über den "Sportsgeist" seiner Arbeitsgruppe.

    Die Ausgangslage, also die bislang geheim gehaltenen Wettbewerbstexte, denen die Systeme weltweit ausgesetzt waren, war für alle Teilnehmer identisch. Nur so konnte bestimmt werden, wer am Ende die besten, aber auch wer die schlechtesten Ergebnisse des Wettbewerbs erzielt hatte. "Unser System hat die meisten Herausforderungen jedoch bravourös gemeistert und uns damit sozusagen zum 'Vize-Weltmeister' gemacht", so der Computerlinguist von der Universität Jena.

    Zu dem weltweiten Wettbewerb hatten sich ursprünglich mehr als 40 wissenschaftliche Institutionen angemeldet. 24 Teams haben sich letztendlich den strengen Bewertungsmaßstäben ausgesetzt. "Dass wir 22 der weltweit besten Arbeitsgruppen unseres Fachgebiets schlagen konnten und nur ein einziges Team besser als unseres ist, empfinde ich als eindrucksvolle Bestätigung der Qualität unserer Arbeit, die in der Fachwelt aufmerksam registriert und gewürdigt wird", so Hahn. Die Methoden der Gewinnerteams werden demnächst bei einer Fachtagung und in der einschlägigen Fachpresse veröffentlicht. Damit bilden sie auch die Basis für neue Entwicklungen auf dem Gebiet. "Dass wir etwas zu diesem Fortschritt beitragen können, macht uns alle sehr stolz", berichtet Prof. Hahn.

    "Wir wollen letztlich dazu beitragen, dass das wissenschaftliche Know-how, das weltweit mit großem Aufwand an öffentlichen und privaten Forschungsgeldern geschaffen wird, nicht ungelesen in Zeitschriftenaufsätzen verstaubt, sondern aktiv zum Einsatz kommt - sei es in der Krebs- oder Altersforschung, der Arzneimittelentwicklung oder über öffentlich zugängliche Gesundheitsportale."

    Kontakt:
    Prof. Dr. Udo Hahn
    Institut für Germanistische Sprachwissenschaft der Universität Jena
    Fürstengraben 30, 07743 Jena
    Tel.: 03641 / 944320
    E-Mail: udo.hahn[at]uni-jena.de


    Weitere Informationen:

    http://www.uni-jena.de


    Bilder

    Prof. Dr. Udo Hahn.
    Prof. Dr. Udo Hahn.
    Foto: Anne Günther/FSU
    None


    Merkmale dieser Pressemitteilung:
    Informationstechnik, Sprache / Literatur
    überregional
    Buntes aus der Wissenschaft, Wettbewerbe / Auszeichnungen
    Deutsch


     

    Prof. Dr. Udo Hahn.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).