Computer sollen lernen, Fragen in natürlicher Sprache zu "verstehen"
"Ich suche Rezepte für Kuchen, die kein Obst enthalten." - Keine Internet-Suchmaschine der Welt kann bisher sinnvoll mit solchen oder ähnlichen Anfragen umgehen. Auch die schon Computer-gerechter formulierte Anfrage "Rezept Kuchen kein Obst" führt nur zu tausenden von Fundstellen, in denen der Nutzer relevante Informationen immer noch wie eine Nadel im Heuhaufen suchen muss. Und viele interessante Fundstellen bleiben dennoch außen vor: Muffin- oder Guglhupf-Rezepte etwa werden so nicht gefunden.
Den Grund kennt jeder erfahrene Internet-Nutzer: Suchmaschinen liefern ausschließlich Fundstellen, die exakt den Suchbegriffen entsprechen, und verstehen von der Bedeutung der Suchanfrage kein Wort. Nutzer sind also gezwungen, exakte und abstrakte Suchanfragen zu formulieren - und erhalten trotzdem größtenteils irrelevante Informationen.
Bisher. Denn das könnte sich durch ein Forschungsprojekt an der TU Darmstadt demnächst ändern. Eine Gruppe von Wissenschaftlern des Fachgebiets Telekooperation am Fachbereich Informatik der TUD versucht im Rahmen des Projekts "Semantisches Information Retrieval" (SIR) Computer in die Lage zu versetzen, geschriebene Texte zu analysieren und zu verstehen.
Projektleiterin Dr. Iryna Gurevych vom Fachgebiet Telekooperation: "SIR soll es dem Nutzer erlauben, Suchanfragen in natürlicher Sprache zu stellen, aus denen das System dann die Suchbegriffe automatisch herausfiltert." Anfragen wie im Beispiel der Kuchenrezepte würden so sinnvoll beantwortet. Außerdem wird das System mit Wissen über die Bedeutung von Wörtern ausgestattet werden. Dadurch kann es dem Nutzer auch Seiten liefern, die nicht nur die Suchbegriffe selbst, sondern auch verwandte Wörter enthalten, also nicht nur "Kuchen", sondern auch "Muffins" oder "Guglhupf".
Ihre erste Bewährungsprobe muss die neue Technologie jedoch auf einem auf den ersten Blick ganz anderen Feld bestehen: Die Forschergruppe entwickelt derzeit ein neuartiges System zur Unterstützung Jugendlicher bei der Berufswahl, in dem SIR erstmals eingesetzt werden soll. Dazu stellt die Bundesagentur für Arbeit die Beschreibungen von 5800 Berufen in Deutschland zur Verfügung.
Jugendliche, die das System mit einem Aufsatz über ihre beruflichen Vorlieben füttern, sollen vom System Vorschläge für mögliche Berufe bekommen. Die persönliche Beratung durch die Bundesagentur für Arbeit kann dadurch auf alternative Angebote ausgeweitet werden. Ein erster Prototyp soll bis Ende des Jahres bereitstehen. Das Projekt wird von der Deutschen Forschungsgemeinschaft gefördert.
Pressekontakt: Dr. Iryna Gurevych, Fachgebiet Telekooperation, TU Darmstadt,
Tel. 06151/16-5411, gurevych@cre-elearning.tu-darmstadt.de
he, 2. August 2006, PM-Nr. 152/2006
http://www.cre-elearning.tu-darmstadt.de/elearning/sir/
Merkmale dieser Pressemitteilung:
Gesellschaft, Informationstechnik
überregional
Forschungsprojekte
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).