idw - Informationsdienst
Wissenschaft
Computer sollen lernen, Fragen in natürlicher Sprache zu "verstehen"
"Ich suche Rezepte für Kuchen, die kein Obst enthalten." - Keine Internet-Suchmaschine der Welt kann bisher sinnvoll mit solchen oder ähnlichen Anfragen umgehen. Auch die schon Computer-gerechter formulierte Anfrage "Rezept Kuchen kein Obst" führt nur zu tausenden von Fundstellen, in denen der Nutzer relevante Informationen immer noch wie eine Nadel im Heuhaufen suchen muss. Und viele interessante Fundstellen bleiben dennoch außen vor: Muffin- oder Guglhupf-Rezepte etwa werden so nicht gefunden.
Den Grund kennt jeder erfahrene Internet-Nutzer: Suchmaschinen liefern ausschließlich Fundstellen, die exakt den Suchbegriffen entsprechen, und verstehen von der Bedeutung der Suchanfrage kein Wort. Nutzer sind also gezwungen, exakte und abstrakte Suchanfragen zu formulieren - und erhalten trotzdem größtenteils irrelevante Informationen.
Bisher. Denn das könnte sich durch ein Forschungsprojekt an der TU Darmstadt demnächst ändern. Eine Gruppe von Wissenschaftlern des Fachgebiets Telekooperation am Fachbereich Informatik der TUD versucht im Rahmen des Projekts "Semantisches Information Retrieval" (SIR) Computer in die Lage zu versetzen, geschriebene Texte zu analysieren und zu verstehen.
Projektleiterin Dr. Iryna Gurevych vom Fachgebiet Telekooperation: "SIR soll es dem Nutzer erlauben, Suchanfragen in natürlicher Sprache zu stellen, aus denen das System dann die Suchbegriffe automatisch herausfiltert." Anfragen wie im Beispiel der Kuchenrezepte würden so sinnvoll beantwortet. Außerdem wird das System mit Wissen über die Bedeutung von Wörtern ausgestattet werden. Dadurch kann es dem Nutzer auch Seiten liefern, die nicht nur die Suchbegriffe selbst, sondern auch verwandte Wörter enthalten, also nicht nur "Kuchen", sondern auch "Muffins" oder "Guglhupf".
Ihre erste Bewährungsprobe muss die neue Technologie jedoch auf einem auf den ersten Blick ganz anderen Feld bestehen: Die Forschergruppe entwickelt derzeit ein neuartiges System zur Unterstützung Jugendlicher bei der Berufswahl, in dem SIR erstmals eingesetzt werden soll. Dazu stellt die Bundesagentur für Arbeit die Beschreibungen von 5800 Berufen in Deutschland zur Verfügung.
Jugendliche, die das System mit einem Aufsatz über ihre beruflichen Vorlieben füttern, sollen vom System Vorschläge für mögliche Berufe bekommen. Die persönliche Beratung durch die Bundesagentur für Arbeit kann dadurch auf alternative Angebote ausgeweitet werden. Ein erster Prototyp soll bis Ende des Jahres bereitstehen. Das Projekt wird von der Deutschen Forschungsgemeinschaft gefördert.
Pressekontakt: Dr. Iryna Gurevych, Fachgebiet Telekooperation, TU Darmstadt,
Tel. 06151/16-5411, gurevych@cre-elearning.tu-darmstadt.de
he, 2. August 2006, PM-Nr. 152/2006
http://www.cre-elearning.tu-darmstadt.de/elearning/sir/
Criteria of this press release:
Information technology, Social studies
transregional, national
Research projects
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).