Nr. 79/17.8.2006/vm
Wissen für die ganze Welt
Karlsruher Forscher erschließen Inhalte von Wiki-Webseiten
Mit einer Erweiterung der Software MediaWiki zieht das Forschungsteam Wissensmanagement des Instituts für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB) der Universität Karlsruhe das Interesse der internationalen Fachwelt auf sich. Die jungen Forscher Denny Vrandecic und Markus Krötzsch aus dem Team von Professor Dr. Rudi Studer machen die Inhalte von Websites, die mit MediaWiki geschrieben sind, zum Beispiel die freie Web-Enzyklopädie Wikipedia, für Maschinen besser auswertbar. Ihr Konzept zur besseren Erschließung der Inhalte geht allerdings nur auf, wenn die Wiki-Autoren aktiv mitarbeiten. Die Karlsruher Forscher setzen auf eine Kombination aus sozialer und technischer Lösung: Sie hoffen, dass sich auf der Basis ihrer Software Semantic MediaWiki eine Art kollektive Indexierung der Wiki-Artikel durch die Autoren entwickelt - und ernten für diese Idee viel Beifall.
Semantic MediaWiki wird bereits auf mehreren Websites mit begrenztem Datenvolumen erfolgreich eingesetzt, unter anderem zur Erschließung der Bibel-Inhalte. Nun testen die Karlsruher Forscher, ob ihr Programm auch dem gewaltigen Volumen von Wikipedia gewachsen ist. Die Wikimedia Foundation Inc., Betreiber von Wikipedia, stellt ihnen für den Test rund 50 Gigabyte Inhalt der englischen Wikipedia-Ausgabe zur Verfügung und hat Interesse an einer Zusammenarbeit signalisiert.
Semantic MediaWiki ist ein einfach zu bedienendes Werkzeug, das auf leistungsstarken semantischen Wissensmanagement-Technologien aufbaut. Die Autoren können mit dem Werkzeug die Querverweise, die sie in ihrem Text als Weiterleitung zu Hintergrundinformationen angeben, typisieren, also kurz erläutern, sowie Zahlenangaben und Fakten im Text als Attribute kennzeichnen. Bei dem Eintrag zu "Ägypten" steht dann zum Beispiel der typisierte Link "ist Land von Afrika", ein Attribut könnte "Bevölkerung 76,000,000" sein. Dabei soll jeweils die Landessprache des Eintrags verwendet werden können.
Die von den Autoren erzeugten, typisierten Links werden in einer Datenbank als Bezugsgruppen abgelegt; die gekennzeichneten Attribute als feststehende Werte gespeichert. Das versetzt Computer in die Lage, automatisch sinnvolle Antworten auf komplexere Anfragen zu geben; etwa eine Liste zu erzeugen, in der alle Länder von Afrika aufgeführt sind. Die Ländernamen führen als Link zurück zu dem Eintrag, in dem sie stehen.
Das Spannende an der neuen Technologie ist die Möglichkeit zur automatischen Zusammenführung von Informationen, die in den verschiedenen Einträgen verteilt sind. Durch die festgelegten Beziehungen zwischen den Links enthält die automatisch erzeugte Liste immer die gleichen Daten, von welcher Seite aus man sie auch abruft. Die Suchmaschine holt sich die Bevölkerungszahl von Ägypten immer vom Ägypten-Eintrag, so dass keine unterschiedlichen Zahlen in der Wiki-Landschaft kursieren können. Darin steckt ein sehr großes Potenzial zur Bereitstellung von enzyklopädischer Information und Wissen für Menschen auf der ganzen Welt.
Ein mit Semantic MediaWiki erstellter Testeintrag zu Deutschland kann unter http://ontoworld.org/index.php/Germany eingesehen werden.
Wichtige Links:
http://ontoworld.org - Projektbeschreibung/Testseite
http://sourceforge.net/projects/semediawiki - Semantic MediaWiki zum Herunterladen
Nähere Informationen:
Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB)
Universität Karlsruhe (TH)
Forschungsgruppe Wissensmanagement
Professor Dr. Rudi Studer
Telefon +49 (0) 721 608-3923
E-Mail studer@aifb.uni-karlsruhe.de
Im Internet www.aifb.uni-karlsruhe.de
Vera Münch
PR+TEXTE
Tel: +49 (0) 5121 82613
Mobil: +49 (0) 171 3825545
E-Mail muench@vera-muench.de
http://www.presse.uni-karlsruhe.de/6172.php
Criteria of this press release:
Information technology
transregional, national
Research results
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).