idw - Informationsdienst
Wissenschaft
Im Laufe der Jahre hat sich der Heim-Computer vom reinen Schreibmaschinenersatz zur umfangreichen Multimedia-Plattform entwickelt. Man archiviert Digitalfotos am Heim-PC, ersetzt CDs durch MP3-Dateien und legt nur noch beiläufig Textdateien auf der Festplatte ab. Was für den Endanwender viele Vorteile mit sich bringt, stellt Suchmaschinen vor ganz neue Aufgaben. Mussten diese früher einfache Textdateien durchsuchen, stehen sie heute vor der Aufgabe, bestimmte Inhalte in komplexen Audio- und Videodateien zu finden - und das möglichst schnell. Auf der CeBIT 2009 in Hannover zeigen Forscher des Max-Planck-Instituts Informatik nun, wie dieses Problem effizient gelöst werden kann.
Als Ergebnis eines europäischen Gemeinschaftsprojekts haben sie eine beliebig erweiterbare Peer-To-Peer-Suchmaschine (SAPIR) entwickelt, die blitzschnell Multimedia-Dateien anhand von Beispieldaten findet. Der Anwender kann zum Beispiel eine Melodie summen, um das zugehörige Lied im Netzwerk zu finden.
Wer heute im Internet nach Bildern oder Videos sucht, der greift in der Regel auf bekannte Suchdienste wie Google, Yahoo oder MSN zurück. Derartige Suchmaschinen finden die gewünschten Dateien mit Hilfe sogenannter Meta-Tags. Das sind Begriffssammlungen, die zum Beispiel den Inhalt eines Bildes in Worten beschreiben. Diese Meta-Tags werden von den Suchmaschinen in regelmäßigen Abständen erfasst, aktualisiert und in einem zentralen Index, ähnlich einem Nachschlagewerk, abgespeichert.
Die SAPIR-Suchmaschine verfolgt einen neuartigen Ansatz, um multimediale Inhalte im Netz zu finden. Anstelle von Textinformationen durchforstet sie tatsächliche Merkmale der Daten. Das kann bei einem Lied etwa die Melodie sein. Sucht man also nach einem bestimmten Lied, reicht es, dessen Melodie zu summen. Die Suchmaschine analysiert die gesummte Melodie und findet Dateien mit vergleichbaren Merkmalen im Netzwerk. Dieses neuartige Suchverfahren kann außerdem mit den herkömmlichen Methoden kombiniert werden. So kann man auch nach einer Sehenswürdigkeit suchen, indem man nach dem Namen sucht und zusätzlich ein Handy-Foto in die Suchmaske eingibt.
Um nicht langsamer zu sein, als herkömmliche Suchmaschinen, speichert SAPIR das Nachschlagewerk, also den Such-Index, dezentral ab. Während rein textbasierte Suchmaschinen noch mit zentralen Servern arbeiten können, sprengt das Speichern von audio-visuellem Inhalt schnell die Kapazität üblicher Rechner. Deshalb macht sich SAPIR die Vorteile von Peer-To-Peer-Netzwerken zunutze. Solche Netzwerke bestehen aus einem großen Verbund von Rechnern, die alle gleichermaßen berechtigt sind, Daten zu senden und zu empfangen. Sapir nutzt diese verteilte Struktur, um den Suchindex dezentral zu speichern und zu durchsuchen. Das macht das Suchverfahren nicht nur flexibler und stabiler, sondern auch noch beliebig skalierbar. Sogar Handys können in das Netzwerk integriert werden.
Vom 3. bis 8. März können Besucher der CeBIT 2009 die SAPIR Suchmaschine am Forschungsstand des Saarlandes, Halle 9, Stand B 43 ausprobieren. Die Funktionsweise von SAPIR wird dort am Beispiel von Bildern demonstriert. Es wird gezeigt wie man mit einem Foto als Eingabe ähnliche Fotos finden kann.
Kontakt:
Mouna Kacimi
Max-Planck-Institut Informatik
mkacimi@mpi-inf.mpg.de
Tel. +49 681 9325-516
Kristina Scherbaum
Max-Planck-Institut Informatik
press@mpi-inf.mpg.de
Tel. +49 681 9325-454
http://www.sapir.eu/ - Webpage des SAPIR-Projekts
http://www.sapir.eu/demos.html - Interaktive Demos
Criteria of this press release:
Information technology
transregional, national
Research projects, Research results
German

You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).