idw - Informationsdienst
Wissenschaft
Die freie Software DocAnalyser der FernUniversität sucht automatisiert nach passenden Begriffen, die eine Internet-Recherche effizienter machen. Obwohl bereits fünf bis sechs spezielle Suchbegriffe bei komplexen Recherchen häufig zum Erfolg führen, ist dies selbst für rechercheerfahrene Nutzerinnen und Nutzer häufig ein langwieriger, aufwändiger und fehleranfälliger Lese- und Lernprozess. Die frei verfügbare, interaktive Suchanwendung DocAnalyser empfindet diesen Leseprozess technisch nach. Mit dieser Software ist es erstmals möglich, automatisiert thematisch verwandte Dokumente im Web zu finden, indem komplette Seiten oder ausgewählte Teile semantisch analysiert werden.
Die zutreffenden Begriffe für Internetrecherchen zu finden ist oft zeitaufwändiger als die letztendlich erfolgreiche eigentliche Suche. Zielorientiert und automatisiert hilft hier die neue freie Software DocAnalyser. Sie sucht automatisiert nach passenden Begriffen, die eine Internet-Recherche effizienter machen. Entwickelt hat sie Dr. Mario Kubek, Privatdozent am Lehrgebiet Kommunikationsnetze der FernUniversität in Hagen, im Rahmen seiner Habilitation. Sein Ziel war es, genau diejenigen Dokumente zu finden, die ein aktuelles Informationsbedürfnis optimal befriedigen, aber keine Lawine von Ergebnissen mit nur geringer Relevanz lostreten.
Obwohl bereits fünf bis sechs spezielle Suchbegriffe bei komplexen Recherchen häufig zum Erfolg führen, ist dies selbst für rechercheerfahrene Nutzerinnen und Nutzer häufig ein langwieriger, aufwändiger und fehleranfälliger Lese- und Lernprozess. Die frei verfügbare, interaktive Suchanwendung DocAnalyser empfindet diesen Leseprozess technisch nach. Mit dieser Software ist es erstmals möglich, automatisiert thematisch verwandte Dokumente im Web zu finden, indem komplette Seiten oder ausgewählte Teile semantisch analysiert werden.
Interessierte können sich den DocAnalyser unter http://www.docanalyser.de/ kostenfrei downloaden und nutzen.
Lese- und Lernprozess automatisiert
Bei einer herkömmlichen Suche müssen die Begriffe, die am schnellsten zum Ziel führen, häufig zunächst in einem langwierigen, aufwändigen und fehleranfälligen Lese- und Lernprozess ermittelt werden. Dabei wird die Suche verfeinert und gegebenenfalls in neue Richtungen gelenkt. Diesen Prozess bildet der DocAnalyser technisch ab. „Ich ‚werfe‘ ein Dokument in den DocAnalyser, der automatisch die für mich wichtigen Ergebnisse generiert“, erläutert Dr. Mario Kubek. „Er nimmt mir das Lesen eines unbekannten Dokumentes ab, stellt mir die für meine Suche wichtigen Begriffe automatisiert zur Verfügung und erspart mir sehr viel manuelle Arbeit. Er kann sogar nach Bildern suchen.“
Diese interaktive Suchanwendung findet thematisch verwandte Dokumente im Web, indem sie komplette Seiten oder ausgewählte Teile semantisch – also entsprechend ihrer Bedeutung für den Text – analysiert. Sie identifiziert weitere Schlüsselwörter und Quellthemen und generiert selbst neue Suchanfragen, mit denen weitere relevante Webdokumente gefunden werden. Quellthemen sind diejenigen Wörter in einem Text, die seine Bedeutung besonders beeinflussen.
Software lernt lokal
Zudem kann der DocAnalyser bedeutungsähnliche Beziehungen zwischen Such- und Schlüsselwörtern erlernen. So können automatisch erzeugte oder manuelle Sucheingaben durch passende Wörter erweitert und allgemeine Anfragen immer weiter spezialisiert werden. Dieses Lernen findet lokal in den User-Webbrowsern statt – nutzerspezifisch und individuell auf der Basis der bisher analysierten Inhalte. Die gefundenen Dokumente präsentiert der DocAnalyser nach ihrer Relevanz geordnet in einer Ergebnisliste, also in der von herkömmlichen Suchmaschinen bekannten Form. Selbstverständlich ist es auch möglich, nur mit eigenen Termen zu suchen.
So werden vor allem die Dokumente gefunden, die einen wirklichen inhaltlichen Beitrag zum Thema haben. Das grenzt zum einen die Menge der Suchergebnisse deutlich ein, zum anderen findet man auch diejenigen relevanten Dokumente, die statt der eingegebenen Suchbegriffe – wie z.B. „Vogelgrippe“ oder „Virus“ – andere, aber dennoch zum Thema gehörende enthalten, etwa „H5N1“.
mario.kubek@fernuni-hagen.de
Criteria of this press release:
Business and commerce, Journalists, Students, all interested persons
Electrical engineering, Information technology, Teaching / education
transregional, national
Research results, Transfer of Science or Research
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).