idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Grafik: idw-Logo

idw - Informationsdienst
Wissenschaft

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
04/01/2019 11:43

Neue Software findet passende Suchbegriffe für Webrecherche

Stephan Düppe Stabsstelle 2 – Kommunikation und Öffentlichkeitsarbeit
FernUniversität in Hagen

    Die freie Software DocAnalyser der FernUniversität sucht automatisiert nach passenden Begriffen, die eine Internet-Recherche effizienter machen. Obwohl bereits fünf bis sechs spezielle Suchbegriffe bei komplexen Recherchen häufig zum Erfolg führen, ist dies selbst für rechercheerfahrene Nutzerinnen und Nutzer häufig ein langwieriger, aufwändiger und fehleranfälliger Lese- und Lernprozess. Die frei verfügbare, interaktive Suchanwendung DocAnalyser empfindet diesen Leseprozess technisch nach. Mit dieser Software ist es erstmals möglich, automatisiert thematisch verwandte Dokumente im Web zu finden, indem komplette Seiten oder ausgewählte Teile semantisch analysiert werden.

    Die zutreffenden Begriffe für Internetrecherchen zu finden ist oft zeitaufwändiger als die letztendlich erfolgreiche eigentliche Suche. Zielorientiert und automatisiert hilft hier die neue freie Software DocAnalyser. Sie sucht automatisiert nach passenden Begriffen, die eine Internet-Recherche effizienter machen. Entwickelt hat sie Dr. Mario Kubek, Privatdozent am Lehrgebiet Kommunikationsnetze der FernUniversität in Hagen, im Rahmen seiner Habilitation. Sein Ziel war es, genau diejenigen Dokumente zu finden, die ein aktuelles Informationsbedürfnis optimal befriedigen, aber keine Lawine von Ergebnissen mit nur geringer Relevanz lostreten.

    Obwohl bereits fünf bis sechs spezielle Suchbegriffe bei komplexen Recherchen häufig zum Erfolg führen, ist dies selbst für rechercheerfahrene Nutzerinnen und Nutzer häufig ein langwieriger, aufwändiger und fehleranfälliger Lese- und Lernprozess. Die frei verfügbare, interaktive Suchanwendung DocAnalyser empfindet diesen Leseprozess technisch nach. Mit dieser Software ist es erstmals möglich, automatisiert thematisch verwandte Dokumente im Web zu finden, indem komplette Seiten oder ausgewählte Teile semantisch analysiert werden.

    Interessierte können sich den DocAnalyser unter http://www.docanalyser.de/ kostenfrei downloaden und nutzen.

    Lese- und Lernprozess automatisiert

    Bei einer herkömmlichen Suche müssen die Begriffe, die am schnellsten zum Ziel führen, häufig zunächst in einem langwierigen, aufwändigen und fehleranfälligen Lese- und Lernprozess ermittelt werden. Dabei wird die Suche verfeinert und gegebenenfalls in neue Richtungen gelenkt. Diesen Prozess bildet der DocAnalyser technisch ab. „Ich ‚werfe‘ ein Dokument in den DocAnalyser, der automatisch die für mich wichtigen Ergebnisse generiert“, erläutert Dr. Mario Kubek. „Er nimmt mir das Lesen eines unbekannten Dokumentes ab, stellt mir die für meine Suche wichtigen Begriffe automatisiert zur Verfügung und erspart mir sehr viel manuelle Arbeit. Er kann sogar nach Bildern suchen.“

    Diese interaktive Suchanwendung findet thematisch verwandte Dokumente im Web, indem sie komplette Seiten oder ausgewählte Teile semantisch – also entsprechend ihrer Bedeutung für den Text – analysiert. Sie identifiziert weitere Schlüsselwörter und Quellthemen und generiert selbst neue Suchanfragen, mit denen weitere relevante Webdokumente gefunden werden. Quellthemen sind diejenigen Wörter in einem Text, die seine Bedeutung besonders beeinflussen.

    Software lernt lokal

    Zudem kann der DocAnalyser bedeutungsähnliche Beziehungen zwischen Such- und Schlüsselwörtern erlernen. So können automatisch erzeugte oder manuelle Sucheingaben durch passende Wörter erweitert und allgemeine Anfragen immer weiter spezialisiert werden. Dieses Lernen findet lokal in den User-Webbrowsern statt – nutzerspezifisch und individuell auf der Basis der bisher analysierten Inhalte. Die gefundenen Dokumente präsentiert der DocAnalyser nach ihrer Relevanz geordnet in einer Ergebnisliste, also in der von herkömmlichen Suchmaschinen bekannten Form. Selbstverständlich ist es auch möglich, nur mit eigenen Termen zu suchen.

    So werden vor allem die Dokumente gefunden, die einen wirklichen inhaltlichen Beitrag zum Thema haben. Das grenzt zum einen die Menge der Suchergebnisse deutlich ein, zum anderen findet man auch diejenigen relevanten Dokumente, die statt der eingegebenen Suchbegriffe – wie z.B. „Vogelgrippe“ oder „Virus“ – andere, aber dennoch zum Thema gehörende enthalten, etwa „H5N1“.


    Contact for scientific information:

    mario.kubek@fernuni-hagen.de


    Images

    Criteria of this press release:
    Business and commerce, Journalists, Students, all interested persons
    Electrical engineering, Information technology, Teaching / education
    transregional, national
    Research results, Transfer of Science or Research
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).