Im DFG-Projekt „Simulating Interactive InformatIon Retrieval“ (SINIR) arbeitet ein Forschungsteam der Universität Passau gemeinsam mit der weltweit größten Spezialbibliothek für wirtschaftswissenschaftliche Literatur an Konzepten für die digitale Bibliothek der Zukunft – und zwar mit Hilfe von simulierten Nutzungsdaten.
Das DFG-Projekt SINIR () ist gleich in zweierlei Hinsicht besonders: Zum einen passt sich die entwickelte Lösung an das Suchprofil der Nutzerin oder des Nutzers an. Zum anderen ist bereits der Weg dorthin außergewöhnlich: Denn die Forscherinnen und Forscher arbeiten bei der Entwicklung fast ganz ohne reale Nutzungsdaten und ohne zeitaufwendige Tests.
„Uns geht es in dem Projekt darum, die Zugänge zu digitalen Bibliotheken zu optimieren“, erklärt Prof. Dr. Michael Granitzer, Inhaber des Lehrstuhls für Data Science an der Universität Passau. Er leitet das Projekt zusammen mit Matthias Hagen, Professor für Big Data Analytics an der Martin-Luther-Universität Halle-Wittenberg, und Prof. Dr. Klaus Tochtermann, Direktor des Leibniz-Informationszentrum Wirtschaft (ZBW) in Kiel. „Mit Hilfe unserer Methode können wir den Prozess der Entwicklung entscheidend abkürzen“, so Prof. Dr. Granitzer.
Das Forschungsteam simuliert ein Bibliothekssystem und speist in dieses System eine große Menge an künstlich generierten Nutzungsdaten ein. Diese Daten bilden möglichst viele Nutzungsvorlieben ab: „Es gibt ganz unterschiedliche Suchprofile. Manche Nutzerinnen und Nutzer suchen tagtäglich, andere kommen nur einmal und schauen dann ganz gezielt nach einem konkreten Buch“, erklärt Prof. Dr. Granitzer.
Die Nutzungsmodelle simulieren also beispielsweise Anfragen, Klicks und Ergebnisinteraktionen. Ganz ohne den Einsatz vorhandener Daten geht es aber dann doch nicht: Einige Modelle trainieren die Forscherinnen und Forscher auf Basis von realen Logdaten – also jenen Dateien, die das Suchverhalten von realen Nutzerinnen und Nutzer automatisch erfassen. Diese Modelle wiederum reichert das Team mit künstlich generierten Daten an.
Diese Nutzungsmodelle helfen den Forscherinnen und Forschern dabei, die digitale Suche zu verbessern: Sie lassen Rückschlüsse zu, wie Bibliotheksdaten verschlagwortet werden müssen, damit sie besser gefunden werden. Außerdem geben sie Hinweise auf die beste Reihenfolge der Suchergebnisse.
Beteiligte und Förderung
Das entwickelte Verfahren evaluiert das Forschungsteam im Umfeld einer tatsächlich existierenden digitalen Bibliothek: der wirtschaftswissenschaftlichen Suchmaschine EconBiz. Projektpartner ist das ZBW - Leibniz-Informationszentrum Wirtschaft, die weltweit größte Spezialbibliothek für wirtschaftswissenschaftliche Literatur. Das Ergebnis stellt das Forschungsteam auch anderen digitalen Bibliotheken in Form eines Open-Source-Frameworks zur Verfügung.
Die Deutsche Forschungsgemeinschaft (DFG) fördert das Vorhaben mit der Projektnummer GR 4277/2-1, AOBJ: 651840 über eine Laufzeit von drei Jahren.
Text: Kathrin Haimerl
Rückfragen zu dieser Pressemitteilung richten Sie bitte an das Referat für Medienarbeit der Universität Passau, Tel. 0851 509-1439.
Die digitale Bibliothek der Zukunft ist Gegenstand des Forschungsprojekts SINIR, an dem auch ein Tea ...
Universität Passau
Criteria of this press release:
Journalists
Cultural sciences, Information technology, Social studies
transregional, national
Research projects
German
Die digitale Bibliothek der Zukunft ist Gegenstand des Forschungsprojekts SINIR, an dem auch ein Tea ...
Universität Passau
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).