idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
10/17/2023 10:04

ZBW-Studie zeigt: KI-Sprachmodell DistilBERT führend im automatischen Gewinnen von Schlagworten

Dr. Doreen Siegfried Marketing und Öffentlichkeitsarbeit
ZBW – Leibniz-Informationszentrum Wirtschaft

    Die ZBW – Leibniz-Informationszentrum Wirtschaft erforscht die Aktualisierung ihres Fachvokabulars durch den Einsatz von KI-gestützten Methoden. Eine aktuelle Studie zeigt, dass das vortrainierte BERT-Sprachmodell DistilBERT in der automatisierten Schlagwort-Extraktion besonders effektiv ist und die Möglichkeit bietet, den Standard-Thesaurus Wirtschaft (STW) unterstützt durch KI-Methoden zu aktualisieren.

    Wissenschaftliche Bibliotheken verschlagworten ihre Literatur anhand genormter Wörterbücher, sogenannter Thesauri. Die zeitnahe und umfassende Aktualisierung derartiger spezialisierter Thesauri, stellt eine besondere Herausforderung dar – vor allem in sich thematisch schnell weiterentwickelnden Fachdisziplinen wie den Wirtschaftswissenschaften.

    Die ZBW – Leibniz-Informationszentrum Wirtschaft, weltweit bekannt für ihren umfangreichen Standard-Thesaurus Wirtschaft (STW) mit 6.000 Schlagwörtern und über 20.000 alternativen Sucheinstiegen in Deutsch und Englisch, erforscht nun den Einsatz von KI-Technologien, um Schlagworte automatisch aus wissenschaftlichen Publikationen zu gewinnen und so Thesaurus zu aktualisieren.

    Unter der Leitung von Dr. Ralf Krestel, Professor für Information Retrieval und Profiling, hat ein Forschungsteam der ZBW eine Methode entwickelt und getestet, die wichtige Fachbegriffe automatisch aus wissenschaftlichen Artikeln extrahiert, insbesondere aus Titeln und Abstracts. Das Team setzte vortrainierte BERT-Sprachmodelle ein und verglich deren Leistungsfähigkeit mit konventionellen Methoden wie TFIDF, TextRank und KeyBERT.

    Die aktuelle Studie zeigt, dass das BERT-Modell DistilBERT insgesamt am effektivsten in der Schlagwort-Extraktion ist. Es konnte nicht nur präzise spezifische Schlüsselwörter aus den Wirtschaftswissenschaften identifizieren, sondern auch mehr potenzielle neue Begriffe für den Standard-Thesaurus Wirtschaft vorschlagen als konkurrierende Methoden.

    Die Datengrundlage bildete ein Datensatz der ZBW, der der Datenbank ECONIS entstammt. Es wurden Titel, Abstracts und ausgewählte Metadaten, aber keine Volltexte, aus wissenschaftlichen Publikationen extrahiert. Die Metadaten umfassen Erscheinungsjahr und Sprache der Werke. Zudem wurden vorhandene Schlagwörter verschiedener Art hinzugefügt. So zum Beispiel Stichwörter, die von den Autor:innen frei gewählt wurden, als auch vorhandene normierte Schlagwörter. Die Analyse beschränkte sich auf Publikationen zwischen 2009 und 2021 und resultierte in einem Datensatz von 575.000 Einträgen.

    Der Standard-Thesaurus Wirtschaft stellt das umfangreichste zweisprachige Fachvokabular für die Erfassung und Suche wirtschaftswissenschaftlicher Themen dar und bietet eine weitreichende Abdeckung nicht nur von wirtschaftlichen, sondern auch angrenzenden Fachgebieten. Verschiedenste Organisationen, wissenschaftliche Bibliotheken und Forschungsinstitute, darunter beispielsweise das Deutsche Institut für Wirtschaftsforschung, setzen den Standard-Thesaurus Wirtschaft für ihre thematische Erschließung und spezialisierte Recherche ein. Verantwortlich für die Pflege und Aktualisierung dieses wertvollen Ressourcenpools ist die ZBW – Leibniz-Informationszentrum Wirtschaft, das über den weltweit größten Bestand an wirtschaftswissenschaftlicher Literatur verfügt.

    Weitere Informationen
    Die vollständige Studie, „Domain-Specific Keyword Extraction using BERT“ von Jill Sammet und Ralf Krestel, ist im Workshop TermTrends, bei der LDK 2023, veröffentlicht worden und online verfügbar. URL: http://hdl.handle.net/11108/586

    Über die ZBW:
    Die ZBW – Leibniz-Informationszentrum Wirtschaft (ZBW) ist die weltweit größte Informationsinfrastruktur für die Wirtschaftswissenschaften. Die Einrichtung beherbergt rund 4 Millionen Medieneinheiten und ermöglicht den Zugang zu Millionen wirtschaftswissenschaftlicher Online-Dokumente. Allein 2022 wurden mehr als 14 Millionen digitale Volltexte heruntergeladen. Daneben stellt die ZBW eine rasant wachsende Sammlung von Open-Access-Dokumenten zur Verfügung. EconStor, der digitale Publikationsserver, verfügt aktuell über 250.000 frei zugängliche Aufsätze und Working Papers. Mit EconBiz, dem Fachportal für wirtschaftswissenschaftliche Fachinformationen, können Studierende oder Forschende in über 11 Millionen Datensätzen recherchieren. Zudem gibt die ZBW die beiden wirtschaftspolitischen Zeitschriften Wirtschaftsdienst und Intereconomics im Gold Open Access heraus. Die ZBW ist eine forschungsbasierte wissenschaftliche Informationsinfrastruktur. Mit Professuren in der Informatik, Wirtschaftswissenschaft und Informationswissenschaft und deren international besetzter Doktorandengruppe beschäftigt sich die ZBW transdisziplinär mit dem Thema Open Science. Die ZBW ist in ihrer Forschung international vernetzt. Hauptsächliche Kooperationspartner kommen aus DFG- bzw. BMBF-Projekten sowie aus dem Leibniz-Strategieforum Open Science. Die ZBW ist Teil der Leibniz-Gemeinschaft und Stiftung des öffentlichen Rechts. URL: www.zbw.eu

    Medienkontakt:
    DR. DOREEN SIEGFRIED
    Pressesprecherin
    ZBW – Leibniz-Informationszentrum Wirtschaft
    Düsternbrooker Weg 120, 24105 Kiel
    T: +49 [0] 431. 88 14-455
    M: +49 [0] 0172. 251 48 91
    E: d.siegfried@zbw-online.eu
    http://www.zbw.eu


    Contact for scientific information:

    Prof. Dr. Ralf Krestel: https://www.zbw.eu/de/ralf-krestel


    Original publication:

    Die vollständige Studie, „Domain-Specific Keyword Extraction using BERT“ von Jill Sammet und Ralf Krestel, ist im Workshop TermTrends, bei der LDK 2023, veröffentlicht worden und online verfügbar. URL: http://hdl.handle.net/11108/586


    Images

    Einsatz von KI in der Fachterminologie: Die ZBW untersucht automatisierte Methoden zur Aktualisierung des Standard-Thesaurus Wirtschaft
    Einsatz von KI in der Fachterminologie: Die ZBW untersucht automatisierte Methoden zur Aktualisierun ...
    Timo Wilke
    ZBW


    Criteria of this press release:
    Journalists, Scientists and scholars, Students
    Economics / business administration, Information technology
    transregional, national
    Research results, Transfer of Science or Research
    German


     

    Einsatz von KI in der Fachterminologie: Die ZBW untersucht automatisierte Methoden zur Aktualisierung des Standard-Thesaurus Wirtschaft


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).