idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
30.04.2025 13:30

„Reborn Articles“: Neue Wege in der Wissenschaft

Dr. Sandra Niemeyer Kommunikation und Marketing
TIB – Leibniz Informationszentrum Technik und Naturwissenschaften / TIB - Leibniz Information Centre for Science and Technology

    Wie ein einfacher Ansatz die Art und Weise, wie Forschungsergebnisse produziert und kommuniziert werden, verändern könnte: Mit vorhandenen Datenanalyse-Tools können Forscher:innen ihre wissenschaftlichen Ergebnisse nun für Menschen und Maschinen lesbar machen, sodass sie leichter reproduziert und wiederverwendet werden können.

    Trotz bedeutender Fortschritte bei digitalen Technologien werden moderne wissenschaftliche Ergebnisse noch immer mit veralteten Methoden kommuniziert. In fast vierhundert Jahren hat sich die wissenschaftliche Literatur von physisch gedruckten Artikeln zu PDFs weiterentwickelt. Das Problem dabei: Diese elektronischen Dokumente sind immer noch textbasiert und daher nicht maschinenlesbar. Ein Computer kann die darin enthaltenen Informationen folglich nicht ohne menschliche Hilfe interpretieren.

    Angesichts der Millionen wissenschaftlicher Artikel, die jedes Jahr erscheinen, steigt der Bedarf an maschinengestützter Informationsbeschaffung und -verarbeitung rasant. Die meisten Ansätze setzen darauf, mithilfe Künstlicher Intelligenz (KI) Maschinen darin zu schulen, textbasierte Informationen zu interpretieren – meist mit begrenztem Erfolg.

    Vor Kurzem schlug ein Forschungsteam der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften vor, das Problem aus einer anderen Perspektive zu betrachten. Warum produzieren wir Wissenschaft nicht in einer Sprache, die die Maschinen bereits verstehen, anstatt zu versuchen, Maschinen unsere Sprache beizubringen? In einem in Scientific Data veröffentlichten Artikel stellt das Team „Reborn Articles“ vor, einen Open-Source-Ansatz, der es Forscher:innen ermöglicht, wissenschaftliche Erkenntnisse in einem maschinenlesbaren Format zu produzieren.

    Dr. Markus Stocker, Erstautor und Leiter des Lab Knowledge Infrastructures an der TIB, erklärt: „Viele Wissenschaftler:innen verwenden bereits Datenanalysetools, die Ergebnisse liefern, die Maschinen lesen können. Die Standardmethode zur Veröffentlichung dieser Ergebnisse besteht jedoch darin, sie in einem PDF-Dokument zu organisieren, das Maschinen nicht lesen können. Das bedeutet, dass alle, die diese Ergebnisse wiederverwenden möchten – was der eigentliche Sinn der Veröffentlichung ist – sie zunächst extrahieren und neu strukturieren müssen. Wäre es nicht effizienter, wenn wir Ergebnisse so veröffentlichen könnten, dass auch ihre ursprüngliche Struktur erhalten bleibt? Genau das ermöglichen Reborn Articles.“

    Wie Reborn Articles funktionieren

    Der Ansatz der Reborn Articles funktioniert mit gängigen Datenanalysetools wie R und Python und ermöglicht es Forscher:innen, Ergebnisse zu erzielen, die sowohl von Menschen als auch von Maschinen leicht gelesen werden können. Das bedeutet, dass andere Forscher:innen die Analysen selbst reproduzieren und sogar Reborn-Article-Daten als Excel- oder CSV-Dateien herunterladen können, die ebenfalls maschinenlesbar sind.
    Dies mag trivial erscheinen, aber die Hauptalternativen für die Wiederverwendung veröffentlichter Daten sind entweder das zeitaufwändige und fehleranfällige manuelle Kopieren und Einfügen einzelner Werte aus PDF-Artikeln oder die Verwendung KI-basierter Tools, die ungenau sind.

    Die derzeitige Fixierung auf KI-basierte Informationsextraktion zu überwinden, war eine Herausforderung, wenn es darum ging, zu erklären, wie dieser Ansatz funktioniert. Wie die Co-Autorin und TIB-Postdoktorandin Dr. Lauren Snyder anmerkt: „KI-basierte Extraktionswerkzeuge sind im Moment ein so heißes Thema. Es scheint, als würde jeder Wissenschaftsbereich nach Möglichkeiten suchen, große Sprachmodelle und andere extraktionsbezogene Ansätze zu nutzen. Obwohl sie in bestimmten Situationen ein leistungsstarkes Werkzeug sein können, frage ich mich, ob es uns nicht insgesamt einen Bärendienst erweist, wenn wir uns zu sehr auf sie konzentrieren. Das ist so, als würde man sein Haus renovieren und versuchen, jede Aufgabe mit Bohrern zu bewältigen – das ergibt einfach keinen Sinn. Ich befürchte, dass wir durch unseren derzeitigen Fokus auf die Informationsextraktion Möglichkeiten verpassen, Tools zu entwickeln, mit denen sich bestimmte Aufgaben effizienter bewältigen lassen. Ich hoffe, dass unsere Arbeit andere dazu inspiriert, über die gängigen Ansätze hinauszudenken.“

    Stocker fügt hinzu: „Seit mindestens einem Vierteljahrhundert weisen Menschen auf die Ineffizienz unserer wissenschaftlichen Erkenntnisgewinnung hin. In dieser Zeit hat die KI-basierte Extraktion das Problem nicht gelöst, und wenn wir weiterhin der Meinung sind, dass Extraktion alles ist, was wir tun können, werden wir Mitte des Jahrhunderts vielleicht immer noch mit den gleichen Problemen zu kämpfen haben. Wenn wir stattdessen schon lange existierende Technologien genutzt hätten, um sicherzustellen, dass wissenschaftliche Erkenntnisse maschinenlesbar produziert und veröffentlicht werden, hätten wir heute riesige Datenbanken mit organisiertem Wissen. Auch wenn wir vielleicht etwas spät dran sind, ist es nie zu spät, mit bahnbrechenden Ansätzen zu beginnen.“

    Mehr über die Studie

    Die Studie „Rethinking the production and publication of machine-readable expressions of research findings“ erschien als Open-Access-Artikel in Scientific Data. Der vollständige Artikel ist verfügbar unter: https://doi.org/10.1038/s41597-025-04905-0
    Die Autorinnen und Autoren sind Markus Stocker, Lauren Snyder, Matthew Anfuso, Oliver Ludwig, Freya Thießen, Kheir Eddine Farfar, Muhammad Haris, Allard Oelen und Mohamad Yaser Jaradeh.

    Erkunden Sie die Daten des Reborn Articles in der neuen digitalen Bibliothek ORKG reborn: https://reborn.orkg.org/

    Die Co-Autorin Lauren Snyder hat kürzlich ein Video produziert, in dem sie Reborn Articles für die spezielle KI/Quanten-Kategorie des Wettbewerbs „Dance your PhD“ 2025 beschreibt, der von AAAS und Science durchgeführt wird. Das Video beschreibt die Grenzen textbasierter wissenschaftlicher Artikel aus der Perspektive einer Maschine und zeigt, wie maschinenlesbares wissenschaftliches Wissen die Forschung wirkungsvoller machen kann.

    Hier können Sie sich das Video ansehen und mittanzen: https://youtu.be/lM0OolYmD9c?si=XM7iyzT6UF_rL-FM

    Über die TIB – Leibniz Informationszentrum für Technik und Naturwissenschaften

    Die TIB versorgt Wissenschaft, Forschung, Industrie und Wirtschaft mit Literatur und Informationen. Die Bibliothek setzt sich für Offenheit und den freien Zugang – Open Access – zu Informationen, Publikationen und wissenschaftlichen Daten ein: Sie will Informationen und Wissen leichter zugänglich, transparenter und besser nachnutzbar machen. Die TIB baut ihre Rolle als deutsches Informationszentrum für die Digitalisierung von Wissenschaft und Technik stetig aus. Für Fach- und Forschungscommunities stellt sie unter www.tib.eu wissenschaftliche Inhalte, digitale Dienste und Methodenkompetenz bereit, um die verschiedenen Phasen des wissenschaftlichen Arbeitens zu unterstützen. Über ihr Recherche- und Bestellportal bietet die Bibliothek Zugriff auf mehr als 95 Millionen von der TIB indexierte technisch-naturwissenschaftliche Datensätze. Zu dem exzellenten qualitätsgeprüften Bestand zählen auch Wissensobjekte wie audiovisuelle Medien, 3D-Modelle und Forschungsdaten. Mit eigens entwickelten Suchtechnologien können im AV-Portal der TIB (https://av.tib.eu/) die Inhalte wissenschaftlicher Videos aus Technik und Naturwissenschaften zielgenau durchsucht werden. Die TIB betreibt angewandte Forschung und Entwicklung, um neue Dienstleistungen zu generieren und bestehende zu optimieren. Die Schwerpunkte liegen auf Data Science, nicht-textuellen Materialien, Open Science und Visual Analytics. Die TIB ist eine Stiftung öffentlichen Rechts des Landes Niedersachsen und Mitglied der Leibniz-Gemeinschaft.


    Wissenschaftliche Ansprechpartner:

    Markus Stocker, Leiter Lab Knowledge Infrastructures an der TIB, markus.stocker@tib.eu (spricht Deutsch und Englisch)

    Lauren Snyder, Postdoktorandin im Lab Knowledge Infrastructures an der TIB, lauren.snyder@tib.eu (spricht Englisch)

    Die Kontaktpersonen stehen für Live- und aufgezeichnete Fernseh-, Radio- oder Podcast-Interviews zur Verfügung.


    Originalpublikation:

    https://doi.org/10.1038/s41597-025-04905-0


    Bilder

    Merkmale dieser Pressemitteilung:
    Journalisten, Wirtschaftsvertreter, Wissenschaftler, jedermann
    Informationstechnik
    überregional
    Forschungsergebnisse, Wissenschaftliche Publikationen
    Deutsch


     

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).