RDF-Wissensgraphen: Benchmark evaluiert Large Language Models automatisch

23.04.2024 12:01

RDF-Wissensgraphen: Benchmark evaluiert Large Language Models automatisch

Julia Holze Public Relations InfAI
Institut für Angewandte Informatik e. V. (InfAI)

Ergänzung vom 26.04.2024

Das Benchmarksystem LLM-KG-Bench überprüft automatisch, wie gut Large Language Models Aufgaben rund um RDF-Wissensgraphen erfüllen. Es ist das erste System für diesen Anwendungsfall. Es kann Unternehmen dabei helfen, Chatbots zuverlässig einzusetzen.

Ein Forschungsteam des Instituts für Angewandte Informatik e.V. in Leipzig hat ein Benchmarksystem entwickelt, um zu überprüfen, wie gut große Sprachmodelle (engl. Large Language Model – LLM) Aufgaben in Bezug auf RDF-Wissensgraphen erfüllen.

Der LLM-KG-Bench ist das erste System für diesen Anwendungsbereich. Es evaluiert vorgegebene Aufgaben automatisiert. Dadurch ist es geeignet langfristig zu überprüfen, wie Sprachmodelle in RDF-Wissensgraph-spezifischen Aufgaben abschneiden. Das kann den sicheren Einsatz von Chatbots unterstützen, die auf LLMs basieren.

In Bezug auf RDF-Wissensgraphen hat das Team drei Sprachmodelle getestet: Claude-1.3 von Anthropic sowie ChatGPT-3.5 und ChatGPT-4 von OpenAI. Weitere Modelle lassen sich bei Bedarf ergänzen. Die Modelle sollten je drei Aufgaben lösen: Fehlerbehebung in vorhandenen kleinen Wissensgraphen; Extraktion von Datenblättern; Erstellung von Datensätzen. Alle drei Aufgaben gehören zur Entwicklung von Wissensgraphen.

Im Ergebnis hat sich gezeigt, dass die getesteten LLMs noch deutlichen Verbesserungsbedarf für eine zuverlässige Verwendung haben, wie Lars-Peter Meyer vom Institut für Angewandte Informatik (InfAI) e.V. einordnet: “Wir sind noch nicht an dem Punkt, Wissensgraph-spezifische Aufgaben ungeprüft an Sprachmodelle abzugeben. Zurzeit liefern sie noch nicht zuverlässig richtige Ergebnisse. Aber wenn sie so weit sind, bekommen wir es durch den LLM-KG-Bench mit.” Der LLM-KG-Bench ist erstmals im Poster-Track der Semantics-Konferenz 2023 vorgestellt worden.

Mit dem RDF-Standard werden Daten durch ihre Beziehungen zueinander beschrieben. Dadurch sind sie für KI-Systeme besonders gut lesbar.

Über das InfAI

Das Institut für Angewandte Informatik (InfAI) e.V. ist ein An-Institut der Universität Leipzig und dient als Transferinstitut dem Zweck der Forschungsförderung auf den Gebieten der Informatik und Wirtschaftsinformatik. Ein besonderer Themenschwerpunkt des InfAI sind die Bereiche Wissensgraphen und Open Data. In nationalen und internationalen Forschungsprojekten hat das Institut bereits zahlreiche Lösungen für die semantische Datenverarbeitung entwickelt. Es hat den Lead des Forschungsprojekts KISS.

Über das Forschungsprojekt KISS (KI-gestütztes Rapid Supply Network)

Das Projekt beschäftigt sich mit der Frage, ob sich Ontologien als Basis für B2B-Matching-Plattformen eignen. Dazu wird die KI-gestützte Plattform “Semper-KI” entwickelt. Anwendungsgebiet ist der 3D-Druck. Ziel ist, mit der Plattform zu einer krisenresilienten Infrastruktur in Deutschland beizutragen. Web: magazin.semper-ki.org

Das Projekt wird vom Bundesministerium für Wirtschaft und Klimaschutz im Rahmen des KI-Innovationswettbewerbs gefördert.

Wissenschaftliche Ansprechpartner:

Dr. Christian Zinke-Wehlmann
Institut für Angewandte Informatik (InfAI) e.V.
An-Institut an der Universität Leipzig
Goerdelerring 9 | 04109 Leipzig
E-Mail: zinke@infai.org

Weitere Informationen:

https://magazin.semper-ki.org/

Bilder

Basic LLM-KG-Bench framework architecture

Ergänzung vom 26.04.2024

Projektkontakt (Marketing):
Nadja Häse
Institut für Angewandte Informatik (InfAI) e.V.
An-Institut an der Universität Leipzig
Goerdelerring 9 | 04109 Leipzig
E-Mail: haese@infai.org

Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik
überregional
Forschungs- / Wissenstransfer, Forschungsergebnisse
Deutsch

Umfang der Suche

Suche in Pressemitteilungen Suche in Terminen

Art der Pressemitteilung

Arten der Veranstaltung

Sachgebiete

- Buntes aus der Wissenschaft [i]
- Forschungs- / Wissenstransfer [i]
- Forschungsergebnisse [i]
- Forschungsprojekte [i]
- Kooperationen [i]
- Organisatorisches [i]
- Personalia [i]
- Pressetermine [i]
- Schule und Wissenschaft [i]
- Studium und Lehre [i]
- Wettbewerbe / Auszeichnungen [i]
- Wissenschaftliche Publikationen [i]
- Wissenschaftliche Tagungen [i]
- wissenschaftliche Weiterbildung [i]
- Wissenschaftspolitik [i]
- Alles auswählen
- (studentische) Informationsveranstaltung / Messe [i]
- Angebote für Kinder + Jugendliche [i]
- Ausstellung / kulturelle Veranstaltung / Fest [i]
- Exkursion
- Konferenz / Symposion / (Jahres-)Tagung
- Pressetermine [i]
- Seminar / Workshop / Diskussion [i]
- Vortrag / Kolloquium / Vorlesung [i]
- Alles auswählen
- Bauwesen / Architektur [i]
- Biologie [i]
- Chemie [i]
- Elektrotechnik [i]
- Energie [i]
- Ernährung / Gesundheit / Pflege [i]
- Geowissenschaften [i]
- Geschichte / Archäologie
- Gesellschaft [i]
- Informationstechnik [i]
- Kulturwissenschaften [i]
- Kunst / Design [i]
- Maschinenbau [i]
- Mathematik [i]
- Medien- und Kommunikationswissenschaften [i]
- Medizin [i]
- Meer / Klima [i]
- Musik / Theater [i]
- Pädagogik / Bildung [i]
- Philosophie / Ethik [i]
- Physik / Astronomie [i]
- Politik [i]
- Psychologie [i]
- Recht [i]
- Religion [i]
- Sportwissenschaft [i]
- Sprache / Literatur [i]
- Tier / Land / Forst [i]
- Umwelt / Ökologie [i]
- Verkehr / Transport [i]
- Werkstoffwissenschaften [i]
- Wirtschaft [i]
- fachunabhängig [i]
- Alles auswählen

Datum der Veröffentlichung

Anfangsdatum

Enddatum

- Dänemark
- Deutschland
- Frankreich
- Großbritannien
- Israel
- Italien
- Japan
- Liechtenstein
- Luxemburg
- Niederlande
- Österreich
- Schweden
- Schweiz
- Ungarn
- sonstiges
- Alles auswählen
- Deutsch
- Englisch
- Baden-Württemberg
- Bayern
- Berlin
- Brandenburg
- Bremen
- Hamburg
- Hessen
- Mecklenburg-Vorpommern
- Niedersachsen
- Nordrhein-Westfalen
- Rheinland-Pfalz
- Saarland
- Sachsen
- Sachsen-Anhalt
- Schleswig-Holstein
- Thüringen
- Alles auswählen
- Burgenland
- Kärnten
- Niederösterreich
- Oberösterreich
- Salzburg
- Steiermark
- Tirol
- Vorarlberg
- Wien
- Alles auswählen
- Aargau
- Appenzell Ausserrhoden
- Appenzell Innerrhoden
- Basel-Landschaft
- Basel-Stadt
- Bern
- Freiburg
- Genf
- Glarus
- Graubünden
- Jura
- Luzern
- Neuenburg
- Nidwalden
- Obwalden
- Schaffhausen
- Schwyz
- Solothurn
- St. Gallen
- Tessin
- Thurgau
- Uri
- Waadt
- Wallis
- Zug
- Zürich
- Alles auswählen

Bei der Veröffentlichung gewählte Reichweite

Zielgruppen

- lokal
- regional
- überregional
- international
- Alles auswählen
- Journalisten
- Lehrer/Schüler
- Studierende
- Wirtschaftsvertreter
- Wissenschaftler
- jedermann
- Alles auswählen

idw – Informationsdienst Wissenschaft

idw-News App:

RDF-Wissensgraphen: Benchmark evaluiert Large Language Models automatisch

Julia Holze Public Relations InfAI
Institut für Angewandte Informatik e. V. (InfAI)

Wissenschaftliche Ansprechpartner:

Weitere Informationen:

Ergänzung vom 26.04.2024

idw-News App:

RDF-Wissensgraphen: Benchmark evaluiert Large Language Models automatisch

Julia Holze Public Relations InfAI Institut für Angewandte Informatik e. V. (InfAI)

Wissenschaftliche Ansprechpartner:

Weitere Informationen:

Ergänzung vom 26.04.2024

Erweiterte Suche

Umfang der Suche

Datum der Veröffentlichung

Hilfe

Die Suche / Erweiterte Suche im idw-Archiv

Verknüpfungen

Klammern

Wortgruppen

Auswahlkriterien

Julia Holze Public Relations InfAI
Institut für Angewandte Informatik e. V. (InfAI)