Wie Künstliche Intelligenz (KI) zur automatisierten Dokumentenauswertung eingesetzt werden kann, untersuchen Forschende der Hochschule RheinMain (HSRM) im Projekt SLIMDOC (Synergetic LIghtweight Multimodal DOCument Analysis).
Trotz zunehmender Digitalisierung werden Dokumente wie Rechnungen, Geschäftsberichte, Beschwerden, Formulare und Verträge weiterhin häufig genutzt und laufen als Massendaten in Banken, Versicherungen und Behörden auf. Für die Effizienz vieler Geschäftsprozesse, wie die Weiterleitung von Anfragen, die Extraktion und Speicherung von Daten sowie die Unterstützung bei Suchanfragen, ist die Verarbeitung solcher – in der Informatik als unstrukturiert bezeichneten – Dokumente von großer Bedeutung. Wie Künstliche Intelligenz (KI) zur automatisierten Dokumentenauswertung eingesetzt werden kann, untersuchen Forschende der Hochschule RheinMain (HSRM) im Projekt SLIMDOC (Synergetic LIghtweight Multimodal DOCument Analysis).
Automatisierte Analyse multimodaler Dokumente
Für die Interpretation von Dokumenten stellt die KI-basierte Dokumentanalyse eine Schlüsseltechnologie dar, die sich etwa mit Informationsextraktion (beispielsweise von Produktpreisen), Entitätserkennung (wie von Orten oder Rechnungspositionen), der Klassifikation von Dokumenten oder mit der automatischen Beantwortung von Fragen zum Dokumentinhalt beschäftigt. Besonders herausfordernd ist es, multimodale Dokumente zu verstehen: Diese beinhalten neben Text auch Bilder wie Grafiken oder Fotos. Die KI muss folglich nicht nur textliche Informationen, sondern auch visuelle Signale und die räumliche Anordnung der Layoutelemente berücksichtigen. Bei der Schadenregulierung in Versicherungen müssen KI-Modelle etwa prüfen, ob Schadendokumente in sich kompatibel und plausibel sind.
Verkleinerung von KI-Modellen
„Mit dem Projekt SLIMDOC möchten wir KI-Modelle entwickeln, die solche Dokumente zuverlässig analysieren, und zwar leichtgewichtig“, erklärt Projektleiter Prof. Dr. Adrian Ulges. Bisherige KI-Modelle lassen sich in zwei Arten unterteilen: einerseits Large Language Models (LLMs) wie die Modelle der GPT-Reihe, die als generelle Problemlöser überzeugen, aber einen enormen Ressourcenverbrauch mit sich bringen und nur eingeschränkt lokal betrieben werden können. Daneben gibt es auf die Verarbeitung von Dokumenten spezialisierte Modelle, die Bildinhalt, Text und Layout in Kombination interpretieren, dafür jedoch händisch annotierte Daten benötigen, was mit einem Mehraufwand für die Kunden einhergeht, die diese Annotationen liefern müssen.
Das Ziel von SLIMDOC ist es, beide Modelltypen synergetisch zu verbinden. Mittels eines als Distillation bezeichneten Verfahrens sollen die Fähigkeiten von LLMs auf sehr kleine, task-spezifische Modelle zur Dokumentenanalyse übertragen werden. So soll ein effektiveres Modell entstehen, das dieselbe Aufgabe im Sinne von Nachhaltigkeit und digitaler Souveränität ressourcenschonend löst. Die KI-Modelle sollen außerdem in der Lage sein, die benötigten Trainingsdaten mittels Dokumentengenerierung selbstständig zu erstellen, sodass teures Datensammeln und die händische Annotation überflüssig werden.
Zusammenarbeit mit Praxispartnern
Das Projekt bearbeitet zwei Anwendungsfälle mit drei Praxispartnern. Gemeinsam mit der Insiders Technologies GmbH als mittelständischem Anbieter von Softwarelösungen für die Automatisierung dokumentenzentrierter Geschäftsprozesse werden neue hocheffiziente KI-Modelle für Spezialtasks in der Dokumentanalyse entwickelt. Der Dokumentanalyse als multimodalem Problem widmet sich die Zusammenarbeit mit der R+V Versicherung als Verarbeiter von Massendaten und der Doxis GmbH als Anbieter im Bereich Enterprise Content Management. Geplant ist der Einsatz von neu entwickelten KI-Modellen in der Informationsgewinnung aus mit Grafiken versehenen Geschäftsberichten sowie in der Plausibilitätsprüfung von Versicherungsfällen.
Die Hochschule RheinMain
Über 70 Studienangebote an zwei Studienorten mit einem internationalen Netzwerk – das ist die Hochschule RheinMain. Rund 12.600 Studierende studieren in den Fachbereichen Architektur und Bauingenieurwesen, Design Informatik Medien, Sozialwesen und Wiesbaden Business School in Wiesbaden sowie im Fachbereich Ingenieurwissenschaften in Rüsselsheim am Main. Neben der praxisorientierten Lehre ist die Hochschule RheinMain anerkannt für ihre anwendungsbezogene Forschung.
https://www.hs-rm.de/de/ | https://de-de.facebook.com/HSRheinMain/ | https://de.linkedin.com/school/hochschulerheinmain/ | https://www.instagram.com/hs_rheinmain/ | https://www.youtube.com/user/HochschuleRheinMain
Prof. Dr. Adrian Ulges (Adrian.Ulges@hs-rm.de)
Effiziente Analyse multimodaler Dokumente mit KI
Copyright: Oleksandr | stock.adobe.com
Merkmale dieser Pressemitteilung:
Journalisten, Wirtschaftsvertreter, Wissenschaftler
Informationstechnik
überregional
Forschungsprojekte, Kooperationen
Deutsch

Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).