idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
02/16/2026 15:52

Effiziente Analyse multimodaler Dokumente mit KI

Matthias Munz Hochschulkommunikation
Hochschule RheinMain

    Wie Künstliche Intelligenz (KI) zur automatisierten Dokumentenauswertung eingesetzt werden kann, untersuchen Forschende der Hochschule RheinMain (HSRM) im Projekt SLIMDOC (Synergetic LIghtweight Multimodal DOCument Analysis).

    Trotz zunehmender Digitalisierung werden Dokumente wie Rechnungen, Geschäftsberichte, Beschwerden, Formulare und Verträge weiterhin häufig genutzt und laufen als Massendaten in Banken, Versicherungen und Behörden auf. Für die Effizienz vieler Geschäftsprozesse, wie die Weiterleitung von Anfragen, die Extraktion und Speicherung von Daten sowie die Unterstützung bei Suchanfragen, ist die Verarbeitung solcher – in der Informatik als unstrukturiert bezeichneten – Dokumente von großer Bedeutung. Wie Künstliche Intelligenz (KI) zur automatisierten Dokumentenauswertung eingesetzt werden kann, untersuchen Forschende der Hochschule RheinMain (HSRM) im Projekt SLIMDOC (Synergetic LIghtweight Multimodal DOCument Analysis).

    Automatisierte Analyse multimodaler Dokumente

    Für die Interpretation von Dokumenten stellt die KI-basierte Dokumentanalyse eine Schlüsseltechnologie dar, die sich etwa mit Informationsextraktion (beispielsweise von Produktpreisen), Entitätserkennung (wie von Orten oder Rechnungspositionen), der Klassifikation von Dokumenten oder mit der automatischen Beantwortung von Fragen zum Dokumentinhalt beschäftigt. Besonders herausfordernd ist es, multimodale Dokumente zu verstehen: Diese beinhalten neben Text auch Bilder wie Grafiken oder Fotos. Die KI muss folglich nicht nur textliche Informationen, sondern auch visuelle Signale und die räumliche Anordnung der Layoutelemente berücksichtigen. Bei der Schadenregulierung in Versicherungen müssen KI-Modelle etwa prüfen, ob Schadendokumente in sich kompatibel und plausibel sind.

    Verkleinerung von KI-Modellen

    „Mit dem Projekt SLIMDOC möchten wir KI-Modelle entwickeln, die solche Dokumente zuverlässig analysieren, und zwar leichtgewichtig“, erklärt Projektleiter Prof. Dr. Adrian Ulges. Bisherige KI-Modelle lassen sich in zwei Arten unterteilen: einerseits Large Language Models (LLMs) wie die Modelle der GPT-Reihe, die als generelle Problemlöser überzeugen, aber einen enormen Ressourcenverbrauch mit sich bringen und nur eingeschränkt lokal betrieben werden können. Daneben gibt es auf die Verarbeitung von Dokumenten spezialisierte Modelle, die Bildinhalt, Text und Layout in Kombination interpretieren, dafür jedoch händisch annotierte Daten benötigen, was mit einem Mehraufwand für die Kunden einhergeht, die diese Annotationen liefern müssen.
    Das Ziel von SLIMDOC ist es, beide Modelltypen synergetisch zu verbinden. Mittels eines als Distillation bezeichneten Verfahrens sollen die Fähigkeiten von LLMs auf sehr kleine, task-spezifische Modelle zur Dokumentenanalyse übertragen werden. So soll ein effektiveres Modell entstehen, das dieselbe Aufgabe im Sinne von Nachhaltigkeit und digitaler Souveränität ressourcenschonend löst. Die KI-Modelle sollen außerdem in der Lage sein, die benötigten Trainingsdaten mittels Dokumentengenerierung selbstständig zu erstellen, sodass teures Datensammeln und die händische Annotation überflüssig werden.

    Zusammenarbeit mit Praxispartnern

    Das Projekt bearbeitet zwei Anwendungsfälle mit drei Praxispartnern. Gemeinsam mit der Insiders Technologies GmbH als mittelständischem Anbieter von Softwarelösungen für die Automatisierung dokumentenzentrierter Geschäftsprozesse werden neue hocheffiziente KI-Modelle für Spezialtasks in der Dokumentanalyse entwickelt. Der Dokumentanalyse als multimodalem Problem widmet sich die Zusammenarbeit mit der R+V Versicherung als Verarbeiter von Massendaten und der Doxis GmbH als Anbieter im Bereich Enterprise Content Management. Geplant ist der Einsatz von neu entwickelten KI-Modellen in der Informationsgewinnung aus mit Grafiken versehenen Geschäftsberichten sowie in der Plausibilitätsprüfung von Versicherungsfällen.

    Die Hochschule RheinMain

    Über 70 Studienangebote an zwei Studienorten mit einem internationalen Netzwerk – das ist die Hochschule RheinMain. Rund 12.600 Studierende studieren in den Fachbereichen Architektur und Bauingenieurwesen, Design Informatik Medien, Sozialwesen und Wiesbaden Business School in Wiesbaden sowie im Fachbereich Ingenieurwissenschaften in Rüsselsheim am Main. Neben der praxisorientierten Lehre ist die Hochschule RheinMain anerkannt für ihre anwendungsbezogene Forschung.

    https://www.hs-rm.de/de/ | https://de-de.facebook.com/HSRheinMain/ | https://de.linkedin.com/school/hochschulerheinmain/ | https://www.instagram.com/hs_rheinmain/ | https://www.youtube.com/user/HochschuleRheinMain


    Contact for scientific information:

    Prof. Dr. Adrian Ulges (Adrian.Ulges@hs-rm.de)


    Images

    Effiziente Analyse multimodaler Dokumente mit KI
    Effiziente Analyse multimodaler Dokumente mit KI

    Copyright: Oleksandr | stock.adobe.com


    Criteria of this press release:
    Business and commerce, Journalists, Scientists and scholars
    Information technology
    transregional, national
    Cooperation agreements, Research projects
    German


     

    Effiziente Analyse multimodaler Dokumente mit KI


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).