idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
09.09.2024 12:30

Simba: Berliner Forschungsinstitut präsentiert kostenlose KI-Anwendung zur Reduzierung von Sprachbarrieren im Internet

Frederik Efferenn Wissenschaftskommunikation
Alexander von Humboldt Institut für Internet und Gesellschaft

    Simba hat eine klare Mission: Das Internet für alle verständlicher machen. Die Webanwendung zur Vereinfachung deutschsprachiger Texte wurde von Freya Hewett, Forscherin am Alexander von Humboldt Institut für Internet und Gesellschaft (HIIG), entwickelt. Simba bietet zwei KI-gestützte Lösungen: eine Internet-App zur Vereinfachung eigener Texte und eine Browser-Erweiterung, die automatisch Texte auf Webseiten zusammenfasst. Damit werden digitale Sprachbarrieren abgebaut, das Leseerlebnis verbessert und der Zugang zur deutschen Sprache erleichtert.

    Zur Internet-App: https://publicinterest.ai/tool/simba/simplifier?lang=de
    Zur Browser-Erweiterung: https://publicinterest.ai/tool/simba/extension?lang=de

    Menschen nutzen täglich das Internet, um sich über aktuelle Themen zu informieren. Viele Texte auf Webseiten und in Online-Artikeln sind jedoch oft schwer verständlich. Oftmals liegt dies an komplexen Sätzen und Fachbegriffen. Laut Freya Hewett, Computerlinguistin am HIIG und Initiatorin von Simba, benachteiligt dies insbesondere Menschen mit Lernschwierigkeiten oder jene, die Deutsch als Fremdsprache lernen. „Unsere Recherchen zeigen, dass besonders Webseiten öffentlicher Verwaltungen sowie im Bildungs- und Wissenschaftssektor durch ihre komplizierte Sprache einen wesentlichen Teil der Bevölkerung von wichtigen Informationen ausschließen“, erklärt Hewett. „Vereinfachte Sprache kann dazu beitragen, diese Lücken zu schließen. Die Teilhabe an der Gesellschaft hängt davon ab, Informationen und Dienste im Internet nutzen zu können.“

    Simba ist die erste kostenlose Lösung, die gezielt auch Endnutzer*innen anspricht und ihnen ermöglicht, Texte im Alltag selbst zu vereinfachen. Seine KI-gestützten Anwendungen ersetzen lange Wörter durch kürzere Begriffe, die eine ähnliche oder gleiche Bedeutung haben. Sie verkürzen Sätze und fügen zusätzliche Informationen hinzu, um Zusammenhänge klarer zu machen. Bisher waren vergleichbare Lösungen zur automatisierten Vereinfachung von Sprache in Deutschland kostenpflichtig und wurden vorwiegend von Institutionen und Unternehmen genutzt. Für viele Menschen, die auf leicht verständliche Texte angewiesen sind, waren diese Angebote aufgrund von Bezahlschranken nicht zugänglich. Simba schließt diese Lücke, indem es allen die Möglichkeit gibt, Texte selbst zu vereinfachen. „Unser Ziel ist es, dass Simba ein alltägliches Werkzeug wird, das allen Menschen hilft, die Textvereinfachung in ihrem Alltag nutzen möchten“, betont Dr. Theresa Züger, Leiterin der Forschungsgruppe, in der die KI-Anwendung entstanden ist.

    Das Team um Dr. Theresa Züger erforscht, welche Eigenschaften Künstliche Intelligenz für das Gemeinwohl der Gesellschaft haben sollte. Diese Erkenntnisse werden in praktischen Prototypen umgesetzt, von denen Simba als erster veröffentlicht wird. Weitere Informationen zu diesen Überlegungen finden sich auf der Website: https://publicinterest.ai/

    In diesem Zusammenhang ist ein Alleinstellungsmerkmal von Simba seine Gemeinwohlorientierung. Das heißt, die KI-Anwendung wird ohne kommerzielle Interessen (non-profit) betrieben und die Entwickler*innen sind für Rückfragen erreichbar. Der Quellcode und die zugrunde liegenden Modelle sind frei zugänglich, was eine transparente Zusammenarbeit ermöglicht. Freya Hewett betont: „Wir möchten mit einer Community aus Forscher*innen, Inklusionsfachleuten und Nutzer*innen zusammenarbeiten, um Simba kontinuierlich weiterzuentwickeln und zu verbessern. Die Zielgruppen, die wir ansprechen – wie etwa Menschen mit Lernschwierigkeiten oder Personen, die Deutsch nicht als Muttersprache sprechen – sind sehr heterogen. Unser Ziel ist es, das Sprachmodell durch kontinuierliches Feedback zu verbessern und so Vereinfachungen zu schaffen, die wirklich vielen Menschen nützen.“

    Prof. Dr. Wolfgang Schulz, Forschungsdirektor des HIIG, fügt hinzu: „Wir sind überzeugt, dass KI-Anwendungen wie Simba, frei verfügbar sein sollten, um eine inklusivere und gerechtere digitale Zukunft zu fördern. Sie können einen wesentlichen Beitrag zum gleichberechtigten Zugang zu Wissen leisten.“

    Die beiden Anwendungen von Simba basieren auf einem sogenannten „Textgenerierungsmodell“. Diese Modelle, auch als Large Language Models oder Foundation Models bekannt, werden mit großen Mengen an Textdaten trainiert. Sie berechnen, welches Wort in einer Sequenz am wahrscheinlichsten als nächstes kommt. Beispiele für solche Modelle sind GPT-4, Mistral 7B und Llama. Für Simba wurde das Foundation-Modell Llama-3-8B-Instruct verwendet, das durch deutschsprachige Zeitungsartikel verfeinert wurde.

    „Wie bei allen Textgenerierungsmodellen besteht auch bei Simba die Möglichkeit, dass automatisch generierte Zusammenfassungen fehlerhafte Informationen enthalten“, erläutert Freya Hewett. „Dennoch sind wir überzeugt, dass Simba eine wertvolle Unterstützung bietet.“ Hewett empfiehlt den Eingabe- und Ausgabetext der KI-Anwendung sorgfältig zu vergleichen, um sicherzustellen, dass die Fakten korrekt sind.”

    Simba steht als Prototyp bis auf Weiteres kostenlos zur Verfügung, doch die laufenden Kosten für den Betrieb einer solchen KI-Anwendung sind erheblich. Um die kontinuierliche Verfügbarkeit und Weiterentwicklung von Simba sicherzustellen, sucht das HIIG nach weiteren Kooperationspartnern. Unternehmen und Organisationen sind eingeladen, sich zu engagieren und entweder das Hosting oder die Weiterentwicklung der KI-Anwendung zu unterstützen. Durch diese Partnerschaften soll die Mission von Simba vorangetrieben und die digitale Inklusion gefördert werden.

    Die Beta-Version von Simba entstand im Rahmen der vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Forschungsgruppe „Public Interest AI“ am HIIG unter der Leitung von Dr. Theresa Züger entwickelt. Freya Hewett hat das Sprachmodell trainiert und wurde von Hadi Asghari und Christopher Richter bei der technischen Umsetzung unterstützt. Larissa Wunderlich hat die Benutzeroberfläche gestaltet und die Webseite erstellt.


    Wissenschaftliche Ansprechpartner:

    Freya Hewett freya.hewett@hiig.de, Dr. Theresa Züger theresa.zueger@hiig.de


    Weitere Informationen:

    https://publicinterest.ai/tool/simba?lang=de Zur Simba-Übersicht
    https://publicinterest.ai/tool/simba/simplifier?lang=de Zur Internet-App
    https://publicinterest.ai/tool/simba/extension?lang=de Zur Browser-Erweiterung
    https://www.hiig.de/simba-ki-textvereinfachung/ Anleitungen in vereinfachter Sprache


    Bilder

    Simba: KI-unterstützte Textvereinfachung
    Simba: KI-unterstützte Textvereinfachung
    Prince David
    https://unsplash.com/photos/brown-lion-looking-up-in-macro-lens-photography-MMKAbQPIXg8


    Merkmale dieser Pressemitteilung:
    Journalisten
    Gesellschaft
    überregional
    Forschungsergebnisse, Forschungsprojekte
    Deutsch


     

    Simba: KI-unterstützte Textvereinfachung


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).