idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instanz:
Teilen: 
14.01.2021 12:33

Neue Technologien zur Unterstützung beim Post-Editing maschineller Übersetzungen – Forschungsprojekt MMPE abgeschlossen

Reinhard Karger M.A. DFKI Saarbrücken
Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI

    Die Qualität Maschineller Übersetzung hat sich in den letzten Jahren deutlich verbessert. Übersetzer verlagern ihre Tätigkeit immer öfter zum Post-Editing maschineller Übersetzungen. Das spart Zeit, reduziert Fehler, verändert aber die Art der Interaktion mit dem Text. Wie Post-Editing technologisch unterstützt werden kann, untersuchte ein interdisziplinäres Forscherteam des DFKI im Projekt MMPE (Multi-modal and Language Technology based Post-Editing Support for Machine Translation). MMPE unter der Leitung von Prof. Dr. Antonio Krüger und Prof. Dr. Josef van Genabith wurde von der Deutschen Forschungsgemeinschaft über einen Zeitraum von dreieinhalb Jahren gefördert und endete am 31.12.2020.

    Post-Editing (PE) kombiniert die Vorteile von Künstlicher Intelligenz und menschlicher Intelligenz, verschiebt aber auch den Fokus von Übersetzungsarbeiten: Anstatt Text zu erzeugen, korrigieren Übersetzer Fehler in ansonsten hilfreichen Vorschlägen in der Zielsprache. Häufig wiederkehrende Fehler der maschinellen Übersetzung (MÜ) zu verbessern ist ermüdend, schwer zu findende oder komplexe Fehler zu beheben, macht die Tätigkeit kognitiv anspruchsvoll.
    „Während die KI gut darin ist, schnell Übersetzungsentwürfe vorzuschlagen, kann nur ein Mensch mit fundierten Kenntnissen der Ausgangs- und Zielsprache lexikalische und semantische Nuancen analysieren und sicherstellen, dass die Bedeutung der Übersetzung identisch ist“, umreißt Projektleiter Prof. Dr. Josef van Genabith die Vorteile.
    Die Wissenschaftler aus den Forschungsbereichen Kognitive Assistenzsysteme unter der Leitung von Prof. Dr. Antonio Krüger sowie Sprachtechnologie und Multilingualität unter der Leitung von Prof. Josef van Genabith haben untersucht, wie Übersetzungsumgebungen multimodale Eingaben unterstützen können und kognitive Aspekte des Post-Editing berücksichtigt werden können. Außerdem befassten sie sich mit der Frage, wie Automatisches Post-Editing hilft, immer wiederkehrende Fehler zu vermeiden.
    Das Team erstellte eine Übersetzungsumgebung in einem benutzerzentrierten Designprozess. Die Umgebung ermöglicht es, Text durchzustreichen oder handschriftlich zu ergänzen, Wörter per Drag & Drop neu zu ordnen oder Sprachbefehle zur Editierung zu verwenden.
    Eine Evaluierung mit professionellen Übersetzerinnen zeigt, dass diese Interaktionsmodalitäten gute Erweiterungen zu Maus & Tastatur sind, wobei sich Stift- und Touch-Eingabe für Lösch- und Neuordnungsaufgaben als geeignet erwiesen, während Sprachbefehle und multimodale Kombinationen von Auswählen & Sprechen gut für Ersetzungen und Einfügungen funktionieren.
    Post-Editing verändert aber auch die kognitive Dimension des Übersetzens. Es erfordert nicht nur ein Gespür für den Satz in der Originalsprache, sondern auch für die fehleranfällige Ausgabe der maschinellen Übersetzung, den umgebenden Kontext sowie die Leserschaft und deren kulturellen Hintergrund. Robuste Ansätze zur automatischen Abschätzung dieser veränderten kognitiven Belastung (Cognitive Load - CL) beim Post-Editing ermöglichen ein besseres Verständnis dafür, ob und wann maschinelles Übersetzen den Arbeitsprozess eher unterstützt oder behindert.
    Das Projektteam hat daher ein Sensor-Framework entwickelt, das eine breite Palette physiologischer und verhaltensbezogener Daten verwendet, um die wahrgenommene kognitive Belastung abzuschätzen, und hat es in mehreren Studien getestet. Dabei konnte gezeigt werden, dass multimodale Messungen von Augen-, Herz- und Haut-basierten Daten verwendet werden können, um die Übersetzungsumgebungen an die kognitive Belastung anzupassen.
    Bei der maschinellen Übersetzung treten nicht nur tatsächliche Fehler auf, die MÜ trifft mitunter auch immer wieder dieselben lexikalischen oder stilistischen Entscheidungen, mit denen der Übersetzer möglicherweise nicht einverstanden ist. Im gesamten Text sind dann ähnliche Modifikationen erforderlich. Die Wissenschaftlerinnen und Wissenschaftler haben daher verschiedene Deep-Learning-Architekturen für das automatische Post-Editing (APE) untersucht, die die Ausgabe jedes Black-Box-MÜ-Systems an eine bestimmte Domäne oder einen bestimmten Stil anpassen können. Anstatt übersetzen zu lernen, lernen APE-Systeme aus wiederkehrenden menschlichen Korrekturen und wenden sie auf Vorschläge der maschinellen Übersetzung für neue Texte an.
    Die internationale Sichtbarkeit der in dem Projekt erzielten wissenschaftlichen Ergebnisse ist durch herausragende Publikationen, z.B. auf der Conference on Human Factors in Computing Systems (CHI), dem Annual Meeting of the Association for Computational Linguistics (ACL), der Conference on Computational Linguistics (COLING) oder im Machine Translation Journal dokumentiert.
    Das MMPE-Projekt ist jetzt als Open Source auf Github verfügbar.


    Wissenschaftliche Ansprechpartner:

    Nico Herbig
    Forschungsbereich Kognitive Assistenzsysteme
    E-Mail: nico.herbig@dfki.de
    Tel.: +49 681 85775 5368


    Weitere Informationen:

    https://mmpe.dfki.de
    https://github.com/NicoHerbig/MMPE


    Bilder

    Erweiterte Interaktionsmodalitäten unterstützen beim Post-Editing.
    Erweiterte Interaktionsmodalitäten unterstützen beim Post-Editing.

    DFKI


    Merkmale dieser Pressemitteilung:
    Journalisten, jedermann
    Informationstechnik, Kulturwissenschaften, Sprache / Literatur
    überregional
    Forschungsergebnisse, Forschungsprojekte
    Deutsch


     

    Erweiterte Interaktionsmodalitäten unterstützen beim Post-Editing.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).