idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Thema Corona

Imagefilm
Science Video Project



Share on: 
01/14/2021 12:33

Neue Technologien zur Unterstützung beim Post-Editing maschineller Übersetzungen – Forschungsprojekt MMPE abgeschlossen

Reinhard Karger M.A. DFKI Saarbrücken
Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI

    Die Qualität Maschineller Übersetzung hat sich in den letzten Jahren deutlich verbessert. Übersetzer verlagern ihre Tätigkeit immer öfter zum Post-Editing maschineller Übersetzungen. Das spart Zeit, reduziert Fehler, verändert aber die Art der Interaktion mit dem Text. Wie Post-Editing technologisch unterstützt werden kann, untersuchte ein interdisziplinäres Forscherteam des DFKI im Projekt MMPE (Multi-modal and Language Technology based Post-Editing Support for Machine Translation). MMPE unter der Leitung von Prof. Dr. Antonio Krüger und Prof. Dr. Josef van Genabith wurde von der Deutschen Forschungsgemeinschaft über einen Zeitraum von dreieinhalb Jahren gefördert und endete am 31.12.2020.

    Post-Editing (PE) kombiniert die Vorteile von Künstlicher Intelligenz und menschlicher Intelligenz, verschiebt aber auch den Fokus von Übersetzungsarbeiten: Anstatt Text zu erzeugen, korrigieren Übersetzer Fehler in ansonsten hilfreichen Vorschlägen in der Zielsprache. Häufig wiederkehrende Fehler der maschinellen Übersetzung (MÜ) zu verbessern ist ermüdend, schwer zu findende oder komplexe Fehler zu beheben, macht die Tätigkeit kognitiv anspruchsvoll.
    „Während die KI gut darin ist, schnell Übersetzungsentwürfe vorzuschlagen, kann nur ein Mensch mit fundierten Kenntnissen der Ausgangs- und Zielsprache lexikalische und semantische Nuancen analysieren und sicherstellen, dass die Bedeutung der Übersetzung identisch ist“, umreißt Projektleiter Prof. Dr. Josef van Genabith die Vorteile.
    Die Wissenschaftler aus den Forschungsbereichen Kognitive Assistenzsysteme unter der Leitung von Prof. Dr. Antonio Krüger sowie Sprachtechnologie und Multilingualität unter der Leitung von Prof. Josef van Genabith haben untersucht, wie Übersetzungsumgebungen multimodale Eingaben unterstützen können und kognitive Aspekte des Post-Editing berücksichtigt werden können. Außerdem befassten sie sich mit der Frage, wie Automatisches Post-Editing hilft, immer wiederkehrende Fehler zu vermeiden.
    Das Team erstellte eine Übersetzungsumgebung in einem benutzerzentrierten Designprozess. Die Umgebung ermöglicht es, Text durchzustreichen oder handschriftlich zu ergänzen, Wörter per Drag & Drop neu zu ordnen oder Sprachbefehle zur Editierung zu verwenden.
    Eine Evaluierung mit professionellen Übersetzerinnen zeigt, dass diese Interaktionsmodalitäten gute Erweiterungen zu Maus & Tastatur sind, wobei sich Stift- und Touch-Eingabe für Lösch- und Neuordnungsaufgaben als geeignet erwiesen, während Sprachbefehle und multimodale Kombinationen von Auswählen & Sprechen gut für Ersetzungen und Einfügungen funktionieren.
    Post-Editing verändert aber auch die kognitive Dimension des Übersetzens. Es erfordert nicht nur ein Gespür für den Satz in der Originalsprache, sondern auch für die fehleranfällige Ausgabe der maschinellen Übersetzung, den umgebenden Kontext sowie die Leserschaft und deren kulturellen Hintergrund. Robuste Ansätze zur automatischen Abschätzung dieser veränderten kognitiven Belastung (Cognitive Load - CL) beim Post-Editing ermöglichen ein besseres Verständnis dafür, ob und wann maschinelles Übersetzen den Arbeitsprozess eher unterstützt oder behindert.
    Das Projektteam hat daher ein Sensor-Framework entwickelt, das eine breite Palette physiologischer und verhaltensbezogener Daten verwendet, um die wahrgenommene kognitive Belastung abzuschätzen, und hat es in mehreren Studien getestet. Dabei konnte gezeigt werden, dass multimodale Messungen von Augen-, Herz- und Haut-basierten Daten verwendet werden können, um die Übersetzungsumgebungen an die kognitive Belastung anzupassen.
    Bei der maschinellen Übersetzung treten nicht nur tatsächliche Fehler auf, die MÜ trifft mitunter auch immer wieder dieselben lexikalischen oder stilistischen Entscheidungen, mit denen der Übersetzer möglicherweise nicht einverstanden ist. Im gesamten Text sind dann ähnliche Modifikationen erforderlich. Die Wissenschaftlerinnen und Wissenschaftler haben daher verschiedene Deep-Learning-Architekturen für das automatische Post-Editing (APE) untersucht, die die Ausgabe jedes Black-Box-MÜ-Systems an eine bestimmte Domäne oder einen bestimmten Stil anpassen können. Anstatt übersetzen zu lernen, lernen APE-Systeme aus wiederkehrenden menschlichen Korrekturen und wenden sie auf Vorschläge der maschinellen Übersetzung für neue Texte an.
    Die internationale Sichtbarkeit der in dem Projekt erzielten wissenschaftlichen Ergebnisse ist durch herausragende Publikationen, z.B. auf der Conference on Human Factors in Computing Systems (CHI), dem Annual Meeting of the Association for Computational Linguistics (ACL), der Conference on Computational Linguistics (COLING) oder im Machine Translation Journal dokumentiert.
    Das MMPE-Projekt ist jetzt als Open Source auf Github verfügbar.


    Contact for scientific information:

    Nico Herbig
    Forschungsbereich Kognitive Assistenzsysteme
    E-Mail: nico.herbig@dfki.de
    Tel.: +49 681 85775 5368


    More information:

    https://mmpe.dfki.de
    https://github.com/NicoHerbig/MMPE


    Criteria of this press release:
    Journalists, all interested persons
    Cultural sciences, Information technology, Language / literature
    transregional, national
    Research projects, Research results
    German


    Erweiterte Interaktionsmodalitäten unterstützen beim Post-Editing.


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).