idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
04/25/2022 09:47

Schädigende Sprache mit Algorithmen finden

Dr. Julia Weiler Dezernat Hochschulkommunikation
Ruhr-Universität Bochum

    Wie gut Methoden zur Erkennung von Hassrede auch subtilere Formen von schädigender Sprache aufspüren können, untersucht Prof. Dr. Tatjana Scheffler aus der Arbeitsgruppe für Digitale Forensische Linguistik der Ruhr-Universität Bochum (RUB). Gemeinsam mit Kolleginnen aus Berlin hat sie beispielsweise einen Telegram-Chat zum Sturm auf das Kapitol 2021 ausgewertet und Formen von schädigender Sprache identifiziert, die Algorithmen bislang schlecht erkennen. Diese Erkenntnisse möchte die Wissenschaftlerin in Zukunft nutzen, um selbst entwickelte Algorithmen für die Erkennung von schädigender Sprache zu optimieren. Über ihre Arbeit berichtet Rubin, das Wissenschaftsmagazin der RUB.

    Künstliche-Intelligenz-Algorithmen können lernen, Aussagen verschiedenen Kategorien zuzuordnen. So können sie etwa entscheiden, ob eine Textpassage eine direkte Beleidigung enthält oder nicht. Die Algorithmen lernen die Kategorien anhand von großen Trainingsdatensätzen, die Menschen zuvor klassifiziert haben. Später können sie das Wissen über die erlernten Kategorien dann auf neue Daten übertragen.

    „Direkte Beleidigungen und Schimpfwörter sind so schon gut zu identifizieren“, weiß Tatjana Scheffler. Oft reicht ein Abgleich mit einer Wortliste, die häufig verwendete Beleidigungen enthält. Unter schädigender Sprache versteht die Forscherin aber viel mehr als offensichtliche Hassrede, die sich gegen einzelne Personen richtet. „Es gibt implizitere Formen, die gar nicht an einen bestimmten Adressaten oder eine Adressatin gerichtet sind“, sagt sie. „Man kann auch Schaden anrichten, in dem man auf eine gewisse Weise über andere spricht oder eine bestimmte Stimmung herstellt.“

    Telegram-Chat von Trump-Anhängern analysiert

    In einer Studie arbeitete das Team um Tatjana Scheffler beispielsweise mit 26.431 Nachrichten, die zwischen dem 11. Dezember 2016 und dem 18. Januar 2021 in einem öffentlichen Telegram-Kanal gepostet worden waren. Dort äußerten sich Menschen mit extrem rechter Gesinnung zunächst zu der theoretischen Idee, die US-amerikanische Regierung zu stürzen. Später entwickelten sie konkrete Pläne, das Kapitol zu stürmen, was am 6. Januar 2021 passierte.

    Automatisierte Verfahren und Menschen im Vergleich

    Die Forscherinnen analysierten etwa ein Fünftel der Nachrichten von Hand und verglichen die Ergebnisse mit denen von automatisierten Verfahren, wie Tech-Firmen sie nutzen, um Hassrede oder beleidigende Sprache ausfindig zu machen. 4.505 Nachrichten gingen in den Vergleich ein. 3.395 davon stuften sowohl die Wissenschaftlerinnen als auch die automatisierten Verfahren als nicht schädigend ein, bei 275 waren sie sich einig, dass sie schädigende Sprache enthielten. 835 Nachrichten hingegen bewerteten Mensch und Maschine unterschiedlich: Etwa die Hälfte stuften die Algorithmen fälschlicherweise als Hassrede oder Beleidigung ein; den Rest erkannten sie – anders als die Wissenschaftlerinnen – nicht als schädigende Sprache.

    Gerade bei aufwiegelnden Kommentaren, Insiderbegriffen und Othering – Bemerkungen, die genutzt werden, um eine Gruppe Menschen von einer anderen abzugrenzen – lagen die automatisierten Verfahren oft daneben. „Wenn wir sehen, in welchen Fällen etablierte Methoden Fehler machen, hilft uns das, künftige Algorithmen besser zu machen“, resümiert Tatjana Scheffler. Mit ihrem Team entwickelt sie auch selbst automatisierte Verfahren, die schädigende Sprache noch besser erkennen sollen. Dabei fließen auch linguistische Erkenntnisse ein: „Bestimmte grammatische Strukturen können ein Hinweis darauf sein, dass ein Begriff abwertend gemeint ist“, erklärt Scheffler. „Wenn ich sage ‚Du Lauch‘ ist das etwas anderes, als wenn ich nur ‚Lauch‘ sage.“

    Ausführlicher Artikel im Wissenschaftsmagazin Rubin

    Einen ausführlichen Beitrag zum Thema finden Sie im Wissenschaftsmagazin Rubin mit dem Schwerpunkt „Verbrechen“ unter https://news.rub.de/wissenschaft/2022-03-11-linguistik-die-zerstoererische-kraft.... Für redaktionelle Zwecke dürfen die Texte auf der Webseite unter Angabe der Quelle „Rubin – Ruhr-Universität Bochum“ sowie Bilder aus dem Downloadbereich unter Angabe des Copyrights und Beachtung der Nutzungsbedingungen honorarfrei verwendet werden.

    Rubin kann als Newsletter und Printmagazin kostenlos abonniert werden (https://news.rub.de/rubin).


    Contact for scientific information:

    Prof. Dr. Tatjana Scheffler
    Digitale Forensische Linguistik
    Germanistisches Institut
    Ruhr-Universität Bochum
    Tel.: +49 234 32 21471
    E-Mail: tatjana.scheffler@rub.de


    Images

    Hassausdrücke können viele Formen annehmen – im Bereich der Sprache können sie auch ganz subtil sein.
    Hassausdrücke können viele Formen annehmen – im Bereich der Sprache können sie auch ganz subtil sein ...

    Roberto Schirdewahn

    Tatjana Scheffler ist Expertin für Digitale Forensische Linguistik.
    Tatjana Scheffler ist Expertin für Digitale Forensische Linguistik.

    RUB, Marquard


    Criteria of this press release:
    Journalists
    Information technology, Language / literature
    transregional, national
    Research results
    German


     

    Hassausdrücke können viele Formen annehmen – im Bereich der Sprache können sie auch ganz subtil sein.


    For download

    x

    Tatjana Scheffler ist Expertin für Digitale Forensische Linguistik.


    For download

    x

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).