idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Thema Corona

Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Teilen: 
30.06.2022 15:42

Unstatistik des Monats: Falsch positive Chatkontrolle

Sabine Weiler Kommunikation
RWI – Leibniz-Institut für Wirtschaftsforschung

    Seit Mitte Mai werden die Pläne der EU zur anlasslosen Durchsuchung von Mail- und Messenger-Inhalten heiß diskutiert. Die @unstatistik Juni zeigt, dass und warum dabei täglich Millionen Nachrichten fälschlicherweise als unangemessen klassifiziert würden.

    Seit Mitte Mai werden die Pläne der EU zur anlasslosen Durchsuchung von Mail- und Messenger-Inhalten heiß diskutiert. Der Gesetzentwurf wie auch seine Behandlung durch die Medien und die Bundesregierung sind unsere Unstatistik des Monats Juni. Denn schon allein aus statistischen Gründen schlägt die EU mit der angestrebten Chatkontrolle einen Irrweg ein.

    Einerseits wurden die mit dem Gesetz verbundenen Eingriffe in die Privatsphäre der Nutzer und die statistischen Probleme durchaus abgewogen: „Laut EU sollen die Provider Scan-Methoden verwenden, die nach dem Stand der Technik in der Branche den geringsten Eingriff in die Privatsphäre darstellen – auch um Fehlalarme so weit wie möglich [zu] begrenzen“, schreibt der Deutschlandfunk. Andererseits haben mehr als 70 Grundrechtsorganisationen dennoch – und aus statistischer Sicht zu Recht – gegen das Gesetz protestiert und u.a. eine Petition dagegen gestartet. Auch Volker Wissing, Minister für Digitales und Verkehr, will laut FAZ „mit allen Argumenten dagegen vorgehen“. Inzwischen hat die Bundesregierung einen Katalog mit 61 kritischen Fragen an die EU-Kommission geschickt, der auf dem Portal Netzpolitik.org veröffentlicht wurde.

    Die hier interessierende Frage Nr. 7 des Katalogs beschäftigt sich mit der Problematik der möglichen falsch positiven Treffer: „Wie ausgereift sind die modernen Technologien zur Vermeidung falsch positiver Treffer? Welcher Anteil an falsch-positiven Treffern ist zu erwarten, wenn Technologien zum Nachweis von Grooming eingesetzt werden? Hält es die COM [Kommission] zur Verringerung der falsch-positiven Treffer für notwendig, vorzuschreiben, dass Treffer nur dann veröffentlicht werden, wenn die Methode bestimmte Parameter erfüllt (z.B. eine Trefferwahrscheinlichkeit von 99,9 Prozent, dass der betreffende Inhalt angemessen ist)?“

    Diese Frage legt die Vermutung nahe, dass trotz aller Debatten um falsch positive Corona-Tests immer noch sehr wenige politische Entscheidungsträger und Medienvertreter die Brisanz dieses Problems erkannt haben. Denn bei einer schier unvorstellbaren Zahl an täglich verschickten Nachrichten, von denen lediglich ein (glücklicherweise) sehr kleiner Anteil missbräuchliche Inhalte enthält, führt selbst ein exzellenter Algorithmus zu einer sehr großen Zahl an Fehlalarmen.

    Allein auf WhatsApp und allein in Deutschland werden pro Tag rund 3 Milliarden Nachrichten verschickt (siehe Beiträge von Chip.de und Messengerpeople.com). Angenommen, nur 0,0001 Prozent, also insgesamt 3.000 aller dieser Nachrichten, enthalten unangemessene Inhalte. Dann werden 99,9 Prozent davon oder 2.997 Nachrichten entdeckt. Zugleich werden jedoch von den nach wie vor fast 3 Milliarden „unschuldigen“ Nachrichten 0,1 Prozent, also fast 3 Millionen Nachrichten, als unangemessen fehlklassifiziert. Die wären dann mit einem weiteren Algorithmus oder schlimmstenfalls von Menschen erneut zu prüfen. Und das jeden Tag.

    Selbst mit einer viel besseren Methode, die 99,999 Prozent aller Nachrichten korrekt als „angemessen“ oder „unangemessen“ erkennt, kommen auf jede richtigerweise als unangemessen erkannte Nachricht zehn Nachrichten, die vom Algorithmus zu Unrecht als unangemessen deklariert werden.

    Nun könnte man einwenden, dass Algorithmen nicht nur einzelne Nachrichten klassifizieren, sondern ganze Chatverläufe. Das verschiebt aber lediglich das Problem. Denn im Zweifelsfall müssen zwar weniger, aber dafür umso längere Nachrichtenverläufe zusätzlich geprüft werden. Das Risiko, dass ein von einer KI-Anwendung verdächtigter Nutzer zu Unrecht ins Visier gerät, bleibt auf jeden Fall unzumutbar hoch.

    Und das ist es, was die Chatkontrolle für beide Seiten unverhältnismäßig macht. Für den Bürger, der selbst beim Einsatz moderner Technologien mit hoher Wahrscheinlichkeit unschuldig ist, wenn er verdächtigt wird. Und für Behörden, die dann kaum noch etwas anderes zu tun haben, als zu Unrecht Verdächtigte wieder zu entlasten. Wenn Minister Wissing und der Rest der Bundesregierung es ernst meinen damit, alle Argumente auf den Tisch zu bringen, dann sollte dieses Argument auf dem Silbertablett serviert werden.

    ----------
    Ihre Ansprechpartner/in dazu:
    Katharina Schüller (STAT-UP) Tel.: (089) 34077-447
    Sabine Weiler (Kommunikation RWI) Tel.: (0201) 8149-213

    Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“ finden Sie im Internet unter www.unstatistik.de und unter dem Twitter-Account @unstatistik. Unstatistik-Autorin Katharina Schüller ist zudem Mit-Initiatorin der „Data Literacy Charta“, die sich für eine umfassende Vermittlung von Datenkompetenzen einsetzt. Die Charta ist unter www.data-literacy-charta.de abrufbar.

    Bei Weiterverbreitung von Texten aus der Reihe "Unstatistik des Monats" muss klar erkennbar sein, dass es sich um die Übernahme eines fremden Textes handelt. Zudem ist die Quelle https://www.unstatistik.de zu nennen. Bitte informieren Sie die Pressestelle des RWI über die Verwendung des Textes unter presse@rwi-essen.de. Das Urheberrecht bleibt bestehen.


    Wissenschaftliche Ansprechpartner:

    Katharina Schüller (STAT-UP) Tel.: (089) 34077-447


    Originalpublikation:

    https://www.rwi-essen.de/presse/wissenschaftskommunikation/unstatistik/detail/fa...


    Weitere Informationen:

    https://www.unstatistik.de - Hier geht's zur Homepage der "Unstatistik des Monats"


    Merkmale dieser Pressemitteilung:
    Journalisten, Lehrer/Schüler, Studierende, Wirtschaftsvertreter, Wissenschaftler, jedermann
    Gesellschaft, Informationstechnik, Medien- und Kommunikationswissenschaften, Politik, Wirtschaft
    überregional
    Buntes aus der Wissenschaft
    Deutsch


    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).