idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
12/20/2016 19:12

Unstatistik des Monats: Big Data knackt Ihre Psyche

Sabine Weiler Kommunikation
RWI – Leibniz-Institut für Wirtschaftsforschung

    "Zeige mir deine ‚Facebook-Likes’ und ich sage dir, wer du bist.“ Wie ein Lauffeuer verbreitete sich im Dezember die Botschaft, dass ein derartiger Facebook-Algorithmus Donald Trump zum Wahlsieg verholfen haben soll. Viele renommierte Medien stellen diese Behauptung in Frage, denn bewiesen hat der auslösende Artikel im Schweizer „Das Magazin“ den Zusammenhang keinesfalls.

    „Zeige mir deine ‚Facebook-Likes’ und ich sage dir, wer du bist.“ Wie ein Lauffeuer verbreitete sich im Dezember die Botschaft, dass ein derartiger Facebook-Algorithmus Donald Trump zum Wahlsieg verholfen haben soll. Viele renommierte Medien stellen diese Behauptung in Frage, denn bewiesen hat der auslösende Artikel im Schweizer „Das Magazin“ (https://www.dasmagazin.ch/2016/12/03/ich-habe-nur-gezeigt-dass-es-die-bombe-gibt...) den Zusammenhang keinesfalls. Doch warum wird nicht auch der Algorithmus selbst hinterfragt? Grund dazu gibt es, schließlich behauptet dessen Entwickler, dass er aufgrund von „Gefällt-mir“-Angaben, psychometrischer Tests und dem Facebook- Profil einer Person genaue Aussagen über ihre Persönlichkeit treffen könne. So könne, wie der Artikel im Magazin behauptet, mit einer Genauigkeit von 88% vorhergesagt werden, was für eine sexuelle Orientierung ein Mann hat. „Facebook knackt Ihre Psyche“ (http://www.chip.de/news/Gratis-Tool-kennt-Sie-besser-als-Ihre-Mutter-Wissenschaf...) verriet uns denn auch chip.de.

    Dabei ist diese Zahl gar nicht die Genauigkeit der Prognose. Tatsächlich bedeutet das Ergebnis: Nimmt man je eine Person pro Gruppe, also einen homosexuellen und einen heterosexuellen Mann, so kann man diese mit einer Wahrscheinlichkeit von 88% ihren richtigen Gruppen zuordnen. Die Prozentzahl bemisst die so genannte „Area under the Curve“ und bezieht sich auf den Vergleich zwischen den Gruppen, nicht auf die Prognosegüte an sich.

    Doch auch eine echte Wahrscheinlichkeitsaussage wäre mit Vorsicht zu genießen. Es reicht für unsere Zwecke aus, von einer groben Schätzung von rund 10% Homosexuellen in der Gesamtbevölkerung auszugehen. In einer Gruppe von 10.000 Personen wären dann 9.000 hetero- und 1.000 homosexuell. Wer alle Menschen als heterosexuell klassifizierte, überträfe den Algorithmus schon um 2 Prozentpunkte, läge aber bei den Homosexuellen sicher falsch. Ein etwas komplexerer Algorithmus, der in beiden Gruppen eine Korrektheit von 88% besäße, würde in der ersten Gruppe 7.920 Personen als hetero- und 1.080 fälschlicherweise als homosexuell einschätzen. In der zweiten Gruppe werden 880 Personen korrekt eingeschätzt, 120 falsch. Aufaddiert wird also für 1.960 Personen die Aussage getroffen, dass sie homosexuell sind. Davon sind aber tatsächlich nur 880 homosexuell, was zu einer Treffsicherheit von nur etwa 45% führt. Das ist eine ziemlich enttäuschende Leistung, die sich unmittelbar aus dem Satz von Bayes ergibt.

    Algorithmus formalisiert Alltags-Klischees und liegt oft daneben

    Bei Frauen, so wird berichtet, könne man die sexuelle Orientierung nur mit 75% Sicherheit vorhersagen. Mit der gleichen Analyse wie oben ergibt sich daraus, dass nur 25% von allen als homosexuell diagnostizierten Frauen tatsächlich homosexuell sind. Die meisten sind Fehldiagnosen.

    Also, wenn Sie wissen, ob sie homosexuell sind, dann sagt Ihnen der Algorithmus nichts Neues. Wenn Sie sich nicht sicher sind und Sie die Diagnose „homosexuell“ erhalten, dann ist die Diagnose wahrscheinlich ein Irrtum. Wie wir schon zuvor bei der Vorhersage von Pankreaskrebs durch die Microsoft-Suchmaschine Bing berichteten: Viel Lärm um Big Data.

    Selbst wenn alle Daten korrekt wären, ist der Algorithmus kaum mehr als eine Formalisierung von Alltags-Klischees. Wenn ein Mann freimütig erzählt, dass er sich brennend für Make-Up und Mode interessiert, müssen wir uns selbstkritisch fragen, wie gefeit wir vor unwillkürlichen Einschätzungen sind. So folgert auch der Algorithmus: Männer, die die Kosmetikmarke MAC mögen, sind mit höherer Wahrscheinlichkeit homosexuell. Eher sollten wir uns also darüber Sorgen machen, wie sehr Facebooks Algorithmus die in unseren Köpfen verankerten Vorurteile bestärkt.

    ----------

    Ansprechpartnerin:
    Katharina Schüller (STAT-UP), Tel.: (089) 34077-447

    Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. In diesem Monat hat die Gastautorin Katharina Schüller, Geschäftsleiterin und Gründerin von STAT-UP, die „Unstatistik“ verfasst.


    More information:

    http://www.unstatistik.de - Weitere Unstatistiken, Informationen, Kontakte & Archiv


    Images

    Attachment
    attachment icon Pressemitteilung (pdf)

    Criteria of this press release:
    Business and commerce, Journalists, Scientists and scholars, Students, Teachers and pupils, all interested persons
    Economics / business administration, Politics, Social studies
    transregional, national
    Miscellaneous scientific news/publications
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).