Intuitiv finden Menschen auch in komplexen, ihnen völlig unbekannten Situationen gute Lösungen. Dabei lernen sie schnell und kommen mit einer fast unendlichen Anzahl an Handlungsmöglichkeiten zurecht. Wie sie das schaffen, hat nun ein Forscherteam am Max-Planck-Institut für Bildungsforschung anhand eines Spielexperiments untersucht und erstaunliche Parallelen zu intelligenten maschinellen Algorithmen aufgezeigt. Die Ergebnisse der Studie sind im Journal Nature Human Behaviour erschienen.
Welchen Beruf soll ich ergreifen? In welche Altersvorsorge soll ich investieren? Welchen Schachzug mache ich als nächstes? Unsere Entscheidungsmöglichkeiten sind groß und welche Option für uns am besten wäre, könnten wir nur herausfinden, wenn wir alle Möglichkeiten ausprobieren würden. Da dies jedoch unmöglich ist, müssen wir entweder auf altbewährte Optionen setzten oder Risiken eingehen und unbekannte Optionen ausprobieren. Intuitiv balancieren wir dabei alle unsere Entscheidungen zwischen diesen Polen und finden so gute Lösungen. Diese Zwickmühle zwischen der Erkundung von Neuem und der Verwertung von Bekanntem wird auch „exploration-exploitation-dilemma“ genannt und beschäftigt nicht nur Psycholog*innen. Auch Informatiker*innen müssen bei der Programmierung von Lernalgorithmen dafür sorgen, dass der Computer einerseits auf bereits bekanntes Wissen zurückgreift, andererseits aber auch unbekannte Optionen auslotet. Zum Beispiel bei angepassten Empfehlungen in Onlineshops.
Doch wie genau schaffen es Menschen, mit den wenigen bekannten und den unendlich vielen unbekannten Optionen umzugehen? Und kann maschinelles Lernen da mithalten? Um dies systematisch zu erforschen, hat ein Team aus Forschern vom Max-Planck-Institut für Bildungsforschung, von der Harvard University, dem University College London und der University of Surrey eine Reihe von experimentellen Entscheidungsspielen entwickelt, die sowohl von 241 Menschen, als auch vom Computer mit verschiedenen Modellen und Algorithmen gespielt wurden.
Die menschlichen und virtuellen Spieler mussten bei dem Onlinespiel auf einem Raster Felder anklicken, hinter denen sich jeweils unterschiedlich hohe Punktzahlen verbargen. Da die Anzahl der möglichen Klicks erheblich geringer war als die Anzahl der Felder, konnte nur eine begrenzte Zahl von Optionen ausprobiert werden. Zu Beginn wussten weder Mensch noch Computer, ob und wie sich die Punktzahlen von benachbarten Feldern ähnelten. Erst mit der Zeit haben sie die räumlichen Muster hinter den verdeckten Feldern erlernt und anhand dieses Wissens eine Strategie entwickelt, die aus dem Anklicken benachbarter Felder, der „exploitation“, und dem risikoreicheren Anklicken weit entfernter Felder, der „exploration“, bestand.
„Menschen müssen nicht die Auswirkungen jeder Option kennen, um gute Entscheidungen zu treffen. Sie sind in der Lage zu generalisieren und anhand der wenigen, bekannten Optionen auch die unbekannten Optionen vorherzusagen“, sagt Charley Wu, Erstautor und Doktorand am Max-Planck-Institut für Bildungsforschung, und ergänzt: „Gleichzeitig stellen wir fest, dass Menschen dabei recht optimistisch und neugierig sind und auch die unbekannten Optionen wählen.“
Auch die verschiedenen Lernalgorithmen waren mal mehr, mal weniger erfolgreich bei dem Entscheidungsspiel. Bei dem direkten Vergleich von menschlichem Verhalten und den verschiedenen Algorithmen stellten die Forscher fest, dass wenn sie zwei bekannte Algorithmen miteinander kombinieren, sie menschliches Verhalten erstaunlich gut vorhersagen konnten. Der erste Algorithmus hat durch Generalisierung die räumliche Struktur der Punkte vorhergesagt, der zweite Algorithmus simulierte „Neugier“ und tendierte dazu, unbekannte Felder auszuprobieren.
„Die Ergebnisse unserer Studie zeigen, wie Methoden aus dem Bereich des maschinellen Lernens helfen, menschliches Entscheidungsverhalten besser zu verstehen. Umgekehrt können psychologische Studien helfen, Algorithmen aus der Informatik zu verbessern – denn in den meisten Bereichen ist die menschliche Intelligenz der maschinellen noch weit überlegen", sagt Björn Meder, Assoziierter Wissenschaftler am Max-Planck-Institut für Bildungsforschung.
---
Das Max-Planck-Institut für Bildungsforschung wurde 1963 in Berlin gegründet und ist als interdisziplinäre Forschungseinrichtung dem Studium der menschlichen Entwicklung und Bildung gewidmet. Das Institut gehört zur Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V., einer der führenden Organisationen für Grundlagenforschung in Europa.
Wu, C. M., Schulz, E., Speekenbrink, M., Nelson, J.D., & Meder, B. (2018). Generalization guides human exploration in vast decision spaces. Nature Human Behaviour. doi.org/10.1038/s41562-018-0467-4
https://www.mpib-berlin.mpg.de/de/presse/2018/11/wie-mensch-und-maschine-mit-kom...
Merkmale dieser Pressemitteilung:
Journalisten
Informationstechnik, Psychologie
überregional
Forschungsergebnisse
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).