Wenn ab morgen, 7. Juni, die besten Frauen-Fußballmannschaften der Welt in Frankreich aufeinandertreffen, geht Titelverteidiger USA statistisch als klarer Favorit ins Rennen. Das hat ein internationales Forscher-Team –bestehend aus Andreas Groll (TU Dortmund), Gunther Schauberger (TU München), Christophe Ley und Hans Van Eetvelde (beide Universität Gent) und Achim Zeileis (Universität Innsbruck) – mit Hilfe von maschinellem Lernen herausgefunden.
Der Algorithmus der Forscherinnen und Forscher kombiniert dabei selbstständig mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Durchschnittsalter oder Anzahl der Champions-League-Spielerinnen) sowie sozio-ökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt). Mit dem Verfahren haben die Forscher bereits bei der Fußball-WM der Männer 2018 die Prognosegüte der Wettanbieter übertroffen.
Das Modell ist dabei ein sogenannter „Random Forest“, der den Einfluss vieler Variablen automatisch kombiniert, indem er eine Vielzahl von Entscheidungsbäumen auf Basis zufällig leicht variierter Datensätzen generiert; daher stammt auch der Name „Zufallswald“. Die letztendliche Prognose erfolgt dann durch einen Mehrheitsentscheid der einzelnen Bäume des Random Forests und liefert für jedes mögliche Spiel im Turnier eine Wahrscheinlichkeit für Sieg, Unentschieden oder Niederlage. Die Datengrundlage dafür sind drei Informationsquellen:
• Ein statistisches Modell für die Spielstärke jedes Teams auf Basis von 3418 Länderspielen von 167 Nationalmannschaften der vergangenen acht Jahre.
• Ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 18 internationalen Buchmachern.
• Weitere Informationen über die Teams – etwa Durchschnittsalter, oder ihre Herkunftsländer – etwa Bevölkerung.
Mit den vorhergesagten Wahrscheinlichkeiten aus diesem Modell wurde die gesamte WM 100.000 mal durchsimuliert – Spiel für Spiel, der Turnierauslosung und allen FIFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den WM-Sieg. Die USA sind der Topfavorit mit einer Wahrscheinlichkeit von 28,1%, gefolgt von Gastgeber Frankreich mit 14,3%, England mit 13,3% und Deutschland mit 12,9%.
JProf. Andreas Groll
Fakultät für Statistik
Tel.: 0231-755 4229
E-Mail: groll@statistik.tu-dortmund.de
Die statistische Prognose mit interaktiven Grafiken gibt es hier:
http://bit.ly/fifa-women-2019
Merkmale dieser Pressemitteilung:
Journalisten, jedermann
Mathematik
überregional
Buntes aus der Wissenschaft, Forschungsergebnisse
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).