Wenn ab morgen, 7. Juni, die besten Frauen-Fußballmannschaften der Welt in Frankreich aufeinandertreffen, geht Titelverteidiger USA statistisch als klarer Favorit ins Rennen. Das hat ein internationales Forscher-Team –bestehend aus Andreas Groll (TU Dortmund), Gunther Schauberger (TU München), Christophe Ley und Hans Van Eetvelde (beide Universität Gent) und Achim Zeileis (Universität Innsbruck) – mit Hilfe von maschinellem Lernen herausgefunden.
Der Algorithmus der Forscherinnen und Forscher kombiniert dabei selbstständig mehrere statistische Modelle für die Spielstärken der Teams mit Informationen über die Team-Struktur (etwa Durchschnittsalter oder Anzahl der Champions-League-Spielerinnen) sowie sozio-ökonomische Faktoren des Herkunftslandes (Bevölkerung und Bruttoinlandsprodukt). Mit dem Verfahren haben die Forscher bereits bei der Fußball-WM der Männer 2018 die Prognosegüte der Wettanbieter übertroffen.
Das Modell ist dabei ein sogenannter „Random Forest“, der den Einfluss vieler Variablen automatisch kombiniert, indem er eine Vielzahl von Entscheidungsbäumen auf Basis zufällig leicht variierter Datensätzen generiert; daher stammt auch der Name „Zufallswald“. Die letztendliche Prognose erfolgt dann durch einen Mehrheitsentscheid der einzelnen Bäume des Random Forests und liefert für jedes mögliche Spiel im Turnier eine Wahrscheinlichkeit für Sieg, Unentschieden oder Niederlage. Die Datengrundlage dafür sind drei Informationsquellen:
• Ein statistisches Modell für die Spielstärke jedes Teams auf Basis von 3418 Länderspielen von 167 Nationalmannschaften der vergangenen acht Jahre.
• Ein weiteres statistisches Modell für die Spielstärke der Teams auf Basis der Wettquoten von 18 internationalen Buchmachern.
• Weitere Informationen über die Teams – etwa Durchschnittsalter, oder ihre Herkunftsländer – etwa Bevölkerung.
Mit den vorhergesagten Wahrscheinlichkeiten aus diesem Modell wurde die gesamte WM 100.000 mal durchsimuliert – Spiel für Spiel, der Turnierauslosung und allen FIFA-Regeln folgend. Damit ergeben sich Wahrscheinlichkeiten für das Weiterkommen aller Teams in die einzelnen Turnierrunden und letztendlich für den WM-Sieg. Die USA sind der Topfavorit mit einer Wahrscheinlichkeit von 28,1%, gefolgt von Gastgeber Frankreich mit 14,3%, England mit 13,3% und Deutschland mit 12,9%.
JProf. Andreas Groll
Fakultät für Statistik
Tel.: 0231-755 4229
E-Mail: groll@statistik.tu-dortmund.de
Die statistische Prognose mit interaktiven Grafiken gibt es hier:
http://bit.ly/fifa-women-2019
Criteria of this press release:
Journalists, all interested persons
Mathematics
transregional, national
Miscellaneous scientific news/publications, Research results
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).