Förutspådde VM med maskininlärning – så rätt har datorn haft hittills

2018-07-02 16:02  

Tyskland skulle återigen vinna fotbolls-VM – det förutsågs med maskininlärning. Men det stod tidigt klart att datorn inte var någon vidare siare.

Var fjärde år går världens största idrottsevenemang, världsmästerskapen i fotboll för herrar, av stapeln. Turneringen väntas i år locka åtskilliga miljarder tittare världen över och hittills har det bjudits oförutsedda händelser.

Sedan 2010 har traditionen med siande djur slagit rot då bläckfisken Paul blev världsberömd.

Blötdjuret lyckades med framgång förutspå utgången i åtta matcher – något som vid slumpvis dragning skulle ha en sannolikhet på 0,4 procent. Om Paul hade varit i livet hade det varit intressant att se om succén fortsatt och han hade kunnat förutse att regerande mästarna skulle hamna sist i sin grupp.

Efter Paul har mängder med synska djur lanserats. Kamelen Shaheen, grisen Chrjak, orangutangen Walter och pingvinerna Alf, Lolly samt Ginny för att nämna några. Med varierande framgång bör nämnas. I år slog Ryssland på stora trumman och lyfte fram den döva katten Achilles för att förutspå matchutgångar.

Men det finns även mer vetenskapliga försök.

Andreas Groll vid tekniska universitetet i Dortmund har använt sig av maskininlärning kombinerat med konventionell statistik i en metod kallad random forest. Och genom denna identifiera den mest sannolika vinnaren av vm.

Fördelen med random forest-metoden är att den kan hantera icke-linjära samband, kategoriska värden samt att den reducerar variansen jämfört med beslutsträd.

Grolls team började med att ta in alla möjliga potentiella faktorer som kan påverka. Dessa innehöll allt från ett lands BNP och populationsmängd till Fifas ranking samt hur många Champions League-spelare varje lag innehåller. Därutöver inkluderades även andra typer av faktorer såsom exempelvis hur olika spelbolag rangordnar lag.

Efter att ha petat in allt i sin modell framgick det tydligt att vissa faktorer påverkar mycket (ranking, spelarkvalitet mm) och andra obetydligt (nationalitet på tränare och dylikt).

När allt kördes utan filter framgick det att Spanien, med 17,8 procent, troligtvis skulle vinna vm, detta följt av Tyskland (17,1 procent) och Brasilien (12,3 procent).

Men, det var utan att ta strukturen av turneringen med i beaktande. Forskarna simulerade turneringen 100 000 gånger och när det var gjort framgick det istället att Die mannschaft skulle sluta i topp. För svensk del skulle vm-äventyret ta slut i åttondelen mot Brasilien.

Enligt det mest sannolika turneringsutfallet skulle det inte bli Spanien – utan Tyskland som vinner VM, skriver Groll i studien.

Men även om det forskarna kom fram till var det mest sannolika utfallet – var det lång ifrån en stabil prediktion. Groll menade att på grund av hur svårberäknat fotboll är, så är det endast 1 på 100 000 att deras prognos uppfylls.

Och med facit i hand visade det sig att vi inte behöver oroa oss för att datorer ska göra analytiker arbetslösa, i alla fall inte när det gäller förutsägelser av världsmästerskap i fotboll. Tyskland och Spanien är ute. Maskininlärning är ännu så länge inte bättre än vare sig pingviner eller grisar på det här med matchförutsägelser.

Felix Björklund

Kommentarer

Välkommen att säga din mening på Ny Teknik.

Principen för våra regler är enkel: visa respekt för de personer vi skriver om och andra läsare som kommenterar artiklarna. Alla kommentarer modereras efter publiceringen av Ny Teknik eller av oss anlitad personal.

Här är reglerna för kommentarerna på NyTeknik

  Kommentarer

Aktuellt inom

Debatt