MATEMATIČARKA doc. dr. sc. Franka Miriam Brueckler sa zagrebačkog PMF-a već godinama radi na popularizaciji znanosti, a jedna od najdražih tema joj je matematička (ne)predvidivost nogometa.
U prošlom tekstu za Index točno je predvidjela pobjedu Hrvatske protiv Nigerije s vjerojatnošću od 68 %. Također je pogodila većinu ishoda drugih odigranih utakmica. Od njih 14 za dvije je predvidjela čak i točan broj golova.
U novom, nešto drugačijem izračunu, sada predviđa moguć ishod i rezultate utakmice Hrvatska - Argentina. Istovremeno tumači kako dolazi do svojih predviđanja.
Evo što kaže.
Pred utakmicu Hrvatske s Nigerijom pisali smo kako se iz poznatih prethodnih rezultata (danih i primljenih golova u određenom razdoblju) može procijeniti vjerojatnost određenog rezultata. Što u takvom računu posebno pada u oči je potpuno zanemarivanje razlike u klasama momčadi. Ta naravno da nije svejedno kakve su momčadi koje se susreću u svjetskim razmjerima.
Prvo što pada na pamet je u obzir uzeti službenu FIFA-inu rang ljestvicu. No ako se malo bolje zabavimo postupkom izračunavanja bodova u toj najpoznatijoj ljestvici, lako uočimo jednu manu: pobjeda nad, primjerice, Andorom vrijedi jednako kao i pobjeda nad, primjerice, Njemačkom. Štoviše, pobjeda 2:1 vrijedi jednako kao 5:0. Postoji li nešto bolje?
Postoji, i zove se ELO-lista. Ona uzima u obzir i relativne snage protivnika i točne rezultate. ELO-sistem rangiranja izvorno je osmislio američki fizičar i statističar mađarskog porijekla Arpad Elo, u svrhu rangiranja šahista, ali se kasnije prilagodio i za mnoge druge sportove, tako i nogomet. Lista se ažurira nakon svake utakmice. U obzir se uzimaju kako rezultati tako i vrsta natjecanja (pobjeda na utakmici na Svjetskom prvenstvu više znači nego na Europskom, a ta znači više nego u kvalifikacijama itd.).
Ako znate trenutne ELO-bodove momčadi koje se susreću, iz njih se lako računa vjerojatnost pobjede za svaku od momčadi. U pozadini sljedeće formule je tzv. logistička krivulja čije su primjene u znanosti vrlo široke. Vjerojatnost pobjede za momčad (za svjetska i slična prvenstva u kojima nije bitna uloga domaćin/gost) koja trenutno ima E1 bodova na ELO-listi i igra protiv momčadi s E2 bodova se procjenjuje kao recipročna vrijednost broja 1 + 10^((E2-E1)/400). Pritom je s ^ označeno potenciranje, a recipročna vrijednost broja je 1 podijeljen s tim brojem.
Konkretno, Argentina trenutno na ELO-listi ima 1969 bodova, a Hrvatska 1877. Stoga je vjerojatnost pobjede za Argentinu recipročna vrijednost od 1,5888, odnosno 62,94 %. Za Hrvatsku je pak vjerojatnost pobjede 37,06 %.
Lako vidimo jednu prednost i jednu manu ovakvog predviđanja. Prednost je da se koriste lako i javno dostupni podaci koji objektivno reprezentiraju snage momčadi koje igraju utakmicu. Mana je što nemamo mogućnost procjene vjerojatnosti pojedinih rezultata, štoviše, s obzirom na to da ELO-rangiranje tretira neodlučene kao ''pola pobjeda'', ne znamo koji udio od upravo izračunatih vjerojatnosti uzeti kao vjerojatnost prave pobjede, a koji kao neodlučeno. Primjerice, vjerojatnost 62,94 % za pobjedu Argentine znači da je 62,94 % zbroj vjerojatnosti da Argentina pobijedi Hrvatsku i da igraju neodlučeno. Isto tako je 37,06 % zbroj vjerojatnosti da Hrvatska pobijedi i da igra neodlučeno.
No omjer tih vjerojatnosti je otprilike 1,7, odnosno otprilike 1,7 puta je vjerojatnije da će Argentina pobijediti.
Ako bismo temeljem brojeva neodlučenih ishoda u utakmicama grupne faze u prethodnim prvenstvima procijenili da je vjerojatnost da nasumice odabrana utakmica u grupnoj fazi završi neodlučeno jednaka 27 % (zaokruženi prosjek za podatke iz gornje tablice), mogli bismo uzeti da toliki udio izračunatih postotaka pobjede za Argentinu i Hrvatsku otpada na neodlučeno te bi preostala vjerojatnost pobjede Argentine 45,94 % (73 % od 62,94 %) odnosno Hrvatske 27,05 % (73 % od 37,06 %).
Još bolje bi bilo uzeti u obzir prosjeke neodlučenih utakmica zasebno. Iz ELO-tablice vidljivo je da je od 1005 utakmica u svojoj povijesti Argentina 250 puta igrala neodlučeno (24,88 %), a Hrvatska od 300 njih 80 (26,67 %). Stoga bismo na koncu mogli procijeniti da je vjerojatnost pobjede Argentine (100 % - 24,88 %) puta 62,94 %, odnosno 47,28 %, vjerojatnost pobjede Hrvatske Argentine (100 % - 26,67 %) puta 37,06 %, odnosno 27,17 %, a preostalih 25,55 % je vjerojatnost neodlučenog. Sve navedeno sažimamo u tablici:
Pogledate li ponude kladionica vidjet ćete - naši brojevi su vrlo slični ponuđenim koeficijentima.
Inače, na dvjema web-stranicama koje opisuju matematičke modele za računanje vjerojatnosti koji kombiniraju metode iz prošlog i ovog članka i još neke, našli smo sljedeća predviđanja najvjerojatnijeg rezultata: