Matematičarka predviđa pobjedu Hrvatske nad Danskom. No, koliko je sigurna?
MATEMATIČARKA doc. dr. sc. Franka Miriam Brueckler sa zagrebačkog PMF-a već godinama radi na popularizaciji znanosti, a jedna od najdražih tema joj je matematička (ne)predvidivost nogometa. Već je pogodila ishode pojedinih utakmica te uočila fenomene ovog SP-a, a sada predviđa moguć ishod i rezultate utakmice Hrvatska - Danska. Istovremeno tumači kako dolazi do svojih predviđanja.
Evo što kaže.
U četvrtoj utakmici osmine finala susreću se momčadi dviju crven-bijelih nacija – sjećam se kao danas kad sam 2003. na jednoj matematičkoj konferenciji u Norveškoj upoznala nekolicinu Danaca i kad sam na pitanje odakle sam odgovorila da sam iz Hrvatske, dobila sam jednoglasan komentar: "Znamo mi vas, imate iste boje kao i mi u nogometu."
Što nam matematika govori o predstojećem susretu?
Na ovo prvenstvo stigli smo s gotovo jednakim ELO-ratingom (o njemu smo nešto rekli u drugom prigodnom matematičko-nogometnom člančiću). Mi smo tada imali 1853, a Danci 1856 ELO-bodova. Uslijed uspješnih rezultata u grupnoj fazi, oboma su nam ti bodovi narasli tako da u ovu utakmicu mi Hrvati ulazimo s 1956 ELO-bodova (kao 7. na svijetu), a Danci s njih 1890 (kao 15. na svijetu). Dancima je rating manje narastao nego nama zbog samo 1 pobjede i 2 neodlučena rezultata te ukupne gol-razlike "samo" 2:1, dok smo mi imali 3 pobjede i puno impresivniju gol-razliku grupne faze od 7:1. Prevedeno u vjerojatnosti pobjede: Dok bi za isti susret na početku SP-a vjerojatnost pobjede Hrvatske (računata samo temeljem ELO-ratinga) bila "samo" 49,6 %, sad je ona narasla na 59,4 %. Podsjećamo: ELO-model ne odvaja neodlučene ishode tako da ovo možemo uzeti kao vjerojatnost konačne pobjede Hrvatske.
Hrvati su na SP stigli s prosjecima od 1 danog i 0,94 primljenih golova po utakmici (za utakmice odigrane tijekom 2017. i 2018.), dok su Danci na SP stigli s prosjecima (za isto razdoblje) 1,85 danih i 0,62 primljenih golova. I bez daljeg računa vidimo da su ti prosjeci bili još više u korist Danske nego njezin tada neznatno veći ELO-rating, odnosno na način iz prvog članka za susret Hrvatska-Danska na početku SP-a vjerojatnost pobjede Hrvatske ispala bi samo nekih 27 %. No u prethodne 3 utakmice SP-a prosjeci danih golova su se poboljšali za Hrvate i smanjili za Dance (a oboma se smanjio prosjek primljenih golova):
Stoga sad izračun po kombinaciji modela iz prethodna dva članka daje vjerojatnost oko 17 % za pobjedu Danske, 28 % za neodlučeno (podsjećamo, u kladionicama se gleda rezultat na kraju regularnog dijela!) i 55 % za pobjedu Hrvatske. Uzmemo li da onih 28 % vjerojatnosti produžetaka možemo u omjeru ELO-vjerojatnosti pobjede (59,4:40,6) pridružiti pobjedi Hrvatske ili Danske, dobivamo ukupnu vjerojatnost konačne pobjede Hrvatske od čak oko 72 %! Zvuči super, no naravno, čak ni puno veća vjerojatnost nije garancija pobjede.
Ipak, cilj ovih člančića nije davati bolje procjene vjerojatnosti od onih koje lako (i temeljene na puno više podataka i profinjenijim modelima) možete naći na internetu. Želimo radije pokazati više načina kako doći do tih vjerojatnosti, s konačnim ciljem potvrde da je nogomet i matematički gledano najuzbudljiviji sport na svijetu.
Osim već opisanog, možemo u procjene vjerojatnosti uključiti i koliko puta momčadi upućuju udarce prema golu i koliko tih pokušaja rezultira golom. U tom slučaju se koristi nešto što se u matematici zove binomna razdioba i koja se po pitanju predviđanja pojedinačnih rezultata pokazala čak i boljom od Poissonove, koja bolje opisuje ukupne trendove prvenstva, kako vidimo iz grafa na kraju grupne faze (usporedite sa stanjem nakon 32 utakmice kako je opisano u trećem članku ove serije).
Primijetimo da je u 48 utakmica grupne faze palo 122 gola (prosječno 2,54 gola po utakmici, što je unutar uobičajenog – na zadnja četiri prvenstva prosjeci golova u grupnoj fazi kretali su se između 2 i 3, a tako je i inače redovito u profesionalnom nogometu). No vratimo se na konkretnu utakmicu koja nas očekuje.
Jednostavnosti radi, uzet ćemo podatke samo iz utakmica koje su Hrvati odnosno Danci odigrali tijekom ovog SP. Podsjećamo da su ovdje svi decimalni brojevi zaokruženi radi lakšeg praćenja teksta, no time u konačnici minimalno gubimo na preciznosti (nije baš jako bitno je li vjerojatnost nekog rezultata 14,6 % ili 15 %).
Što znači da je uspješnost za Hrvate 15 %? To znači da kad bi Hrvati na gol uputili 100 udaraca (što naravno neće), očekujemo da bi ih najvjerojatnije njih 15 rezultiralo golom. Slično, Danci bi od 100 udaraca najvjerojatnije dali 6 golova.
Sad možemo simulirati našu utakmicu. Zamislite "kockicu" sa 100 strana (takve postoje!). Od tih 100 strana njih prvih 15 predstavljaju gol Hrvatske (brojevi 1 do 15), njih zadnjih 6 (brojevi 95 do 100) golove Danske. Jedno bacanje kockice je jedan udarac prema golu.
Hrvatska je dosad tijekom SP u prosjeku upućivala 16 udaraca po utakmici, a Danska njih 12, pa ćemo kockicu za Hrvatsku baciti 16 puta i kad god padne neki broj od 1 do 15, bilježimo da je Hrvatska dala gol, a za Dansku ćemo kockicu baciti 12 puta i kad padne neki broj između 95 i 100, Danska je dala gol.
Dakle, rezultat jedne utakmice simuliramo kroz 16 + 12 = 28 bacanja kockice sa 100 strana. Vaš (ne)omiljeni matematičar je to napravio za vas (a lako se ista stvar simulira i online) i dobio 1 gol Hrvatske (od prvih 16 bacanja, jednom je pao broj između 1 i 15) i 1 gol Danske (od drugih 12 bacanja jednom je pao broj između 95 i 100). Dakle, jednom simulacijom dobili smo rezultat 1:1.
No sad dolazi najvažnije: jedna simulacija ništa ne govori, tek ponavljanjem možemo uočiti trend. Stoga bacanje kockice treba ponoviti što više puta ("što više puta odigrati utakmicu u istim uvjetima"). Mi smo s 20 pokušaja dobili sljedeće rezultate: 1:1, 2:0, 2:0, 2:1, 1:0, 3:0, 3:0, 2:0, 3:1, 2:0, 0:1, 2:2, 2:2, 4:2, 2:0, 3:1, 1:0, 5:0, 0:1, 0:0. Dakle, u 14 od 20 "utakmica" pobijedila je Hrvatska pa smo s 20 simulacija dobili procjenu vjerojatnosti pobjede Hrvatske od 70 %. U tih 20 utakmica Hrvatska je dala 40 golova (2 gola po utakmici – usporedite sa stvarnim prosjekom Hrvatske), a Danska 11 golova (1,1 gol po utakmici), odnosno temeljem situacije očekujemo rezultat 2:1 za Hrvatsku (iako je samo jedna od simuliranih utakmica tako završila). Alternativno, mogli bismo kao najvjerojatniji uzeti najčešći rezultat (u našoj simulaciji to je bio 2:0 za Hrvatsku). Za usporedbu, druge stranice koje sličnim simulacijama predviđaju rezultat kao najvjerojatnije (opet s vjerojatnostima bliskim 10 %) dobivaju 1:1 i 2:1.
Odgovarajući teorijski izračuni pomoću ovog modela dali bi još i veću ukupnu vjerojatnost pobjede Hrvatske: 76 %. Teorijska vjerojatnost rezultata 2:1 je 10 %, a rezultata 2:0 je 14 %. Kao i što smo simulacijom dobili manji udio rezultata 2:1 od teorijskog, rezultat 2:0 bio je češći nego to teorija predviđa, no to je normalno za svaki stvarno slučajni pokus. Inače, i rezultati 1:0 i 3:0 s ovim modelom daju dosta visoke teorijske vjerojatnosti (po 11 %).
Usporedimo sad sve što imamo, uključivo i trenutnog sveukupnog prosjeka grupne faze.
Vidimo da smo ovako i na treći način potvrdili vrlo visoku vjerojatnosti pobjede Hrvatske (ELO-model 59 %, Poissonov model temeljen na prosjecima primljenih i danih golova 72 %, binomni model temeljen na prosjecima brojeva udaraca prema golu i golova 70 % simulacijom, 76 % teorijski). No još jednom ističemo: To je još jako daleko od sigurnosti, pogotovu uzevši u obzir ne baš zanemarivu vjerojatnost produžetaka!
bi Vas mogao zanimati
Izdvojeno
Pročitajte još
bi Vas mogao zanimati