Kas laimės Pasaulio futbolo čempionatą? Mokslininkai pateikė savo atsakymą

Vakar Rusijoje prasidėjęs 2018 metų pasaulio futbolo čempionatas tikriausiai bus vienas iš žiūrimiausių sporto įvykių, populiarumu lenkiantis netgi olimpiadą. Tad galimi futbolo čempionato laimėtojai tikrai kelia nemenką susidomėjimą.
Maskva pasitinka pasaulio futbolo čempionatą
Maskva pasitinka pasaulio futbolo čempionatą / „Scanpix“ nuotr.

Tikėtinus rezultatus galima įvertinti žvelgiant į lažybų tarpininkų siūlomus koeficientus. Šiose kompanijose statistikos profesionalūs tikėtinas rungtynių baigtis įvertina analizuodami dideles duomenų bazes. Taip lažybininkai gali pateikti visų šias kelias savaites vyksiančių rungtynių tikėtinus laimėtojus.

Dar geriau vertinti jungiant daugelio lažybų bendrovių tikimybes. O tokiu bendru vertinimu aiškūs šio čempionato favoritai yra Brazilija (laimėjimo tikimybė 16,6 proc.), Vokietija (12,8 proc.) ir Ispanija (12,5 proc.).

Bet pastaraisiais metais tyrėjai sukūrė ir mašininio mokymosi technikas, kurios potencialiai gali nurungti įprastą statistinį vertinimą. Ir kokiai gi komandai šios naujos technikos prognozuoja 2018 m. Pasaulio taurę?

Atsakymas pateikiamas Andreaso Grollo iš Dortmundo Technikos universiteto ir dar kelių kolegų darbe. Kad nustatytų kitą labiausiai tikėtiną laimėtoją, jie sujungė mašininį mokymąsi ir įprastinę statistiką vadinamuoju random forest (angl. – atsitiktinio miško) metodu.

Kuo giliau į mišką, tuo daugiau medžių

Iš pradžių šiek tiek pasiaiškinkime. Atsitiktinio miško metodas pastaraisiais metais tapo galingu didelių duomenų analizavimo būdu, neturinčių kai kurių kitiems duomenų apdorojimo metodams būdingų spragų. Esminė jo mintis – būsimi įvykiai gali būti numatyti sprendimų medžiu, kurio rezultatas skaičiuojamas, kiekvienoje šakoje panaudojant treniravimo duomenis.

Tačiau sprendimų medžiams būdinga gerai žinoma problema. Vėlesnėse šakojimosi proceso stadijose sprendimus gali smarkiai iškreipti treniravimo duomenys, kurių nedaug ir kurie gali smarkiai varijuoti – tai yra pertaikymo (overfitting) problema.

Atsitiktinio miško būdas – kitoks. Užuot skaičiavęs kiekvienos šakos rezultatą, šis procesas skaičiuoja atsitiktinai pasirinktų šakų rezultatus. Ir daro tai daug kartų, kiekvieną kartą su skirtingu atsitiktinai pasirinktomis šakomis. Galutinis rezultatas yra visų šių atsitiktinai sukurtų sprendimų medžių vidurkis.

Toks būdas turi svarbių pranašumų. Pirmiausia, jam nekyla pertaikymo problema, kamuojanti įprastus sprendimų medžius. Be to, jis atskleidžia, kurie veiksniai svarbiausi rezultatui.

Taigi, jei konkrečiame sprendimų medyje galioja daugybė parametrų, lengva pastebėti, kurie daro didžiausią įtaką, o kurie nėra labai svarbūs. Ateityje į tokius mažiau svarbius parametrus galima neatsižvelgti.

Modeliavo 100 000 kartų

A.Grollas su kolegomis, modeliuodami 2018 metų Pasaulio taurę, naudojo būtent šį metodą. Jie modeliavo visų tikėtinų komandų kiekvieno susitikimo baigtį ir rezultatus panaudojo konstruodami labiausiai tikėtiną turnyro eigą.

Jie pradėjo nuo plataus potencialių veiksnių spektro. Tai tokie ekonominiai rodikliai, kaip šalies BVP ir gyventojų skaičius, šalies komandų FIFA reitingas, ir pačių komandų savybės, – vidutinis amžius, turimų Čempionų Lygos žaidėjų skaičius, ar turi namų pranašumą, ir taip toliau.

Įdomu, kad naudodami atsitiktinio miško būdą, A.Grollas su kolegomis galėjo įtraukti ir kitus vertinimus, pavyzdžiui, naudojamus lažybų tarpininkų.

Sudėjus viską į bendrą modelį, galima gauti įdomias įžvalgas. Pavyzdžiui, svarbiausi veiksniai pasirodo esantys kitais metodais – lažybų bendrovių, FIFA, kt. – sukurti komandų vertinimai.

Kiti svarbūs veiksniai – BVP ir Čempionų Lygos žaidėjų skaičius komandoje. Nesvarbūs veiksniai – šalies gyventojų skaičius, trenerio tautybė, ir taip toliau.

Šiuo procesu gautos prognozės skiriasi nuo kitų. Atsitiktinio miško metodu labiausiai tikėtinas laimėtojas yra Ispanija, su 17,8 procentų tikimybe.

Tačiau šiose prognozėse svarbus veiksnys yra ir paties turnyro struktūra. Jei Vokietija grupėje išvengs konkurencijos, labiau tikėtina, kad ji susidurs su stipresne konkurencija 16 komandų atkrentamosiose varžybose. Todėl atsitiktinio miško metodas Vokietijos patekimo į ketvirtfinalį šansus vertina 58 procentais. Tuo tarpu Ispanija vargu ar sutiks rimtą pasipriešinimą aštuntfinalyje, tad jos galimybės pasiekti ketvirtfinalį yra 73 procentai.

Jei abi komandos pasieks ketvirtfinalį, laimėjimo tikimybės daugmaž vienodos. „Ispanijos šansai kiek didesni, nes Vokietijos šansai iškristi aštuntfinalyje yra santykinai dideli“, – sako A.Grollas su kolegomis.

Bet yra dar viena įdomybė. Naudojant atsitiktinio miško metodą, galima modeliuoti visą turnyrą ir gauti skirtingus rezultatus.

A.Grollas su kolegomis visą turnyrą modeliavo 100 000 kartų. „Kaip rodo labiausiai tikėtina turnyro eiga, Pasaulio taurę turėtų laimėti vokiečiai, o ne ispanai“, – teigia jie.

Žinoma, dėl daugybės žaidimo kintamųjų, tokia eiga tebėra itin menkai tikėtina. A.Grollas su kolegomis vertina juos kaip 1 iš 100 000.

Taigi, turnyrui prasidedant, A.Grollas su kolegomis didžiausius laimėjimo šansus teikia Ispanijos komandai. Bet jei pateks į ketvirtfinalį, tikimybine lydere taps Vokietijos vienuolikė.

Turnyras prasidėjo ketvirtadienį, Rusijos ir Saudo Arabijos rungtynėmis, kurias šeimininkai laimėjo triuškinančiu rezultatu 5:0. Deja, šių komandų tikimybės pakliūti į ketvirtfinalį labai jau menkos.

Su visa modeliavimo ataskaita galima susipažinti čia.

Pranešti klaidą

Sėkmingai išsiųsta

Dėkojame už praneštą klaidą
Reklama
Pasisemti ilgaamžiškumo – į SPA VILNIUS
Akiratyje – žiniasklaida: ką veiks žurnalistai, kai tekstus rašys „Chat GPT“?
Reklama
Išmanesnis apšvietimas namuose su JUNG DALI-2
Reklama
„Assorti“ asortimento vadovė G.Azguridienė: ieškantiems, kuo nustebinti Kalėdoms, turime ir dovanų, ir idėjų