Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid

Koduväljaku mõju Premier League's hooajal 2013/2014

Siim Viigand, Grete Ojala

Sissejuhatus

Kõik jalgpallurid ja jalgpallisõbrad teavad hästi, et oma koduväljakul mängida on alati lihtsam. Koduseinad ja kaasaelavad fännid annavad emotsionaalselt palju juurde ning seetõttu sujub mäng koduväljakul paremini. Tavaliselt räägitakse koduväljaku puhul psühholoogilisest mõjust, tänu millele mängijad paremini esinevad, aga faktid jäävad näitamata. Tehtud on ka mitmeid uuringuid, et koduväljaku eelist paremini mõista, aga meile pole jäänud arusaadavat vastust, kas koduvälja mõjutab ka oluliselt mängude tulemusi.

Meid huvitavast küsimusest tulenevalt soovime ka ise näha, kas igas mängus tehtavast üldisest statistikast on võimalik märgata, et meeskond esines koduväljakul paremini kui võõrsil. Vaatlesime oma uuringus Inglismaa jalgpalli kõrgliiga, Premier League’i mängude statistilisi näitajaid hooajal 2013/2014. Premier League’s mängib 20 meeskonda ning iga meeskond mängib iga teise võistkonnaga ühe mängu kodus ja ühe võõrsil. Iga mängu kohta on andmestikus toodud kodumeeskonna nimi ja külalismeeskonna nimi koos üldiste statistiliste näitajatega, nagu näiteks löödud väravate arv, löökide arv, vigade arv jne.

Andmestikuga tutvumine

Valisime leheküljelt Football-data Premier League’i andmestiku, kus iga mängu kohta on sisestatud rida, kus on mõlema meeskonna kohta järgmised andmed:

  • Nimi
  • Mängus löödud väravate koguarv
  • Mängu lõppseis
  • Poolajaks löödud väravate arv
  • Poolaja seis
  • Pealelöökide arv
  • Raamidesse läinud löökide arv
  • Vigade arv
  • Nurgalöökide arv
  • Kollaste ja punaste kaartide arv

Andmestikus on 20 meeskonna omavahelised mängud ehk 380 mängu tulemused.

Üldine analüüs

Selles osas on arvestatud kõiki meeskondi korraga ja pole arvestatud meeskondade tegeliku tugevusega. Seega annavad tulemused ainult üldise pildi andmestikus kehtivatest seostest.

Joonisel 1 on näha pealelöökide arvu, mis on jaotatud vastavalt väljakule kahte rühma. Koduväljakul olev meeskond on sooritanud rohkem pealelööke. Seda kinnitab ka t.test, mis ütleb, et 95% usaldusintervall löökide vahele sõltuvalt väljakust on vahemikus 2.26 kuni 3.80. Seega sooritavad kodumeeskonnad rohkem pealelööke ja on ründavamad kui võõrsil mängivad meeskonnad. Joonisel on toodud ka mängu tulemus, mis nii võõrsil kui ka kodus on kasvavas trendis. Seega on suurem võiduvõimalus meeskondadel, kes sooritavad rohkem pealelööke.

Joonis 1.

Joonis 1.

Ka väravavaht on koduväljakul aktiivsem ja rohkem motiveeritud. Joonisel 2 on näha tõrjutud löökide osakaal. Kodumeeskonna eest mängiv väravavaht on suutnud oma puuri tühjana hoida rohkematel kordadel kui võõrsil olev väravavaht. Kuid vaatamata sellele ei ole näha olulist erinevust väravavahi töös sõltuvalt väljakust.

Joonis 2.

Joonis 2.

Joonis 3.

Joonis 3.

Kõige lihtsamini mõistetav headuse näitaja on löödud väravate arv. Nagu ka jooniselt 2 oli näha, siis on külalismeeskond jäänud enamatel kordadel ilma väravata. Löödud väravate arv mängus iseloomustab hästi koduväljaku eelist. Näeme, et kodus tõesti lüüakse veidi rohkem väravaid kui võõrsil. Külalismeeskonnal jääb tihti skoor avamata, kuid kodumeeskonnal on mood lüüa üks värav. Kui võõrsil üle kolme värava lüüakse väga harva, siis kodus lüüakse tihti ka neli väravat mängus.

Joonisel 4 on näha, et kodumeeskond lööb raamidesse ühtlasema protsendiga. Kui võõrsil kõigub raamidesse läinud pallide arv palju, siis kodumeeskond lööb umbes iga kolmanda palli postide vahele. Vaatamata sellele löökide täpsus märkimisväärselt ei erine ja võib öelda, et jalgpallurite löögitäpsus ei sõltu oluliselt sellest, kas mäng on võõrsil või kodus.

Joonis 4.

Joonis 4.

Gruppide analüüs

Tugevamad meeskonnad domineerivad nõrgemate vastu nii kodus kui ka võõrsil. Seega ei saa täielikku pilti väljakul tekkivast eelisest, kui vaatame kõiki meeskondi koos. Selleks eraldame meeskonnad vastavalt lõplikule tabeli seisule kolme gruppi: tugevad, kes said hooaja lõpuks tabelisse üle 60 punkti, keskmised, kes said 60 kuni 40 punkti, ja nõrgad, kes said alla 40.

Joonisel 5 on näha, et koduväljaku eelis ei olegi kõikide gruppide vahel väga oluline. Näiteks nõrgad meeskonnad esinevad tugevamate vastu sama hästi nii kodus kui ka võõrsil. Mitmel juhul võiks isegi öelda, et võõral väljakul mängimine annab eelise. Samas kõige olulisemad mängud on siiski tugevate meeskondade omavahelised kohtumised, kus koduväljaku eelis on kõige olulisem.

Joonis 5.

Joonis 5.

Loogika ütleb, et mida rohkem üritad, seda paremad on tulemused. Joonise 6 põhjal võib öelda, et see ei pea paika nõrkade meeskondade suhtes. Koduväljakul mängides tuntav kohustus hästi esineda mängib siin isegi negatiivset rolli, suurem pealelöökide arv ei taga suuremat mänguskoori, pigem vastupidi. Tugevamad meeskonnad käituvad ootuste kohaselt. Kõige suurem on väljaku mõju siis, kui mängivad võrdsed meeskonnad.

Joonis 6.

Joonis 6.

Kuna eelnev joonis on kirju, siis vaatame kahte joonist eraldi.

Joonis 7.

Joonis 7.

Joonis 8.

Joonis 8.

Joonistel 7 ja 8 on kujutatud väravate arvu sõltuvalt pealelöökide arvust ja löökide arvu olenevalt väljakust ja meeskonna tugevusest. Neist esimesel on märgata, et enamus sobitatud lineaarseid mudeleid on tõusvad. Seega värava löömise võimalus kasvab, kui lüüakse rohkem peale. Kõige kiirem on mudelite tõus võrdsete meeskondade puhul. Kahe tugeva meeskonna vahel suurendab iga pealelöök värava tulemise võimalust 1/10 võrra. Teisel joonisel on näha, et tugevamad meeskonnad teevad rohkem lööke kui nõrgad. Samuti sooritatakse kodus rohkem lööke kui võõrsil, mis eelmise kahe joonise põhjal aitab mõista, et koduväljaku eelis on tõesti olemas ning kodus üritatakse väravat lüüa rohkem.

Paaride analüüs

Kuid ka grupid ei pruugi kõige paremini iseloomustada eelist koduväljakul mängimisel. Andmestikus on igal meeskonnal üks mäng kodus ja üks võõrsil. Uurides neid paare võime eeldada, et mõju on ainult väljakul ja saame täpsemalt hinnata koduväljaku eelist.

Joonisel 9 on kujutatud roheliste täppidega koduses mängus tehtud lööke ja samal x-telje joonel punasega võõrsil tehtud lööke samas paaris. Sobitatud mudelid annavad aimu, et kodus lüüakse rohkem peale. Mudelite langev trend on tingitud sellest, et suurema indeksiga on tähistatud nõrgemate meeskondade tulemused.

Joonis 9.

Joonis 9.

Ka raamidesse läinud löökide korral kehtib sarnane tendents nagu eelmisel joonisel. Kodus saadakse rohkem lööke raamidesse kui võõrsil

Joonis 10.

Joonis 10.

Joonis 11 iseloomustab teenitud nurgalööke ja mängude paare. Ka siin on koduväljakul oluline mõju. Kodus mängivad meeskonnad teenivad rohkem nurgalööke, mis annab jällegi eelise vastasmeeskonna ees.

Joonis 11.

Joonis 11.

Kui muidu figureerisid kodus mängiva meeskonna statistilistes näitajates alati suuremad numbrid, siis vigadega on lood teisiti. Kuigi erinevus ei ole eriti suur, siis võõrsil mängivad meeskonnad teevad rohkem vigu. Ka see räägib kodumeeskonna kasuks.

Joonis 12.

Joonis 12.

Korreleeritud tunnused

Jääb mulje, et paljud tunnused on tugevamini seotud olenevalt väljakust. Kuid kaks järgmist joonist näitavad, et tegelikult olulist erinevust siiski ei ole ja tunnuste korrelatsioon on samas järgus.

Joonis 13.

Joonis 13.

Joonis 14.

Joonis 14.

PCA

Uurime, kas mängu mängimine kodus või külas iseloomustab enamuse meie andmete hajuvusest ehk tegelik dimensionaalsus on väikem kui praeguse andmestiku oma. Joonisel 15 on punaste täppidega tähistatud võõrsil mängitud mängud ja mustade täppidega tähistatud kodus mängitud mängud. Näeme, et punased täpid on pigem vasakul ja mustad pigem paremal. Samas on suur osa punkte joonise keskel. Kindlalt ei saa väita, et esimene peakomponenti võiks nimetada väljaku erinevuseks, aga võib aimata, et see midagi sellist on.

Joonis 15.

Joonis 15.

Kui teha peakomponentanalüüs kõigile gruppidele eraldi, siis kinnitust me eelnevale eeldusele ei saa.

Joonis 16.

Joonis 16.

Kokkuvõte

Uurisime, kas koduväljaku eelist on võimalik näha ka mängujärgsest statistikast. Uurimise käigus leidsime, et kui võrrelda mängude paare, kus samad meeskonnad on mänginud omavahel nii ühe kui ka teise meeskonna kodus, siis on kodus saadav eelis tõesti märgatav. Üldisemas pildis pole seos koduväljakuga nii tugevalt nähtav. Vaatamata sellele järeldame, et Premier League’s oli 2013/2014 koduväljak olulise tähtsusega ja koduväljaku eelisest ei räägita ilmaasjata.