Берое  Ботев Враца  Ботев Пловдив  Верея  Витоша  Дунав  Етър  Левски  Локомотив Пловдив  Лудогорец  Славия  Септември  Черно море  ЦСКА  България 
Трансферно лято 2018
Познавате ли правилата?
Мондиал 2018

31-12-2017 15:33


Статистиките във футбола

Статистиките във футбола

Или колко е важна математиката дори в най-популярната игра

стани фен

Преди време написах един текст за използването на статистика във футболните спорове. В краят му обещах и продължение, в което да се пуснем през задния вход към тайната кухня на топ отборите и да видим какви статистики ползват те. На пътят ми обаче се изпречи епичен враг – липсата на време. Причината за анализа е новината (от лятото - б.р.), че BBC ще започне да използва Expected goals (ще го обясним по-надолу в текста) в прочутото си предаване Match of the Day. Просто нямаше как да оставим хора като Алан Шиърър да ни изпреварят, нали така? Затова се и наложи да се гмурнем в темата. Hurry, let’s go!

Статистиката като наука във футбола изостава значително в сравнение с други спортове като бейзбол, баскетбол или дори американски футбол. Основните причини за това са две. От една страна записването и следенето дори на елементарни неща като асистенции, брой шутове, корнери и т.н. е сравнително ново явление – от има няма двайсетина години. Абсурдно, знам. Втората голяма причина е чисто и просто фенската аудитория.

По-голямата част от футболните фенове са разделени главно на два лагера. Едните, които наплашени от учителката си по математика в трети клас, отричат използването на всякакви числа и странни символи и вторите, които сядат зад компютъра и вадят пет броя шпагати, спечелени въздушни дуели или някоя друга безсмислена цифра от Whoscored или Soccerwaу и ги тряскат в масата с викове "КОГАТО ФАКТИТЕ ГОВОРЯТ И БОГОВЕТЕ МЪЛЧАТ".

Причината за тази едновременно тъжна и смешна ситуация е неразбирането на това как всъщност работи статистиката. За да илюстрирам идеята ще цитирам следното изказване от… "честна скаутска, забравих кой го каза… предполагам, че вече съм аз?"

Една от големите заблуди за статистиката е, че тя ни казва повече от това което буквално ни казва. Фактът, че 85% от подаванията на Пол Погба през изминалия сезон са били точни не означава, че Пол Погба е добър подавач… или че е лош подавач... нито дори, че е средностатистически подавач. Тази статистика чисто и просто означава, че 85% от подаванията на Пол Погба през изминалия сезон са били точни. Толкова. Всичко извън това е интерпретация. С други думи – няма лоша статистика, само лоши интерпретации и анализи."

Съвсем логично е да си зададем въпросът "Ако искаме статистиката да ни каже нещо – как да я накараме?". Очевидно няма да стане като се взираме в брой шпагати, пасове, шутове и тем подобни цифри... Тогава как?

Този въпрос, разбира се, са си го задавали и преди нас и евентуално няколко умни нърда се събрали около лагерния огън и са измислили решението. Сиреч родили са се така наречените "advanced" или "напреднали" статистики.

Въпросните напреднали статистики представляват опит да се комбинират няколко от "елементарните" такива чрез формули, които придават различна тежест на различни фактори и така стигат до смислено и използваемо число. Или казано на по-прост език.. "напредналите" статистики, комбинират много безполезни сами по себе си статистики в други полезни и обективни цифри. Малко по-надолу ще дадем и по-конректен пример за такава статистика за да си прочистим главите от сложните изречения в този абзац.

Дори в днешно време обаче напредналите статистики не са толкова популярни и широкоразпространени, колкото заслужават да бъдат. Причината за това е, че футболните клубове са пълни предимно с бивши футболисти, а нещото което обединява повечето бивши футболисти е... липсата на желание да се признае, че съществува каквото и да е различно от това, което навремето тренера им е казал.

Тук е и голямата ирония в ситуацията. Често именно хората, които отричат ползата от статистиките са точно тези които са най-склонни да използват безполезни цифри без контекст в аргументите си – неща като притежание на топката, процент точни пасове или брой голове в последните 5 мача.

Има и изключения обаче. Едно от първите такива (учудващо) Сам Алърдайс, който е известен с честото си използване на статистики по време на супер успешният си престой в Болтън.

Арсен Венгер също е един от пионерите, които се доверяват на напредналите статистики. Имената на Маруан Шамак и Парк Чу-Йънг едва ли ви говорят много, освен ако не сте фенове на Арсенал – в който случай само при споменаването им ви избива студена пот. И двамата обаче имат огромен принос към футбола без дори да го осъзнават. В краят на първия сезон на Парк Чу-Йънг като футболист на Арсенал, клубът и в частност Венгер се срещат с американската консултантска компания за спортни статистически проучвания – StatDNA. На срещата представителите на компанията се опитват да убедят Венгер в ползите от използването на така наречените"напреднали статистики". За да сторят това те използват именно Шамак и Парк – като примери за трансфери, които можеха да бъдат избегнати лесно ако преди това бяха преминали тяхната статистическа проверка. При мисълта да не купува повече Шамаци в очите на Венгер светват малки доларчета и той предлага хонорар от 250 000 долара на StatDNA като гаранция, че няма да продават статистическа информация на никой друг клуб от Висшата Лига и ще работят ексклузивно с Арсенал. Скоро обаче останалите клубове научават за това и някои се опитват да измъкнат услугите на StatDNA. За да пресече това в зародиш, Венгер настоява за още по-радикален ход – Арсенал купува цялата компания за около 4 милиона долара и StatDNA става звено на клуба. Проблемът е решен, а екипът статистици вече години наред работи ексклузивно за "топчиите".

Други големи имена, които дълбоко вярват в плюсовете на "напредналите статистики" включват хора като Пеп Гуардиола, Томас Тухел (който дори отдели няколко месеца от почивната си година в изучаване на математика и статистика), Юрген Клоп, Маурисио Сари, Юлиан Нагелсман, Масимилиано Алегри и др.

Е, след толкова много приказки е време и да се върнем към самото начало на текста и да се занимаем с "кралят на напредналите статистики":

Expected goals
Не ми харесва как звучи преводът на термина (очаквани голове) затова ще използваме или Expected goals или съкращението – xG.

Всички сме чували изречения от сорта на "Не може да изпускаш от такава позиция", "Трябваше да вкара" или "Можеше да вкара 5 гола днес". Е, xG е начинът да се оборят абсурдни твърдения като тези.

Най-елементарно казано xG е начин за определяне колко добър наистина е бил даден шанс за отбелязване на гол. Колкото по-голяма стойност по този показател, толкова по-добро е било положението. Например ако дадено положение има 0,35 xG това означава, че има 35% вероятност въпросният шут да се превърне в гол. Лесно, нали?

Изчисляването става по доста сложен начин, който най-вероятно би ви накарал да затворите моментално статията, затова ще споменем само част от факторите, които влизат в уравнението – разстояние до вратата, ъгълът на изстрела, дали изстрелът е направен с крак или с глава, дали играчът е бил сам срещу вратаря или е имало и други защитници в близост до него, какъв вид е била "асистенцията" – дали дълъг пас, центриране, извеждащ пас по земя и тн, в каква ситуация се е случило – дали при игра, или от статично положение, дали футболистът е преодолял футболист преди да стреля или някой го блокира и много други.

Колкото повече фактори са включени, толкова по-точен и обективен ще бъде крайният резултат. А за да се придаде стойност на въпросният шут той просто се сравнява с милионите подобни шутове в конкретното първенство, които вече са направени през изминалите години. Разбира се, подобни данни са труднодостъпни, дори и да имате възможността сами да програмирате нужните формули. Точно затова и статистики като тези досега бяха (а и все още си остават) ексклузивно за клубовете.

Почти всички топ клубове на планетата вече имат отдели, които се занимават с разработването на подобни статистики (xG е само първата стъпка към доста по-сложни неща). В същото време все повече от средните по размер клубове като Саутхямптън например също започват да използват напредналите статистики като начин да изпъкнат пред останалите.

Предстоящото използване на xG от комерсиално предаване като Match of the Day представлява голяма стъпка в правилната посока. Разбира се, много е важно точно какъв xG модел ще използват от BBC, тъй като използването на лош модел може да се окаже дори по-вредно от неизползването на никакъв. Все пак сътрудничеството им с анализаторския тим на Opta най-вероятно ще бъде на прилично ниво. Остава ни само да видим как Алан Шиърър се чеше по главата, мърморейки как Хари Кейн е трябвало задължително да вкара някакво си положение, докато на екрана язвително стои надпис 0,14 xG.

Някой несъмнено ще си каже "ОК, какво значение има колко добър е бил шансът.. или е гол или не е гол". Истината обаче е, че има огромно значение. Головете в даден мач често са плод чисто и просто на късмет, на еденично нереално отиграване на футболист или пък на нечии "боц".

В дългосрочен план обаче отбор, който създава добри положения ще отбележи МНОГО повече голове от отбор, който създава множество положения с малък шанс за отбелязване на гол. Както казва Карло Анчелоти "Единственото нещо, което ние като треньори не можем да контролираме е отбелязването на голове.. можемо само да направим така, че да имаме повече и по-добри положения от противника."

Преди да завършим сегмента ще откраднем един пример от BBC да илюстрираме концепцията:

Във въпросният клип шансът това положение да се превърне в гол е само 4%. Хари Кейн е с гръб към вратата, в кофти позиция, топката му идва неудобна и за крак и за глава и е пълно със защитници около него. Благодарение на това, че Кейн изиграва ситуацията по абсолютно перфектен начин + известна доза късмет обаче положението се превръща в гол. Един от най-трудните за отбелязване голове през изминалия сезон във Висшата лига.

Ползите от използването на "напредналите" статистики са многобройни и можем да запълним цял нов текст само с примери. Затова сега ще се спрем само на два. Преди години не кой да е, а Ювентус сглоби полузащита от юноша без никакъв опит, не-особено-известен чилиец и пенисонер благодарение на задълбочени проучвания. Ако се чудите кои са футболистите, става дума за Пол Погба, Артуро Видал и Андреа Пирло.

В друг доста пресен пример, един от гурутата в областта на статистиката, който имам честта да познавам, преди 2 години посочи Наби Кейта като един от най-обещаващите таланти на планетата, още докато цената му беше 5 м евро и имаше зад гърба си един професионален сезон в РБ Залцбург. Тази година Ливърпул прекарва лятото си надявайки се, че 70 м паунда ще бъдат достатъчни за привличането му.

Това са само една част от многобройните приложения на "напредналите" статистики във футбола. Ще разгледаме още няколко в следващ текст, тъй като този вече стана прекалено дълъг, а останалите ще останат за бъдещия ми работодател.


Тагове: Статистики, анализ, математика

Коментари

Още Новини


Първа лига - редовен сезон
последен мач
Първа лига - редовен сезон
следващ мач
Анализ на седмицата
Анализ на седмицата

Поглед в бъдещето - сезон 2018/19 (втора част)

Поглед в бъдещето - сезон 2018/19 (втора част)

Как ще се представят отборите на Ливърпул и Тотнъм

Анализ на седмицата
Анализ на седмицата

Поглед в бъдещето - сезон 2018/19 (първа част)

Поглед в бъдещето - сезон 2018/19 (първа част)

Какво да очакваме от двата манчестърски гранда през новата година във Висшата лига

Ваня Николова
Ваня Николова

Равносметката: Червена радост и разочарование в Разград

Равносметката: Червена радост и разочарование в Разград

Славия отпадна, но е на прав път

назаем

Когато играех добре, бях белгиец, в противен случай – от конгоански произход

Когато играех добре, бях белгиец, в противен случай – от конгоански произход

Никога не трябва да се се закачаш с момче, което е гладно



Те ще блестят само едно лято

Те ще блестят само едно лято

Какво ще се случи със стадионите в Русия след мондиала?


Спортни новини