Statystyka nie ma dobrej prasy.

Bo rzekomo manipuluje, kłamie i regularnie robi kurwę z logiki. Tymczasem dla autorów FPL to fantastyczne narzędzie ratujące cyferkami każdy mierny tekst. Jej początki opierają się na matematycznym rozkładzie Poissona, zakładając po prostu, że czas zajścia zdarzeń uprzednich nie ma wpływu na zdarzenia przyszłe. W footballu zakładamy, że ani liczba strzelonych dotąd bramek, ani czas, który upłynął od pierwszego gwizdka, nie wpływają na prawdopodobieństwo strzelenia kolejnego gola. Rozkład, na którym bazuje przywołana zależność  został nazwany na cześć Francuza Poissona, który opisał go na początku XIX wieku. Wykorzystał go jako pierwszy, sto lat temu, Polak Władysław Bortkiewicz, który badał dwa zbiory danych. Jeden był zestawem statystyk liczby samobójstw dzieci poniżej 10 roku życia, w okresie 24 lat. Drugi zbiór danych dotyczył żołnierzy, którzy zmarli w wyniku przypadkowego kopnięcia przez konia. Nasz rodak psychopata odkrył wysoką zgodność obu swoich zbiorów danych z rozkładem Poissona. Śmierć zadana końskim kopytem była zjawiskiem rzadkim; w 144 na 280 analizowanych jednostek nie zdarzyła się ani razu. Jednak w dwóch pechowych regimentach miały miejsce po cztery takie zgony w ciągu roku. Bortkiewicz udowodnił, że w oddziałach tych niekoniecznie gorzej traktowano konie – miały one po prostu pecha. W FPL panują mniej więcej te same reguły. Warto o tym pamiętać.

Problem w tym, że w każdy weekend, w trakcie sezonu, ponad 400 zawodników spędza 90 min kopiąc piłkę, a na koniec i tak wygrywa duży klub z top 6. Przewidywanie nie polega na stwierdzeniu, który konkretny klub wygra ligę. Polega natomiast na wykorzystaniu częstotliwości zdarzeń przeszłych do obliczania prawdopodobieństw zdarzeń przyszłych. Aby wytłumaczyć dlaczego wygrywa niemal zawsze ktoś z top 6 trzeba ogarnąć mechanizmy ukryte tworząc z dostępnych danych uniwersalny wskaźnik opisujący piłkarza. Zadania podjęło się dwóch analityków Manchesteru United, którzy dziesięć lat temu spróbowali stworzyć parametr zajebistości piłkarza. Zaprojektowali model statystyczny, zebrali dane z sezonu 08/09 i wyszło im, że najlepszym zawodnikiem tamtego sezonu był bramkarz Fulham Mark Schwarzer. W pierwszej dwudziestce zabrakło Ronaldo a jedynym napastnikiem w top20 był Anelka. Pierwsze próby stworzenia wskaźnika jakości spełzły na niczym, bo bazowały na zysku i stracie. Obrońca zyskuje odbierając piłkę, zaliczając przechwyty i tak dalej – napastnik i pomocnik częściej ją traci lub strzela obok bramki. Badania rozczarowały i dopiero po konsultacjach z przedstawicielami Premier League poprawiono wskaźnik dodając punkty za wygrane mecze, asysty lub czyste konta. Po korekcie top 20 najlepszym zawodnikiem sezonu 08/09 został Anelka co już miało sens.

Jak to wygląda w FPL? Statsy przeliczamy m.in. na oczekiwane punkty, co bywa ślepą uliczką bo Richarlison pomimo 95 oddanych strzałów miał średnio 1.6 punktów na spotkanie. Dochodzi wartość zawodnika, która również fałszuje obraz, bo aby Kane dał oczekiwaną ilość punktów na kolejkę musiałby zdobyć w sezonie 50 bramek. Jego 217 punktów z minionego sezonu to zaledwie 0.47PPM. Alonso z 165 punktami dał 0.71 PPM. Więcej tutaj. Analitycy ostatniego sezonu wyliczyli, że napastnik z zakresu 5.5 powinien dać 150 punktów na sezon, taki za 8.5 235 punktów (to jakieś 30 goli) a premium forward 290 co równa się 45 bramkom. Surowe matematyczne normy spełnili w ubiegłym sezonie wyłącznie Gross, Azpi, Lascelles i Fabiański. Trochę to bez sensu, wymyślono więc statsy expected goal xG oraz expected assist xA.

Czy zatem matematyka w FPL to tylko bzdury? Ogarnie średnią ilość bramek na spotkanie, szansę na wyjazdowe gole lub ich stratę na własnym stadionie, ale w FPL żadne równanie nie podpowie na 100% kto strzeli bramkę. Statystyka rzekomo uwzględnia zdarzenia losowe ale nikt nie przewidzi sraczki Sterlinga po piątkowym kebsie, lub zarwanej nocki przy Fortnicie Alliego. Układając pierwsze składy na GW1 strumień danych trzeba sprowadzić do najprostszych założeń, na przykład: największą szansę na bramkę ma gość grający najbliżej bramki przeciwnika, ilość tworzonych szans zwiększa prawdopodobieństwo asysty a im więcej kontaktów w polu karnym drużyny przeciwnej tym lepiej. Tyle, że później na boisko wchodzi taki przechuj Vardy i całe te cyferki tracą sens. Napastnik Lisów zdobył w minionym sezonie 183 punkty (droższy o parę milionów Kane tylko 34 więcej) oddając tylko 71 strzałów (przy 189 Harrego), z których padło 20 bramek. Wniosek kolejny, statystyka nie zastąpi formy i charakteru, i tylko najlepsi menedżerowie potrafią wejść w umysł zawodnika. Ja nie umiem.

To jeszcze bapsy, które regularnie sypiają ze statystyką. Indywidualne dane obrońców mają przełożenie na bonusy przy CS a przez niecelne strzały i tracone piłki mniej bonusów mają pomocnicy i napastnicy. Jedna rzecz jaka umknęła przywołanym na wstępie analitykom to jakość całej drużyny i trener. I właśnie tutaj do gry wchodzi matematyka i rozkład Poissona. Przekłada się na siłę ofensywną i defensywną drużynę oraz filozofię zespołu. Nie bez powodu w pierwszych składach dominować będą piłkarze Liverpoolu i Manchesteru City a Lukaku, pomimo udanego Mundialu, będzie drogą różnicą. Do pierwszych dwóch bramek zdobytych w jednym meczu.

* Wstęp bazuje na informacjach z książki Piłkomatyka Davida Sumptera.

Pierwszy sezon poza TOP10k. Czas na rewanż!

Zapisz się na newsletter, bądź na bieżąco!

Bez spamu!