Článek
Když dva říkají totéž, není to vždy totéž. Sport a statistiky vycházejí z jiných světů. Sport je prostředí s jasným cílem - vyhrát! Vše ostatní je vedlejší. Snaha vysvětlit dílčí i celkové neúspěchy vždy trochu zavání alibismem. Možná i proto je dobře vysvětlených a používaných statistik v hokeji tak málo.
„Tuhle tutovou šanci jsi měl proměnit,“ vytkne ti na střídačce trenér. Protiargumentovat v dané chvíli rozborem, z nějž jasně vyplývá, že zmíněná situace byla maximálně sedmiprocentní, se obecně příliš nedoporučuje.
Statistiky a sportovní věda ale subjektivně fungovat nemůžou. Rozbor vítězů pro ně není jen bezmeznou adorací všeho, co držitelé trofeje provedli, a stejně tak nezatracují automaticky poražené. Jejich smysl existence stojí a padá s pravidly a hromadami mechanicky nasbíraných informací. I když nakrásně čtete náladu v místnosti a vnímáte, co by se slušelo říct, nemůžete (neměli byste) si pravdu ohýbat pro dobro lepšího příběhu.
Co se skrývá hokeji pod označením šance? Podobně jako ve slavné definici pornografie (“poznám ji, když ji uvidím”) máme všichni nějakou představu, ale oficiální hokejová definice chybí. Šance tak spadá do sportovní mlhoviny výrazů, podobně jako souboj, „být na puku“ a další.
Možná se budete divit, ale týmy dokonce mívají různé pohledy na to, co považují za šanci. Když byl v reprezentaci Kari Jalonen, chtěl speciálně zvýraznit počet střel na branku ze slotu. Dávalo to smysl, jeho defenzivní systém hodně zahušťoval prostor před gólmanem a nejenže do něj soupeře nepouštěl, ale navíc díky dobré práce s hokejkami soupeřům spoustu dalších střeleckých příležitostí zblokoval a vychýlil střelce z ideálního nápřahu. Kari si vyžádal zpřesnění statistiky, nabídl definici a pro dané sezóny jsme měli v reportech metriku, která víc vyhovovala trenérskému štábu.
To je samozřejmě ideální reakce. Zjistit rozpor mezi čísly a soukromou představou, pochopit, co se měří a vybrat si parametry, které nejblíž odpovídají zadání trenérů či hráčů. Ne vždy je to ale pravidlem. Občas mám v diskusích pocit, že někteří lidi jen čekají na zdánlivě divnou hodnotu, aby na ní dokumentovali celkovou debi*itu hodnocení sportu pomocí čísel.
Souboje o puk jsou třeba strašně oblíbeným a žádaným parametrem, ale když třeba čipy na mistrovstvích měří, kdo ze zastavených puků nejčastěji vyjede jako vítěz, nevyhrávají vždy fyzické a silné typy, jak si všichni představují. Místo nich data ukazují na hráče typu Tomáše Galvase nebo Michaela Špačka.
Proč je v příkladu ze Seattlu jednou počet šancí 14 a podruhé 31? Komentátor a exhokejista JT Brown neměl jasně definovaná pravidla, využil vlastních zkušeností. Šel po vyložených příležitostech svého týmu, do svého rozboru zahrnoval spoustu expertních postřehů (postavení a volnost střelcovy hokejky, pozici brankáře, rozestavení obrany atp.). Byl tedy přísnější a detailnější. Zároveň taky subjektivnější. Podobné informace v datech možná v budoucnu budeme mít, ale bude to vyžadovat čipy a lepší optické trackování z videa. Postřehy bývalého hokejisty se navíc porovnávaly jen se základními, veřejně přístupnými daty.

Proč sledujeme prostor slotu? Protože jde o hranici 5% střelecké úspěšnosti nezblokovaného pokusu
Ty pracují s historickou definicí šance, v níž se počítá se střelami, které plus mínus odpovídají prostoru tzv. slotu. Nevznikla svévolně, slot kopíruje hranici, kde průměrná úspěšnost nezblokované střely atakuje hranici 5 % a dál roste. Zahrnuje občas slabé střely, kterým nevěří ani statistici? Ale samozřejmě. Nicméně pokud sbíráte jakoukoli metriku, nemůžete si ji v průběhu měření svévolně upravovat. Na to jsou jiné nástroje. A slovní komentáře ke statistikám.
I teď mají interně kluby NHL k dispozici variabilní datové zdroje od různých společností, v české extralize lze vybírat taky z vícero definic. Chcete být přísnější? Můžete pracovat s hodnotou, která sleduje jen vnitřní prostor slotu, nebo přeskočíte k očekávaným gólům, které berou v potaz nejen lokaci střely, ale také předcházející přihrávky, střely nebo typ útoku. Výsledkem je hodnota, s jakou podobná střela skončí gólem (0,1 xG = 10% šance na gól). Ale opět platí, že každá firma do výpočtu zahrnuje trochu jiné věci. Možná za pár let budeme mít přehled o stejných parametrech jako hokejista na ledě, teď tam ale nejsme.
Navíc nám nejde jen o to dokonale popsat, co se stalo. Chceme taky hodnotit dlouhodobé vyhlídky. Hlavním kouzlem dat je schopnost porovnávat obrovská kvanta informací a posvítit i na to, co intuitivně není vidět. Statistiky občas nepopíšou dokonale danou situaci, tak jak, by ji vyhodnotil trenér, ale jde o signál. Signál, jehož užitečnost si opakovaně ověřujeme.
Dlouhodobě totiž platí, že vstřelené branky jsou velmi špatným prediktorem budoucích výsledků. Pokud včera jeden tým dominoval, vytvořil si víc šancí a očekávaných gólů, a přesto prohrál, je pravděpodobnější, že dlouhodobě posbírá víc bodů on než vítěz. Chcete důkaz?
V extralize za sebou máme 30 kol základní části. Představte si, že odehranou část ligy rozdělíte na půl a vrátíte se zpět do 15. kola. Znáte výsledky a výkony všech týmů. Která statistika líp odhadne, kdo dá góly v 16.-30. kole?

Srovnání výkonů týmů TELH za 1.-15. kolo a 16.-30. kolo
Procento uvádí, jak velkou část budoucích hodnot statistika „vysvětluje“. Víc než polovina informace tak zůstává skryta. Sem se schovají samozřejmě výkyvy týmu, posily, zranění, skóre v zápase, ale i vliv náhody a samozřejmě taky taktika.
Reálně vstřelené góly říkají o budoucích gólech úplně nejmíň. Proto sledujeme i jiné statistiky, proto jsou důležité šance: dokonce i ty tupě definované místem střely nabízejí zajímavou informaci, a to i v extrémně vyrovnané sezóně.
Proto jsou taky neoddělitelnou součástí přenosů i očekávané góly. Je v nich popis toho, co se dělo, a navíc malá předpověď do budoucna. Žádné číslo není dokonalé, některá jsou ale užitečná. Jen se musíte umět zeptat, jakým způsobem vznikla, a vědět, jak je číst.
Na rozloučenou - situace po 30 kolech vypadá takto:

Jak je na tom extraliga po 30 kolech?
O výsledcích se samozřejmě vždy rozhodne na ledě, ale nejklidnější bych byl jako fanoušek týmu, který dává branky a má je podpořené i předvedenou hrou (očekávanými góly). Do výsledků samozřejmě promlouvají i přesilovky, ale o těch zas někdy jindy.











