Hoe Expected Goals de prestaties van spelers kan beoordelen
Louis Soetaert
14 apr 2022

Minuut 86. Kevin De Bruyne is in balbezit net voorbij de middellijn. Manchester City heeft nog vier minuten om een stap dichter bij de droom van de eigenaar sjeik Mansour te komen. Na wat geharrewar komt de bal tot bij Jesus, die Sterling moederziel alleen voor de goal zet. Sommige Engelse supporters beginnen al te juichen maar Sterling besluit torenhoog boven de doelmond van Lopes. Peter Vandenbempt bekroont de afwerking prompt als de misser van het jaar. Minuut 87. Ederson lost het schot van Aouar en Dembélé maakt de droom van de hemelsblauwen genadeloos af. Twee fases in twee minuten geven de perceptie van het seizoen van Man City een volledig andere vorm. In de pers wordt er zwaar uitgehaald naar de tactische keuzes van Guardiola en de prestatie van zijn spelers, op basis van het pijnlijke resultaat. Kunnen statistieken ons een beter beeld geven van het wedstrijdverloop en de prestaties van de spelers dan de droge eindscore: 1-3?
Vergeleken met andere balsporten wordt voetbal gekenmerkt door het lage aantal keren dat een ‘punt’ gescoord wordt door de ploegen, waardoor toeval een zeer grote invloed heeft op het eindresultaat. Om ondanks dit toeval toch de verdiende winnaar te achterhalen, gebruikt men sinds kort Expected Goals (xG). Dit is een getal tussen 0 en 1 die de waarde van een schietkans weergeeft. De xG van een penalty heeft bijvoorbeeld een vaste waarde van 0.79, wat betekent dat in 79% van de gevallen gescoord wordt. De niet te missen kans van Sterling klokte af op een xG van 0.87.
Om het algoritme van deze statistiek te bouwen, werd gebruik gemaakt van data van duizenden schoten uit het verleden en hun resultaat: doelpunt of geen doelpunt. Er wordt rekening gehouden met de afstand en de oriëntatie ten opzichte van het doel, het type schot (bv. kopbal), assist (bv. voorzet of pass), de positie van de verdedigers en de keeper,... Het algoritme berekent hoe kansrijk de doelpoging is door de spelsituatie te beoordelen net voor het schot, waardoor het een betere indicatie om doelpunten te voorspellen dan bijvoorbeeld schoten of schoten op doel.

De kleine broertjes van xG
De idee van Expected Goals wordt doorgetrokken tot statistieken zoals Expected Assist (xA) en Expected Goals On Target (xGOT).
Expected Assist kent na elke geslaagde pass een waarde toe tussen 0 en 1 voor het creëren van een kans. Jesus krijgt op die manier een xA-waarde van 0.87 toegekend voor de pass naar Sterling in de 86e minuut. De xA-waarde tracht een idee te geven van hoe groot de kans op een doelpunt is die ontstaat door het geven van een pass, ook wanneer de ontvanger beslist om geen doelpoging te wagen.
Expected Goals On Target is een statistiek die berekend wordt aan de hand van xG en de locatie van een schot binnen het doelkader, dus de combinatie van de kwaliteit van de kans en de kwaliteit van de afwerking waardoor deze een weergave is van welke schoten waarschijnlijk doelpunten zullen worden. Deze waarde wordt bepaald nadat er geschoten is, waardoor dit ook wel een post-shot model genoemd wordt, het schot heeft echter geen invloed op xG, waardoor het een pre-shot model is. Als voorbeeld bekijken we het doelpunt van Sterling tegen Crystal Palace met een schitterende vrije trap. De xG van deze vrije trap bedraagt slechts 0.10. Sterling schildert de bal echter magistraal in de rechterbovenhoek, waardoor de xGOT, die in tegenstelling tot xG ook rekening houdt met de afwerking van Sterling, 0.81 bedraagt. Moest Sterling de bal niet op doel schieten zou de xGOT 0.00 bedragen aangezien een schot dat niet op doel is logischerwijs ook niet tot een doelpunt kan leiden.
De xG-familie als prestatie-indicator
Als we de weg volgen van de laatste pass tot aan een doelpunt komen we vier statistieken tegen die belangrijk zijn om de prestatie van een speler te beoordelen, respectievelijk xA, xG, xGOT en gemaakte doelpunten. Door deze te combineren kunnen we bepaalde eigenschappen van spelers beoordelen op basis van de verkregen data. Om een goed beeld te krijgen over de kwaliteiten van een speler, worden de waarden respectievelijk opgeteld over meerdere schoten. De combinatie van zijn misser, magistrale vrije trap en vele andere schoten, geven ons een beter beeld over de kwaliteiten van Sterling als afwerker.

Expected Assists geeft ons een goed idee over de capaciteit van een speler om zelf kansen te creëren. Het nadeel van louter naar assists te kijken, in plaats van xA, is dat de prestatie van de ontvanger, en meer bepaald zijn afwerking, ook een grote invloed geeft en dus niet enkel de pass beoordeelt. Over het algemeen geven beide statistieken hetzelfde beeld weer: een speler met een hoge xA heeft meestal ook veel assists achter zijn naam staan maar dat is niet altijd het geval.
Als voorbeeld vergelijken we de backs van Liverpool in het seizoen ’19-’20: Robertson behaalde tien assists in de Premier League, tegenover 6 voor Alexander-Arnold. Men zou dus kunnen denken dat Robertson meer en betere kansen creëert dan Alexander-Arnold. Het xA-model schetst echter een ander beeld: Robertson haalde slechts 4.9 xA tegenover 7.1 voor Alexander-Arnold.
Een andere statistiek die hieromtrent vaak gebruikt wordt is Key Passes, het aantal passes van een speler die rechtstreeks tot een schot leidt. Het verschil met xA is dat deze statistiek geen rekening houdt met de kwaliteit van een bepaalde kans en met de keuze die de aanvaller maakt om wel of niet te schieten. Als voorbeeld kijken we naar twee spelers die in de Premier League dit seizoen tot nu toe elk 30 Key Passes gegeven hebben: Phil Foden en Leandro Trossard. Foden heeft dit seizoen echter al 4.5 xA tegenover 2.0 voor Trossard. Dit wijst erop dat de kansen die Foden creëerde gemiddeld een grotere kans op een doelpunt leverden dan die van Trossard.
In het voorgaande geval kon de statistiek op zich ons meer vertellen over de prestaties van spelers. Soms is het echter nodig een combinatie van verschillende statistieken te gebruiken om een specifieke kwaliteit te beoordelen. Op die manier kunnen we de omgevingsfactoren distilleren om tot een goede prestatie-indicator te komen. Als voorbeeld bekijken we opnieuw de vrije trap van Sterling tegen Crystal Palace. Om de afwerking van Sterling te beoordelen nemen we het verschil van de xGOT-waarde en de xG-waarde, in dit geval 0.71. Hij heeft immers eigenhandig een 10% doelkans omgetoverd tot een 81% kans. Indien Sterling de bal naast of over had geschoten, kreeg hij een xGOT van 0.0 en had het verschil -0.10 bedragen.

Over veel schoten gezien, kan deze data een goed beeld geven over de kwaliteit van de afwerking van een speler. Tijdens zijn periode bij Chelsea was Eden Hazard één van de uitblinkers volgens deze statistiek. Tussen 2013 en 2019 kwam hij tot 47.2 xGOT uit kansen die gemiddeld gezien maar 21.7 doelpunten zouden opleveren, met een uiteindelijk resultaat van 57 treffers. Deze cijfers leren ons dat Hazard niet bepaald uitzonderlijk veel of goede kansen kreeg maar deze wel uitstekend afwerkte. Deze statistiek evalueert de afwerking dus beter dan louter de doelpunten ons kunnen vertellen. Dit komt doordat de ruis, namelijk de prestatie van de keeper en het aantal en de grootte van de kansen, weggefilterd wordt en de resulterende statistiek dus enkel en alleen een weergave is van het killer-instinct van de aanvaller.

Natuurlijk kan deze redenering ook omgedraaid worden om de impact van de doelmannen te kwantificeren. De shot-stopping ability van de doelman wordt in cijfers weergegeven door het verschil tussen de xGOT en het aantal tegendoelpunten, vaak omschreven als Goals Prevented.
Als illustratie keren we terug naar de heenwedstrijd van de CL-kwartfinale tussen Paris Saint-Germain en Real Madrid. In minuut 62 trapt Lionel Messi een penalty met als xG 0.79, richting de Madrileense goal van onze nationale trots Thibaut Courtois. Aangezien Messi de bal laag en in de hoek plaatst, stijgt de xGOT tot een zeer hoge waarde van 0.97. Courtois pakt de bal, wat hem 0.97 Prevented Goals oplevert. Over de gehele wedstrijd behaalt PSG 1.61 xGOT waaruit enkel Mbappé in de 91e minuut kan scoren, terwijl Real geen enkele keer op doel kan schieten en dus met een xGOT eindigt van 0.00. Dit bewijst dat Goals Prevented een betere indicatie geeft van de prestatie van een doelman dan de meer traditionele statistieken clean sheets of tegendoelpunten.
Donnarumma presteert beter wanneer clean sheets en tegendoelpunten in beschouwing genomen wordt. Dit is het gevolg van de goede verdedigende prestatie van PSG en niet van de kwaliteiten van Donnarumma, die geen enkele bal moest tegenhouden. Prevented Goals leert ons dat Courtois 1.61-1=+0.61 doelpunten tegenhield vergeleken met een gemiddelde doelman, waar Donnarumma een PG van 0.00-0.00=0.00 behaalde.
Als reactie op de tekortkomingen van de eenvoudige clean-sheet en geïncasseerde doelpunten-stats, wordt tegenwoordig ook vaak gekeken naar het savepercentage van een doelman. Deze statistiek heeft als nadeel ten opzichte van Goals Prevented dat elk schot als even moeilijk te redden beschouwd wordt, wat uiteraard niet het geval is. Prevented Goals is aldus een goede tool om inzicht te verschaffen in de prestaties van de keepers, die we op het eerste zicht zouden kunnen missen.
De leider in de Prevented Goals-stand van de vijf grote competities is David De Gea, die de laatste jaren nochtans veel kritiek moest slikken bij Manchester United, met +10.7 Prevented Goals. Qua save-percentage bezet hij echter pas de 24e positie. Ergens in de onderste regionen van de ranglijst bengelt Jan Oblak, die tijdens zijn dramatische seizoen voorlopig op -9.3 Prevented Goals staat. Dit betekent dat hij maar liefst 9.3 doelpunten meer incasseerde dan een gemiddelde doelman wanneer die door dezelfde schoten bestookt zou worden.
Waar traditionele statistieken ons in de steek laten, kunnen computers en data ons dus nieuwe inzichten aanreiken; al dienen we altijd kritisch te blijven en na te denken wat deze statistieken ons nu echt kunnen bijbrengen.