Wie gut ist das Modell der erwarteten Tore (xG) von Driblab? (German)

Category: Team Analysis

Wir haben mehr als 44000 Schüsse analysiert, um festzustellen, ob das Modell Expected Goals (xG) von Driblab den Wert der Schüsse gut misst. Das Ergebnis bestätigt, dass unser Modell gut ausgewogen ist.

Published:05/10/2021

Kurze Antwort: Sehr Gut.

Lange Antwort:

Es ist nicht ungewöhnlich, dass es bei den verschiedenen Anbietern des xG-Modells zu Differenzen kommt. Die erwarteten Tore sind in der Theorie klar definiert, aber es ist schwierig, sie in der Praxis umzusetzen. Die neue Saison steht vor der Tür, in vielen Ligen hat sie bereits begonnen, und das ist ein guter Zeitpunkt, um unser xG-Modell zu testen. Das wichtigste fortschrittliche statistische Instrument im Fußball muss genau sein, um Mannschaften und Spieler richtig bewerten zu können.

Aber wie kann ein xG-Modell getestet werden? Schauen wir mal. Ein Schuss mit 0,22 xG bedeutet, dass ein durchschnittlicher Spieler, der unter denselben Umständen hundertmal schießt, 22 Tore erzielen würde. Diese Aufnahme erfolgt jedoch nur einmal. Setzt unser Modell also zu viel Wert auf jeden Schuss, oder haben wir vielleicht die Wahrscheinlichkeit der Umwandlung unterschätzt? Am besten lässt sich dieses Modell nicht anhand eines einzigen Schusses bewerten, sondern anhand von 44406 Schüssen. Dies ist die Anzahl der Schüsse (ohne Elfmeter und Eigentore), die in den Top-5-Ligen in Europa, der Copa América und der Europameisterschaft geschossen wurden.

Man könnte meinen, dass es unmöglich ist, den Schuss zu verfehlen, den wir gerade gesehen haben. Unser Modell ergibt einen Wert von 0,85xG. Wenn der Stürmer unserer Mannschaft eine Chance von 0,85xG vergibt, denken wir, dass wir den Treffer auch selbst hätten erzielen können. Aber diese 0,15xG sagen uns, dass etwa einer von 7 dieser Schüsse daneben geht. Im Laufe der Saison haben wir 6 weitere Schüsse mit dieser Menge an xG registriert, und alle wurden getroffen. Das ist natürlich ein Zufall, aber er zeigt, wie wichtig erwartete Tore sind.

Während der gesamten EURO erwartete unser Modell insgesamt 124,75 Tore ohne Elfmeter, und die Gesamtzahl der nicht Elfmeter erzielten Tore beläuft sich auf 122. Schließlich spielten nur wenige Nationalmannschaften, und es wurden nicht sehr viele Spiele ausgetragen. Nimmt man jedoch die sieben genannten Wettbewerbe, so ergeben sich 1905 Spiele, in denen unser Modell insgesamt 4485,8 Tore ohne Elfmeter erwartete, und es wurden insgesamt 4581 Tore ohne Elfmeter erzielt. Eine Unterschätzung von 2,07 %, die statistisch nicht signifikant ist, zeigt, dass unser Modell gut ausgewogen ist. Zum Vergleich: In der vorherigen Saison hatten wir in diesen Ligen eine Überschätzung von 0,16 %.

Dies ist jedoch nicht die ganze Geschichte. Es könnte sein, dass wir Schüsse mit geringem Wert überbewerten und alle Schussbereiche oder Schussarten unterschätzen oder gar nicht zählen. Betrachten wir als Beispiel die verschiedenen Arten von Schüssen in Bezug auf ihren Wert. Das obere Diagramm zeigt unsere Vorhersage im Vergleich zur Realität. Wir haben die Schüsse in Bereichen von 0,01xG platziert. Das heißt, die von uns vorhergesagte Wahrscheinlichkeit von 0,04xG liegt bei Schüssen zwischen 0,035 und 0,045. Die Größe des Kreises zeigt die Anzahl der Schüsse (mehr Schüsse bedeuten weniger Abweichungen) und wir zeigen, wie viele dieser Schüsse tatsächlich umgesetzt wurden. Ein R-Quotient von 0,968 bestätigt mathematisch unsere Intuition: Das xG-Modell von Driblab ist gut gewichtet.

Bei Schüssen mit höherer Torwahrscheinlichkeit (xG größer als 0,33) wird nur eine geringe Anzahl von Schüssen aufgezeichnet, und es kommt möglicherweise nicht zur Übereinstimmung. Hier sehen Sie ein Histogramm der Anzahl der abgegebenen Schüsse und der erzielten Tore. Wir können sehen, wie die meisten Schüsse weniger als 0,05xG erreichen und wie die Anzahl der großen Chancen drastisch abnimmt.

Anhand der erwarteten Tore lässt sich auch die Leistung des Teams beurteilen. In diesem Fall gibt es zwar eine offensichtliche Korrelation, aber einige Teams haben mehr Punkte erzielt als erwartet, während andere, wie Brighton, unterdurchschnittlich abgeschnitten haben. Mit Effizienz kann man den Meistertitel gewinnen (siehe Lille). Und während man in der heimischen Liga mit einer schwachen Leistung auf dem vierten Platz landen kann, zeigte Chelsea in der Champions League sein wahres Potenzial.

Das Expected Goals-Modell von Driblab ist grundlegend für viele andere Metriken, daher haben wir dafür gesorgt, dass es sehr genau ist. Wir zeigen einige der internen Analysen, denen das Modell unterzogen wird, um mögliche Fehler zu vermeiden. Eine Kennzahl, mit der wir Spieler, Mannschaften und sogar Ligen bewerten können, ist für uns von größter Bedeutung. Und wenn der Stürmer Ihrer Mannschaft das nächste Mal eine große Chance vergibt, denken Sie daran, dass auch Schüsse mit 0,97 xG von Zeit zu Zeit daneben gehen.

Wir sind Driblab, ein Beratungsunternehmen, das sich auf die statistische Analyse von Spielern und Mannschaften spezialisiert hat. Unsere Arbeit konzentriert sich auf die Beratung und Risikominimierung bei Entscheidungsfindungen im Profifußball in den Bereichen Talentscouting und Profilbewertung. Unsere Datenbank enthält mehr als 180.000 Spieler aus mehr als 180 verschiedenen Wettbewerben und deckt Mannschaften aus der ganzen Welt ab. Hier können Sie mehr darüber erfahren, wie wir arbeiten und was wir anbieten.

Autor: Alejandro Arroyo
For Team Analysis we also recommend you:

GBE: South American U-20 talents now eligible to play in the UK

There are not many U20 talents in South America who can play in the UK. We look at some of the best who can do so by meeting the requirements set by the GBE filter.

Five years of VAR: are more penalties being awarded?

We go to our database to find out what impact VAR has had on penalties awarded since its inception.

How to use driblabPRO as a team analyst

We use numerous visualisations that the Driblab team has developed over time to facilitate the work of an analyst within a club.

driblabPRO Release Notes December ‘22

In recent weeks we have improved the speed of driblabPRO to offer a more dynamic experience to our users.

Iraola’s rules on the most difficult pitch in Europe

We analyse how Rayo’s game changes when they play at home and when they play away, making their stadium the most difficult in the top leagues.

As chaves de um Benfica invicto (Portuguese)

A época do Benfica até agora tem sido perfeita. O seu talento individual e o seu desempenho colectivo têm-nos mantido invictos. Analisamos as chaves e visualizamo-las com dados.

The keys to an unbeaten Benfica

Benfica’s season so far has been perfect. Their individual talent and collective performance has kept them unbeaten. We analyse the keys and visualise them with data.

A grande evolução do futebol: a distância média de remate (Portuguese)

O desenvolvimento médio dos tiros é um dos grandes desenvolvimentos do futebol. Analisamos o que aconteceu para tornar possível disparar a uma distância cada vez maior.

Francia vs Argentina: World Cup final

We analyse all the key points of the Qatar World Cup final between Argentina and France: statistics, metrics and key tactics.

Spain and its possession, when did the problems begin?

Were Spain’s problems at the World Cup one-offs? We relate Spain’s possession to their ability to generate threat throughout Luis Enrique’s era.

Driblab

Información corporativa

Somos una empresa con sede en Madrid fundada en 2017 por Salvador Carmona y Cristian Coré Ramiro. Desde nuestros inicios nuestro trabajo se ha centrado en el análisis estadístico de datos para ayudar a los clubes en la planificación deportiva. Somos una consultora big data que ofrece servicios personalizados para cada cliente y defiende un modelo de gestión mixto y una comunicación constante para acompañar el día a día de las instituciones. Nuestro punto fuerte es la más amplia cobertura disponible en número de torneos profesionales y juveniles. Para más detalles, póngase en contacto con nosotros.

Colaboramos con:

           

Hemos aparecido en:


Talk to our speciali