¿Cómo de bueno es el modelo de Goles Esperados (xG) de Driblab?

Analizamos más de 44000 tiros para medir si el modelo de Goles Esperados (xG) de Driblab mide bien el valor de los tiros. El resultado confirma que nuestro modelo está bien equilibrado.

Publicado:03/08/2021

Respuesta corta: Muy bueno.

Respuesta larga:

No es raro ver discrepancias en los diferentes proveedores del modelo xG. Los Goles Esperados tienen una definición clara en teoría, pero es difícil ponerla en práctica. Una nueva temporada está a punto de comenzar, de hecho ha comenzado en muchas ligas, por lo que es buen momento para probar nuestro modelo xG. La principal herramienta de estadística avanzada en fútbol debe ser precisa para poder evaluar correctamente a los equipos y a los jugadores.

Pero, ¿cómo se puede probar un modelo xG? Veamos. Un disparo que tiene 0,22 xG significa que si un jugador medio disparara en las mismas circunstancias cien veces, marcaría 22 goles. Pero este tiro ocurre sólo una vez. Entonces, ¿nuestro modelo da demasiado valor a cada tiro? ¿O quizás hemos subestimado la probabilidad de conversión? La mejor manera de evaluar este modelo no es valorando un tiro, sino 44406 tiros. Este es el número de tiros (descontando los penaltis y los goles en propia puerta) que se realizaron en las 5 mejores ligas de Europa, la Copa América y la Eurocopa.

Uno puede pensar que es imposible fallar este tiro que acabamos de ver. Nuestro modelo le da un valor de 0,85xG. Cuando el delantero de nuestro equipo falla una ocasión de 0,85xG pensamos que incluso nosotros mismos podríamos haberla marcado. Pero ese 0,15xG nos dice que aproximadamente uno de cada 7 de estos tiros se falla. Y este es el único. A lo largo de las temporadas, registramos otros 6 tiros con esa cantidad de xG, y todos fueron anotados. Esto es, obviamente, una coincidencia, pero sigue sirviendo para ilustrar el significado de los goles esperados.

A lo largo de la Eurocopa, nuestro modelo esperaba un total de 124,75 goles sin penaltis, y el número total de goles marcados sin penaltis es de 122. Al final, sólo jugaron unas pocas selecciones nacionales y no se disputó un gran número de partidos. Pero tomando las siete competiciones que hemos mencionado, tenemos 1905 partidos en los que nuestro modelo esperaba un total de 4485,8 goles sin penaltis, anotándose un total de 4581 goles sin penaltis. Una subestimación del 2,07%, que no es estadísticamente significativa, nos muestra que nuestro modelo está bien equilibrado. Para comparar, la temporada anterior, en estas ligas, tuvimos una sobreestimación del 0,16%.

Pero esto no cuenta toda la historia. Podríamos estar sobreestimando los tiros de bajo valor y subestimando, o no contando, todas las zonas de tiro o tipos de tiro. A modo de ejemplo, vamos a analizar diferentes tipos de tiros en cuanto a su valor. El gráfico anterior muestra nuestra predicción frente a la realidad. Hemos situado los tiros en franjas de 0,01xG. Es decir, nuestra probabilidad predicha de 0,04 xG son tiros entre 0,035 y 0,045. El tamaño del círculo representa el número de disparos (más disparos significa menos desviación) y mostramos cuántos de estos disparos se convirtieron realmente. Un R-cuadrado de 0,968 confirma matemáticamente nuestra intuición: el modelo xG de Driblab está bien ponderado.

En el caso de tiros con mayor probabilidad de gol (xG superior a 0,33), se registra un número reducido de disparos y es posible que no se produzca la convergencia. Aquí tenemos un histograma del número de disparos realizados y de los goles marcados. Podemos ver cómo la mayoría de los disparos acumulan menos de 0,05xG, y cómo el número de grandes ocasiones disminuye drásticamente.

Los Goles Esperados también nos permiten evaluar el rendimiento del equipo. En este caso, aunque hay una correlación evidente, algunos equipos han marcado más de lo esperado, y otros, como el Brighton, han tenido un rendimiento muy inferior. Tener eficacia puede darte el título de Liga (véase el Lille). Y aunque rendir por debajo de lo esperado en la liga nacional podría llevarte al cuarto puesto, el Chelsea mostró su verdadero potencial en la Liga de Campeones.

El modelo de Goles Esperados de Driblab es básico para muchas otras métricas, por lo que hemos estudiado que sea muy preciso. Mostramos algunos de los análisis internos a los que se somete el modelo, con el fin de reducir cualquier posible sesgo. Una métrica que nos permite evaluar a los jugadores, a los equipos e incluso a las ligas, es de suma importancia para nosotros. Y la próxima vez que el delantero de tu equipo falle una ocasión de oro, recuerda que incluso los tiros de 0,97 xG se fallan de vez en cuando.

Somos Driblab, una consultora especializada en el análisis estadístico de jugadores y equipos; nuestra labor se centra en asesorar y minimizar el riesgo en la toma de decisiones en el fútbol profesional en áreas relacionadas con la detección de talento y evaluación de perfiles. Nuestra base de datos cuenta con más de 180.000 jugadores de más de 180 competiciones diferentes, abarcando así información de equipos de todo el mundo. Aquí puedes conocer mejor cómo trabajamos y qué ofrecemos.

Autor: Joan Hernanz
Para Actualidad | Análisis de Equipo te recomendamos también:

Dominio y físico en las segundas partes: ¿quién ataca y presiona más tras el descanso?

Analizamos a los veinte equipos de las cinco grandes ligas europeas con mejor rendimiento en las segundas partes, intentando saber qué nivel de ofensividad y físico presentan tras el descanso.

Los datos que reflejan la evolución del Bayern

Entre muchos factores que explican sus dudas, ¿era el Bayern un club para Tuchel?¿Era Tuchel el entrenador idóneo para el Bayern?

Acuerdo de colaboración entre el Real Sporting de Gijón y Driblab

Acuerdo de colaboración entre el Real Sporting de Gijón y Driblab.

Métricas de estilo: secuencias de +10 pases por 90′

Descubrimos a los equipos que más secuencias de +10 pases completan en cada partido y cuáles menos en las cinco grandes ligas, una métrica de estilo interesante para el análisis.

Scouting más allá de segundas divisiones: cobertura y datos a la carta

Cuatro de los ocho últimos clientes de Driblab pertenecen a categorías inferiores a segundas divisiones. Así ayudamos a través de los datos y els scouting a clubes de todo el mundo.

Sobre remontadas y goles después del 90′

Desde hace un tiempo incluímos información de valor adicional a todos los modelos y métricas de estadística avanzada, en referencia a las dinámicas competitivas de cada equipo. Desvelamos qué equipos remonta más veces y cuál marca más goles en los tramos finales.

Un perfil ‘made in’ Bayern

Los dos últimos fichajes del Bayern Munich, dos extremos regateadores, explican su forma de reclutar pero con la novedad de hacerlo en lugares más inesperados.

Artem Dovbyk, el talento tardío que los datos descubrieron

Una de las grandes revelaciones del fútbol europeo de primer nivel es el delantero ucraniano del Girona, Artem Dovbyk. Una historia que se repite cada temporada: un jugador poco rastreado por clubes de primer nivel, de explosión tardía y por el que los clubes no...

El Real Murcia Club de Fútbol y Driblab firman un acuerdo de colaboración

El Real Murcia Club de Fútbol y Driblab firman un acuerdo de colaboración.

‘Análisis de entrenadores’: las notas de Thiago Motta

Profundizamos a través de los datos en algunos detalles del Bolonia de Thiago Motta.

Driblab

Información corporativa

Somos una empresa con sede en Madrid fundada en 2017 por Salvador Carmona y Cristian Coré Ramiro. Desde nuestros inicios nuestra labor se ha centrado en el análisis estadístico para ayudar a los clubes en la planificación deportiva. Somos una consultora que ofrece servicios personalizables para cada cliente y que defiende un modelo de gestión mixto y una comunicación constante para acompañar en el día a día de las instituciones. Nuestra fortaleza es la cobertura más amplia disponible en número de torneos profesionales y de categorías inferiores. Para más detalles no dude en contactarnos.

Colaboramos con:

Mencionados en: