En 2017, Match of the Day de la BBC introdujo una nueva estadística en sus resúmenes posteriores al partido de los partidos de la Premier League. Los goles esperados, o xG, están diseñados para decirnos cuántos goles debería haber marcado un equipo en función de la calidad de las ocasiones que crearon en un partido. Es amado por los estadísticos aficionados y profesionales que quieren usar datos para analizar el rendimiento.
La BBC usa regularmente xG en su cobertura de la Premier League, pero esta métrica estuvo ausente tanto de la cobertura de la BBC como de la ITV en la reciente Copa del Mundo masculina. Una breve mirada a lo que es xG y el historial de uso de datos para predecir partidos de fútbol puede darnos una idea de por qué decidieron no usarlo.
El concepto de goles esperados proviene originalmente de hockey sobre hielo pero es fácilmente aplicable al fútbol. xG se calcula observando cada tiro que un equipo realizó en un partido y asignándole una probabilidad de ser anotado.
Esta probabilidad se calcula observando tiros de situaciones similares en partidos históricos y calculando qué porcentaje de ellos resultó en gol. Al sumar las probabilidades de todos los tiros que realiza un equipo, obtenemos los goles esperados para todo el partido.
Considera el Liga Premier partido entre Tottenham y Liverpool en noviembre de 2022, que el Liverpool ganó 2-1. El Liverpool solo logró un xG de 1,18 en 13 tiros en el partido, mientras que el Tottenham logró un xG de 1,21 en sus 14 tiros.
En el entrevistas posteriores al partido, el entrenador del Tottenham, Antonio Conte, afirmó que el Tottenham tuvo mala suerte de perder dada su actuación. Una línea de puntuación de xG de 1,21 frente a 1,18 sugiere un juego muy parejo y parecería respaldar el punto de vista de Conte.
Sin embargo, el entrenador del Liverpool, Jürgen Klopp, sugirió que la calidad de Mohamed Salah, quien anotó dos goles de tres tiros con un xG combinado de 0,67, fue la diferencia en este partido. Esto expone una de las principales debilidades de xG. No tiene en cuenta quién es el delantero o el portero. Pero, ¿es esta debilidad suficiente para hacer que xG no sea confiable como recurso para predecir juegos futuros?
Predicción de fútbol antes de xG
El dato obvio para usar al analizar el fútbol son los goles. De hecho, esta fue la única información utilizada en el modelo de 1997 de Mark Dixon y Stuart Colesque predice futuros partidos de fútbol asignando a cada equipo una calificación ofensiva y defensiva.
Las calificaciones de Dixon-Coles se calculan utilizando el número de goles marcados y recibidos en partidos anteriores, teniendo en cuenta la calidad de la oposición. Las calificaciones de dos equipos diferentes, junto con un impulso de la ventaja de jugar en casa, pueden combinarse para predecir el puntaje de un próximo partido entre ellos.
Dada la cantidad de estadísticas disponibles en el fútbol, un modelo que solo usa goles para predecir juegos futuros puede parecer notablemente simple, pero su efectividad radica en comprender qué hace un buen análisis estadístico: datos de alta calidad, y muchos.
Los goles son los datos de mayor calidad disponibles en la predicción de fútbol, ya que son lo único que realmente afecta los resultados. Esto explica por qué otras métricas tradicionales como el número de tiros o el porcentaje de posesión no se utilizan en el modelo Dixon-Coles.
Un tiro puede ser un penalti, que los jugadores esperan marcar, o un esfuerzo especulativo desde la distancia, pero ambos cuentan por igual como tiros a puerta. Del mismo modo, un equipo puede tener mucha posesión pero no en una zona del campo que le dé posibilidades de marcar goles.
Ya en 1968, un estudio estadistico no pudo encontrar ningún vínculo entre los tiros, la posesión o los pases y los resultados de los partidos de fútbol. Esto apoya la idea de que las metas son el único factor que vale la pena considerar.
¿Por qué podría ser útil xG?
La debilidad de Dixon-Coles viene en la cantidad de datos. Había 1.071 goles marcados en la temporada 2021/22 de la Premier League, que puede parecer mucho. Sin embargo, esto es solo 2,82 goles por partido. Para contrarrestar esta falta de información por juego, Dixon y Coles usaron datos de tres años para hacer sus predicciones, a pesar de que la mayoría de los equipos experimentaron cambios masivos en el personal administrativo y de juego durante este período.
Aumentar la cantidad de datos en una escala de tiempo más corta es donde los datos xG tienen una ventaja sobre los objetivos solos. Esencialmente, es un intento de encontrar el equilibrio entre la calidad de los datos de goles y la cantidad de datos basados en tiros. Este es un enigma clásico en estadística conocido como el compensación sesgo-varianza.
Tomemos el partido Liverpool vs. Tottenham mencionado anteriormente. Los tres goles marcados son las únicas piezas de información que el modelo Dixon-Coles puede extraer de este partido, mientras que un modelo basado en xG obtendría información de los 27 tiros realizados, con la cualidad adicional de tener alguna indicación de la probabilidad de esos tiros. resultara en un gol. Sin embargo, no tener en cuenta quién está involucrado en un disparo pone un límite a la calidad de estos datos xG.
A pesar de tener 25 años, el modelo de Dixon-Coles sigue siendo el estándar de oro de la predicción de fútbol, como se encuentra en este estudio de 2022. Si bien xG brinda buena información sobre el equilibrio del juego en un solo partido, ningún modelo xG ha demostrado ser superior a Dixon-Coles para predecir el futuro.
Hasta que eso suceda, permanecerán las dudas sobre sus debilidades y los objetivos reales deben conservar su lugar como el único indicador verdaderamente fiable de lo bueno que es un equipo.
Este artículo se vuelve a publicar de La conversación bajo una licencia Creative Commons. Leer el artículo original.
Citación: Una breve historia de las estadísticas en el fútbol: por qué los goles reales siguen siendo el rey para predecir quién ganará (30 de diciembre de 2022) recuperado el 1 de enero de 2023 de https://phys.org/news/2022-12-history-statistics-soccer- objetivos-reales.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.