Futbolstudio

Métricas avanzadas. El futuro del análisis estadístico en fútbol

Que es el XG? Y el XA?

Últimamente estamos viendo como en páginas webs, foros, tertulias especializadas, etc. se habla de los expected golas y expected assist, de entre otros parámetros dentro de la analítica en el fútbol. Que son? Como se calculan? De que me vale conocerlos? Todas estas preguntas y muchas otras, son las que vamos a tratar de dar respuesta en este artículo.

Métricas avanzadas

El Money Ball ha llegado al fútbol para quedarse, y me atrevo a decir que si no estás preparado para entenderlo y adaptarlo a tu contexto, te vas a quedar atrás en cuanto a formación en fútbol se refiere.

Expected Goals (XG)

Esta métrica valora el rendimiento colectivo o individual de cara al número de goles posibles en función del conjunto de parámetros relacionados con la creación de oportunidades y la calidad de las mismas. En última instancia, esto busca cuantificar cada disparo, con el fin de dar una probabilidad de que se puntúe, o realizar un promedio si se quiere. Se tienen en cuenta varios factores en el análisis:

  • Distancia a portería
  • Ángulo de tiro
  • Claridad de tiro: número de defensores entre el balón y la portería
  • Posición del portero
  • Altura del balón en el momento del tiro
  • Presencia y presión de los oponentes

Aunque XG es un parámetro globalizado en cuanto a terminología, no lo es así en cuanto a la forma de calcularlo, por ello es común ver como no se le otorga el mismo valor de XG a un jugador en un servidor de estadísticas como Opta y en otro como Wyscout. Esto es porque cada servicio adopta sus propios parámetros de evaluación, por ejemplo, mientras unos consideran relevante la altura del balón en el momento del tiro a puerta, otros no.

Los dos parámetros más relevantes del XG son el posicionamiento en el momento del tiro y la presencia de oponentes entre el balón y la portería.

Aunque muchos malinterpretan XG como un concepto definitivo; los equipos o jugadores rara vez se acercarán a alcanzar exactamente sus valores de xG, lo que se debe a la variabilidad y aleatoriedad del fútbol. En última instancia, todo esto se considera probabilística.

Los futbolistas de élite son lo suficientemente buenos como para marcar goles tirando desde fuera del área, aunque estadísticamente sea mucho menos probable anotar desde ahí que desde dentro del área, la decisión en un partido puede llevar al jugador a decidir finalizar la jugada.

Por supuesto, es importante tener en cuenta que el análisis estadístico no puede introducir en su ecuación elementos que pueden afectar a la calidad del disparo, como los errores humanos a nivel técnico, el estrés, la variabilidad de la percepción etc. ¿Acaso Cristiano Ronaldo o Messi no han fallado goles claros alguna vez? Sin embargo, si atendemos a los xG podemos observar como el valor suele acercarse al resultado final de goles marcados.

Para entender estos mucho mejor vamos a ver el caso de Messi durante esta temporada, gracias a los datos aportados por Understat.

En el siguiente gráfico podemos ver en verde los 4 goles que ha marcado Messi esta temporada. Uno de ellos desde una posición de gol probable bastante difícil. También podemos ver como, atendiendo a sus oportunidades y al cuadro de datos, Messi debería llevar un mínimo de goles más de los que ha marcado hasta ahora.

Esta variabilidad entre el resultado de las matemáticas y la realidad es lo que debes entender y tener en cuenta cuando valores los datos. Quizás no sea el mejor inicio de temporada de la carrera de Messi, sin embargo a nivel goleador, por oportunidades generadas, lo normal hubiese sido que Messi llevara al menos 6-7 goles en los 10 primeros partidos.

XG Messi

XG Messi oportunidades

Dicho esto, xG no es necesariamente una herramienta para evaluar si un resultado fue «justo» o no; un equipo que crea un xG más alto que su oponente sería, desde una perspectiva probabilística, considerado más probable de ganar el juego ya que la calidad – y la cantidad probable – de oportunidades de tiro que están generando son mucho mejores. Sin embargo, cada fin de semana vemos como se producen resultados adversos en contra de la probabilística.

 

¿Como se mide el xG?

Los penaltis son el ejemplo más sencillo de entender de xG. En promedio, el 79% de los penaltis acaban en gol en la élite. Dado que xG traduce las probabilidades de gol de porcentajes a decimales, se lee como 0,79.

Como ya hablamos anteriormente, los goles esperados al igual que otras métricas complejas pueden calcularse de múltiples formas, derivadas de introducir más o menos parámetros en la ecuación. Si quieres empezar con un calculo sencillo puedes optar por la siguiente fórmula, en la cual se consideran solo los tiros a puerta realizados, independientemente de parámetros como el posicionamiento o la presión:

xG=0.10×tiro a puerta

Es un cálculo simple, pero realmente el promedio de un equipo a nivel profesional ( no podemos dar los promedios de clubes amateur porque no existen tantos datos analizados) es del solo 0,10% de los tiros a puerta convertidos en goles

Métrica avanzada para el xG

Un enfoque más sofisticado es agrupar los datos de acuerdo con el tipo de disparo (por ejemplo, dentro o fuera del área, de cabeza o con el pie) y asignar una probabilidad diferente para cada clase. De hecho, así es como funcionan algunos modelos xG, y funcionan mejor que el modelo primario de todos los disparos iguales.

Otros aplican modelos matemáticos mucho más complejos, pero estos están reservados para el Big Data, de modo que si tienes acceso a la información para tu club, porque éste está en la élite, probablemente no vas a necesitar calcular los XG ya que la propia plataforma de datos te va a dar la métrica final.

Vamos a hablaros entonces del Gradient Boosted Model (GBM). En un GBM, una IA aprende un conjunto de árboles de decisión y recorre el árbol para determinar el valor de xG. Este modelo también le indica qué propiedades de disparo (o características en la terminología del aprendizaje automático) tienen más peso para determinar la decisión. Encontramos que las siguientes propiedades son las más importantes.

  • Distancia desde la meta: generalmente, cuanto más cerca esté, mayor será el xG.
  • Ángulo de disparo: generalmente, cuanto más agudo es el ángulo, menor es el xG.
  • Tipo de tiro – ¿Fue con el pie fuerte, el pie débil o un cabezazo?
  • Jugada – ¿Fue de juego abierto o de una jugada a balón parado?
  • Creación de oportunidades: ¿la oportunidad vino de un centro, un pase directo, etc.?
  • El disparo: ¿fue de un rebote, vino después de vencer a un oponente, etc.?

A partir de estas premisas, y sabiendo que no estas aquí para formaros en IA y trabajar para Opta o StatsBomb (Si sois de ese perfil deberíais buscar formación en calculo de Big Data), vamos a crear nuestro propio modelo predictivo casero, para al menos, poder calificar el mediante el xG el valor de nuestras acciones ofensivas o el de nuestros jugadores. Para ello optaremos por dotar de un valor de entre el 1-5 la calidad de la oportunidad en función de varios parámetros, los cuales hemos aprendido anteriormente que son claves para el éxito del disparo, otorgándole una mayor importancia al posicionamiento.

Una vez situada en el campo la ocasión de gol, debemos valorarla en función del resto de parámetros que queremos tener en cuenta. Y tras todo ello, es fundamental ponderar el resultado final en función del promedio de conversión. Ya que nos sabemos cuanto es en cada liga porque nos faltan datos, utilizaremos el promedio de conversión de la primera división que es del 8,2%

Estamos acabando de pulir el modelo, puedes acceder al mismo y a las versiones posteriores o contribuir a mejorarlo en nuestro foro

Asistencias esperadas (xA)

Este parámetro analiza la capacidad de generar ocasiones de gol de un equipo o de un jugador. Todo esto se hace a través de cuantificar el valor de una oportunidad creada. Pero si ya era realmente difícil llegar a un consenso a partir del cual valorar los parámetros que entran en juego para generar una oportunidad de gol, imaginaros los parámetros de un buen pase.
De todos modos, una vez más, este análisis nos permite valorar una tendencia cercana a las posibilidades creativas de un equipo o jugador de fútbol.

Las asistencias esperadas se calculan basándose en la calidad de las oportunidades creadas por el jugador más que en la tasa de conversión. Por lo tanto, un jugador que puede tener un número bajo de asistencias durante una temporada, aún puede tener un valor alto de xA. Podemos ver por ejemplo en el caso actual de La Liga 20-21, que Iago Aspas lidera las xA pero solo ha repartido 2 asistencias por ahora.

xA Iago aspas

Este análisis resulta útil a la hora de diferenciar entre jugadores con el mismo número de asistencias, ya que el concepto de xA nos permite ver cuántas oportunidades reales había creado un jugador independientemente de si esas oportunidades terminaron en gol por parte de uno de sus compañeros o no.

Por lo tanto, se puede concluir que el jugador con un valor xA más alto ha generado un mayor caudal ofensivo de peligro para su equipo.

Progresión con balón

Las métricas progresivas cuantifican el nivel de verticalidad de un equipo, o al menos intentan hacerlo, ya que cuanto más complejo se vuelve el parámetro, mayor variabilidad tendremos entre cálculos de sus proveedores. De modo que una vez más no tenemos una forma exacta de calcular la progresión de balón, aunque si unas claves para hacerlo. Por ejemplo, StatsBomb considera que un pase progresivo es aquel que mueve la pelota al menos 10 metros más cerca de la portería del oponente que cualquier punto en los últimos 6 pases, o un pase que se completa en el área del rival. Excluyen pases del 40% del campo propio.

Quizás para ti este dato no sea útil y consideres que existe otros parámetros importantes para evaluar la progresión del balón, como la capacidad de salida desde atrás, que no se valora en este concepto si utilizamos las métricas de StatsBomb. Es por ello que el concepto en sí mismo es lo importante, y la forma en la que calcularlo, aunque con sentido, debe ser adaptada a lo que el entrenador quiere analizar de su equipo o del rival.

CONCLUSIONES SOBRE LAS MÉTRICAS AVANZADAS

Las métricas avanzadas en el fútbol tratan de aportar información cuantifícable sobre la complejidad del juego. Un deporte como el fútbol depende de tantos parámetros en cada jugada, que nunca se podrá objetivar por completo. ¿Es por ello que tengo que dejar de analizar las métricas de mi equipo o de mi rival? Rotundamente no.

Que no sean exactas no quiere decir que no tengan un gran valor, y es que la progresión en las métricas y sus datos partido tras partido nos pueden dar una visión más profunda y detallada de lo que está pasando a mi equipo o a mi jugador. Entonces, ¿como sacarle el máximo partido a estas mediciones?

Incluso los mayores clubes del mundo y los técnicos que tienen a su lado a grandes equipos de trabajo dedicados en exclusiva a los datos estadísticos, necesitan una síntesis de la información. Es mucho más difícil ver el grano en el monte de paja que si te lo ponen sobre la mesa. Lo primero que debemos hacer es seleccionar cuales son las preguntas que queremos responder. Para que lo entiendas bien, vamos a dejarte una infografía del proceso que has de seguir para seleccionar que métricas son de valor para ti.

Comparte este artículo

Compartir en facebook
Compartir en twitter
Compartir en linkedin
Compartir en pinterest
Compartir en print
Compartir en email

Artículos recientes

Newsletter

Suscribete para recibir todas las novedades al email.

YOUTUBE