El proyecto "Utilización de Big Data para mejorar la Toma de Decisiones en el Fútbol" fue el ganador en la categoría de Big Data en el Hackathon 'Tech Cup', organizado por Microsoft y River Plate entre otros. El alcance y la profundidad del análisis del caso práctico son acordes a una presentación de 5 minutos. En ese ámbito, elegimos enfocarnos solamente en la parte ofensiva y utilizar los refuerzos como única forma de mejora.
Utilización de Big Data para mejorar la Toma de Decisiones en el Fútbol
1. Utilización de Datos y
Estadísticas para Mejorar
la Toma de Decisiones en
el Fútbol
Andre Brener
Mathijs Steneker
Tech Cup - Categoría Big Data
22 de Agosto de 2016
2. Ingeniero Industrial, ITBA.
Data Science en Jampp.
Defensor.
Andre Brener Mathijs Steneker
Master en Gestión de Información, RSM.
Inteligencia de datos en DataFactory.
Mediocampista.
@andre_brener @Mister_Numbers
3. “Después de un partido siempre
miro las estadísticas (...) Hay
veces en donde los datos dicen
cosas totalmente diferentes a
las que yo vi, pero hasta en las
veces que coinciden, las
estadísticas me dan una mejor
perspectiva”.
Arsene Wenger, Director Técnico
4.
5. Mejorar rendimiento de los
jugadores y del equipo
Aprovechar mejor las
debilidades de rivales
Identificar talentos para
reforzar al equipo
10. La mayoría de los tiros no son peligrosos
Puesto 22 en
Creación de
Tiros peligrosos
11. Gol
Tiro al Palo
Tiro al Arco
Tiro Desviado
La ubicación del círculo indica la posición en la cual se realizó el tiro.
El tamaño del círculo es proporcional a la probabilidad de gol del tiro posterior (sin importar el resultado).
Porque
muchos tiros
son de media
distancia
12. La ubicación del círculo indica la posición en la cual se realizó el pase.
El tamaño del círculo es proporcional a la probabilidad de gol del tiro posterior (sin importar el resultado).
Gol
No Gol
Y sus mejores
ataques suelen
venir por las
bandas
13. Dejando al
centrodelantero
fuera del circuito
de juego
Líneas: pases. Grosor y oscuridad indica cantidad de pases.
Tamaño del Círculo: pases totales completados.
Posición del Círculo: posición promedio
Intensidad del Color: Participación en Goles Esperados
Líneas para 3+ passes
Solamente jugadores titulares
13era Fecha, Torneo Primera División 2016
vs
15. Fernando Belluschi Miguel Almirón
Pablo Barrientos
Giovani Lo CelsoFernando Luna
Gabriel SanabriaBrian Sarmiento
Nicolás Lodeiro
Claudio Aquino
Lucas Salas
Augusto Solari
Santiago Rosales
Mejores Creadores de Juego del Torneo
16. La ubicación del círculo indica la posición en la cual se realizó el pase.
El tamaño del círculo es proporcional a la probabilidad de gol del tiro posterior.
Gol
No Gol
Gabriel Sanabria
24 años
Unidades en por 90 Minutos
Goles
% de
Pases
Correctos
Asistencias
Pases
previos a un
Tiro
% de
Precisión
de Tiros
Tiros
Totales
D’Alessandro
Sanabria
17. El Futuro del Big Data en el Fútbol
Mayor cantidad y disponibilidad de datos
Mayor competitividad entre equipos
Complementación del ojo humano con Big Data
Los datos dan una perspectiva que los ojos no ven.
Por dos cosas nos gusta esta cita: una de las personas más importantes en el fútbol valora el uso de datos. Y queda claro que hay una interacción entre lo que ven los ojos y lo que muestran los datos. No funcional sólos, se complementan.
El objetivo es que se repita la foto lo máximo posible
Como podemos hacer esto, encontramos 3 puntos en los que Big Data nos puede ayudar.
En la presentación, usemos los texto de la slide 25:Optimizar decisiones en el juego
Optimizar características de los jugadores
Analizar rendimiento de cada jugador y formación del equipo
Mejores estrategias
Acciones y situaciones que se repiten y que puedes aprovechar
Detalles que no son visibles al ojo humano
Optimización de tiempo de video (analisis)
Scouting
Búsquedas amplias
No hay necesidad de mandar scouts a todas las canchas ni ver todos los videos
Buscar jugadores con características necesarias y enfocar el scouting en esos
A partir de programas en excel y python desarrollamos las siguientes cosas
Para contar en la presentación:
Lo más importante en el fútbol es el resultado, y los goles que se hacen y se reciben generan esos resultados.
No podemos quedarnos sólo en el resultado, y tampoco no sólo en los goles. Los goles no son frecuentes (2,5 por partido en 2016) y tienen mucha aleatoriedad. Puedes hacer todo bien pero termina el balón en el palo, o un mal intento termina siendo gol por error del arquero. No dan una buena base para hacer tus análisis y sacar conclusiones.
Nuestro modelo, que forma una base del resto que vas a ver, se enfoca en tiros (casi 21 por partido). Pero un disparo no es el otro: un remate de 35 metros no es lo mismo que un pase al hueco y un mano-a-mano con dos jugadores. Además el “outcome” del tiro impacta mucho tu percepción del tiro. El modelo que hemos desarrollado asigna un valor entre 0 y 1 a cada disparo.Ese número indica la probabilidad que el tiro entre al arco. Esto está basado en situaciones históricas que fueron parecidas (unas 35,000). La variable más importante es el ángulo al gol (imagen), también tiene en cuenta el tipo de asistencia, el estado del partido, el minuto y mucho más que tiene que ver con la situación del juego. Lo que vas a ver después se basa mucho en este modelo.
Enfoque en ataque y torneo local
En este análisis corto solo tocamos la parte del ataque
Patea de larga distancia porque parece que les cuesta entrar por el medio como muestra esta mapa.
Importante: terminar con la frase que se juega mucho por las bandas para introducir prox slide.
Queda aislado Alario. No tiene vínculo con Pisculichi, ni con los volantes extremos. Martínez parece la última estación del ataque.
Los mejores pasadores los torneos.
Son los que crean las mejores situaciones de tiros para sus compañeros.
Hay unos que ya son reconocidos, pero hay otros que no están tan obvios, pero el Big Data nos ayudó a encontrarlos.
Seleccionamos tres de los anteriores. Parecen los más interesantes por los aspectos de edad, factibilidad de fichaje y calidad de pases desde el centro.