Analisis de equipos y jugadores del futbol argentino
1. Trabajo Final AID - An´alisis de equipos y
jugadores del f´utbol argentino
Pablo Mat´ıas Tempone
A˜no 2017
1
2. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
´Indice
1. Introducci´on y objetivos 3
2. Descripci´on de la base de datos 4
2.1. Sumario de variables . . . . . . . . . . . . . . . . . . . . . . . 4
2.2. Caracter´ısticas de la base . . . . . . . . . . . . . . . . . . . . 6
3. Aplicaci´on de t´ecnicas con el foco en los jugadores 7
3.1. An´alisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . 7
3.2. Correlaci´on en las variables . . . . . . . . . . . . . . . . . . . 11
3.3. An´alisis de componentes principales . . . . . . . . . . . . . . 12
3.4. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.5. ¿Los jugadores son m´as ofensivos cuando son locales? . . . . 18
3.5.1. Exploraci´on de las poblaciones . . . . . . . . . . . . . 18
3.5.2. Prueba de la hip´otesis . . . . . . . . . . . . . . . . . . 20
4. Aplicaci´on de t´ecnicas con el foco en los equipos 23
4.1. An´alisis de componentes principales . . . . . . . . . . . . . . 23
4.2. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3. ¿Qu´e equipos son parecidos entre s´ı? . . . . . . . . . . . . . . 29
4.3.1. Variables de cada aspecto . . . . . . . . . . . . . . . . 29
4.3.2. Caras de Chernoff . . . . . . . . . . . . . . . . . . . . 30
5. Bonus Track - Marcelo Meli como contrataci´on 32
2
3. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
1. Introducci´on y objetivos
Cada vez hay m´as datos deportivos sobre equipos, jugadores profesio-
nales e incluso sobre divisiones inferiores. Pero lo que se observa en las
instituciones en Latinoam´erica es que sus tomas de decisiones no se apo-
yan en el an´alisis de esa informaci´on. En este trabajo se identificar´an las
caracter´ısticas de los jugadores a trav´es de sus datos (tiros al arco, quites,
atajadas, disparos al arco, goles, asistencias, etc.).
Existe el mito de que el equipo que juega de local es el que va a buscar el
partido y el visitante, en consecuencia, esperara a ver qu´e jugadas hace el
rival para esconder sus caracter´ısticas habituales de juego. Se verificar´a si
ese mito se sustenta o no.
Luego se pasar´a a un an´alisis global del equipo. Para ello, se crear´an agru-
pamientos basados en los rendimientos deportivos y se tratar´a de ver si hay
clubes parecidos entre s´ı.
Por ´ultimo, el estudio se centrar´a en un caso (la contrataci´on de Marcelo
Meli) para evaluar si el jugador cumple con el rol de volante externo que
necesitaba el plantel de Racing.
3
4. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
2. Descripci´on de la base de datos
Se cuenta con 4 bases de datos de estad´ısticas sobre los comportamientos
de los jugadores en cada partido disputado desde 2013 a 2016.
2.1. Sumario de variables
A continuaci´on se detallan las variables pertenecientes al set de datos.
4
6. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Se usar´an variables de goles por equipo para determinar el resultado del
partido. Se promediar´an las variables de rendimientos por partido seg´un
los minutos jugados. As´ı se igualar´a los jugadores que disputaron m´as
partidos con los que menos partidos disputaron. Adem´as, se crear´a una
variable para identificar si el futbolista jug´o de visitante o local.
2.2. Caracter´ısticas de la base
La base cuenta con 40860 registros y 35 variables. Corresponde a los
torneos de primera divisi´on disputados de 2013 a 2016. Fue provista por la
empresa DataFactory para el desarrollo de este informe acad´emico.
Los datos fueron entregados en cuatro archivos xlsx, uno por cada a˜no. El
procesamiento y an´alisis se hizo con R y Rstudio.
6
7. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
3. Aplicaci´on de t´ecnicas con el foco en los juga-
dores
3.1. An´alisis exploratorio
Se analizan las caracter´ısticas de los jugadores para visualizar patrones.
Figura 1: Caracter´ısticas de los jugadores
Se puede observar que hay un grupo que tiene niveles m´as altos de ata-
jadas, lo que los identifica como arqueros.
Para poder identificar a futuro como ponderar a los jugadores suplentes
en el rendimiento de los equipos, se generaron algunas visualziaciones para
entender su participaci´on en minutos jugados de titulares y suplentes.
7
8. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 2: Minutos jugados por titularidad
8
9. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 3: Minutos jugados por titularidad
9
10. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
No es lo mismo ponderar a todos los jugadores suplentes, por eso se ana-
liza la participaci´on de ellos seg´un su posici´on.
Para los fines de este trabajo se reemplazar´an las variables originales por
una proporci´on de los minutos disputados en cada partido, de esta manera
se igualan los valores de participaci´on de cada jugador por cada minuto
disputado.
Figura 4: Rol del jugador por titularidad
10
11. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Ac´a se empiezan a ver datos interesantes: los entrenadores suplantan de-
lanteros en una proporci´on mayor a otra clase de jugadores. Es decir, los
delanteros suplentes tienen m´as posibilidades de ingresar a un partido que
los defensores. Esto tambi´en plantea que los t´ecnicos hacen muy pocos cam-
bios defensivos.
3.2. Correlaci´on en las variables
¿Hay correlaciones en las variables analizadas?
Figura 5: Correlograma
No se encuentran altas correlaciones, tampoco una llamativa. La correla-
ci´on mayor es la que ocurre entre disparos desde fuera del ´area y la cantidad
de disparos atajados. La relaci´on es obvia, dado que a mayor cantidad de
tiros desde larga distancia, m´as sencillo es para el arquero atajar esos dis-
paros. Por lo que se continuar´a con otro tipo de an´alisis para reducir la
dimensionalidad.
11
12. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
3.3. An´alisis de componentes principales
Se va a realizar un an´alisis de componentes principales sobre el set de
datos, primero se revisar´a que cantidad de componentes son los ´optimos pa-
ra mantener:
Figura 6: Screeplot
En la Figura 6 se observa que, utilizando el criterio del bast´on roto, se
estabiliza luego del quinto componente la variabilidad explicada por cada
componente extra. Bas´andonos en esta t´ecnica, con 5 componentes nos al-
canza para explicar la variabilidad del dataset.
Para simplificar la visualizaci´on y el an´alisis se usar´an los dos primeros com-
ponentes.
A continuaci´on se grafican los dos primeros componentes:
12
13. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 7: PCA Jugadores 1era divisi´on Argentina
13
14. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 8: Factor Map
Se puede ver c´omo en cada cuadrante se visualizan las caracter´ısticas m´as
destacadas de cada posici´on. En cada cuadrante se visualizan las caracter´ısti-
cas m´as destacadas de cada posici´on. En el cuadrante superior izquierdo, se
observan las caracter´ısticas propias de los defensores. En el inferior izquier-
do, las acciones m´as comunes de los arqueros: las atajadas.
Los delanteros est´an en todo el eje inferior a la dim 2, que es donde se desta-
can los tiros que les atajaron, los goles convertidos y los offsides (posiciones
fuera de juego) que sufrieron por jugar adelantados.
Por ´ultimo, en el cuadrante superior derecho, se agrupan caracter´ısticas de
los medio campistas, ´estas son los pases y las faltas recibidas y hechas. Al
estar en la zona de mayor poblaci´on de jugadores, se observan m´as faltas.
3.4. Clustering
En esta etapa se busca encontrar una agrupaci´on para los jugadores. Los
resultados fueron interesantes.
Se hallaron 3 grupos:
14
15. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 9: Cluster Jer´arquico
15
16. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 10: Cluster Jer´arquico
16
17. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 11: PCA Clusters
Lo que se ve en los distintos clusters, es que se separa a los arqueros
de los dem´as jugadores en el “Cluster 1”. Y que los “Cluster 2” y “Clus-
ter 3” marcan una diferencia entre jugadores ofensivos y defensivos. Esta
diferenciaci´on es interesante ya que no siempre es f´acil saber qu´e jugadores
mediocampistas tienen m´as orientaci´on defensiva que ofensiva.
En la figura siguiente se combinan las variables con los clusters para reforzar
el concepto.
:
17
18. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 12: Biplot con clusters
3.5. ¿Los jugadores son m´as ofensivos cuando son locales?
En la previa a un partido, se suelen escuchar frases como ”juegan de lo-
cal, seguramente vayan a buscar el partido”. Esa suposici´on se repite tanto
en programas deportivos como entre los hinchas de los clubes. La frase asu-
me que los jugadores se compartan de distinta manera, seg´un sean visitantes
o locales.
3.5.1. Exploraci´on de las poblaciones
Para verificar la teor´ıa anterior se analizar´a el comportamiento de los
jugadores en una variable que demuestra vocaci´on ofensiva, como se vio en
el an´alisis de componentes principales y de clusters, al ser una caracter´ıstica
destacada de jugadores ofensivos: “pr disparo afuera”.
18
19. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 13: Densidad de disparos al arco de afuera del ´area
19
20. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 14: Boxplot de disparos al arco de afuera del ´area
Si bien en el gr´afico de densidad se notan algunas diferencias, cuando se
analizan los boxplots esas disimilitudes no parecen tan llamativas.
Otro rasgo que se observa es que no son poblaciones con distribuciones nor-
males.
3.5.2. Prueba de la hip´otesis
A continuaci´on se har´a la prueba de los rangos con signo de Wilcoxon
para ver si existen diferencias en los comportamientos de los jugadores de
visitante y de local.
Como preparaci´on previa, en el an´alisis se tomar´a s´olo a los jugadores que
se desempe˜naron como titulares y suplentes. Es decir, que ocuparon los dos
roles.
Planteo de la hip´otesis:
20
21. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Los jugadores de local y de visitante hicieron la misma cantidad de tiros
al arco.
H0:θ1 − θ2 = 0
Hip´otesis alternativa:
Hay evidencia de que los jugadores de visitante no se comportan igual
que jugando como local.
Ha:θ1 − θ2 = 0
Grupo media sd
L 0.006147214 0.009922329
V 0.004926489 0.006696114
Cuadro 2: Medias y desv´ıos por grupo
Se hace el test de Wilcoxon sobre el listado de los jugadores y se ve lo
siguiente:
wilcox . t e s t ( jugadores t i r o s $L, jugadores t i r o s $V, paired = TRUE)
Wilcoxon signed rank test with continuity correction
data: jugadores tiros$L and jugadores tiros$V
V = 395180, p-value = 2.404e-13
alternative hypothesis: true location shift is not equal to 0
Conclusi´on: con un 0.05 de significaci´on, los futbolistas argentinos no se
comportan ofensivamente de la misma manera cuando son locales o visitan-
tes.
21
22. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Esto da soporte a la suposici´on popular, quiz´as la preparaci´on para par-
tidos se tendr´ıa que centrar en lograr llevar a niveles similares los tiros
realizados por los jugadores cuando juegan en su cancha que cuando juegan
de visitante.
Como vimos antes, encontramos una leve correlaci´on entre estos dos facto-
res, donde obviamente m´as tiros equivalen a m´as chances de realizar goles.
Figura 15: Disparos de afuera vs Goles convertidos
22
23. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
4. Aplicaci´on de t´ecnicas con el foco en los equipos
En esta secci´on se pondr´a como centro del an´alisis las caracter´ısticas de
los 33 equipos durante las temporadas del 2013 a 2016, dividir´e el an´alisis
en 3 partes, un an´alisis de componentes principales, otro de agrupamientos,
finalmente, visualizaremos con las caras de Chernoff los distintos equipos.
Para la preparaci´on vamos a promediar los valores totales de cada variable
por la cantidad de partidos jugados para igualar a todos los equipos.
Antes de empezar a ver que nos “dicen” los datos, vamos a repasar
como se clasifican los equipos hist´oricamente denominados “grandes”: Boca,
Independiente, Racing, River y San Lorenzo.
Luego se pueden tomar discusiones para ver cual es el 6to grande y de ah´ı
en adelante.
Se ver´a si con los datos de los ´ultimos 4 a˜nos encontramos nuevas maneras
de agruparlos.
4.1. An´alisis de componentes principales
Veremos a continuaci´on como se ubican los equipos una vez que aplica-
mos PCA, que tienen en com´un y que caracter´ısticas son las que destacan
en cada uno.
Para esto se grafic´o un biplot y se analiz´o en qu´e cuadrante se coloca
cada equipo.
23
24. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 16: Biplot equipos
24
25. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 17: Biplot caracter´ısticas de cada cuadrante
Resulta interesante ver que si bien cantidad de goles, tiros y asistencias
hacen que un equipo sea mejor, las dos caracter´ısticas que son diferenciado-
ras a la hora de destacarse son la cantidad de pases correctos y de quites;
la sumatoria de esas dos variables con las anteriores hacen que un equipo
tenga m´as posibilidades de estar en los primeros puestos.
4.2. Clustering
Se ver´a en cuantos clusters podemos dividir a los distintos equipos. Estas
ser´ıan agrupaciones en donde se toma en cuenta solamente el rendimiento
de sus jugadores dentro del campo.
Resultar´ıa interesante agregar a estos datos cantidad de socios, rating tele-
visivo, ya esos datos nos dar´ıan tambi´en una idea de la gente que sigue a los
clubes y no solo por rendimientos deportivos.
Esto quedar´a para agregar en un futuro de ser posible.
25
26. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
subsubsectionPartici´on en dos grupos
Como se ver´a a continuaci´on la primera separaci´on que se nota es que
hay dos grandes grupos de equipos, representamos como quedar´ıan.
Figura 18: Cluster Jer´arquico de Equipos
26
27. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 19: Cluster de Equipos
27
28. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 20: Biplot con Clusters de equipos
Parece ser que los equipos m´as ofensivos se encuentran en un grupo y
el resto en el otro. Como se ve en la Figura 20 lo primero que la dimen-
si´on 1, aquella que destaca la mayor cantidad de situaciones ofensivas, goles,
asistencias realizadas, es donde se encuentran los equipos que suelen tener
torneos m´as destacados. Otro detalle es que los “5 grandes” del f´utbol argen-
tino se encuentran en ese grupo, a pesar de que varios de ellos como Racing
e Independiente tienen torneos irregulares, todav´ıa siguen perteneciendo a
este grupo de equipos ofensivos.
28
29. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 21: Biplot con Clusters de equipos
Este tipo de agrupamientos y visualizaciones permitir´ıa ver si los can-
didatos se pueden preveer de manera m´as simple sabiendo el jugador que
incorporan y sus cualidades para conocer que aportar´ıa en el nuevo equipo.
4.3. ¿Qu´e equipos son parecidos entre s´ı?
Tenemos 33 equipos en este an´alisis; podemos decir que Lan´us (con Al-
mir´on como DT) y San Lorenzo (con Aguirre como DT) tienen ideas simila-
res, pero cuando comparamos varias temporadas para ver si en el tiempo se
sostienen ideas, ¿podemos decir con tanta seguridad qu´e equipos presentan
ideas parecidas?
Para esto se aplic´o la t´ecnica “caras de Chernoff”, para ver de una ma-
nera m´as amigable que equipos se parecen entre s´ı y como se diferencian.
4.3.1. Variables de cada aspecto
En el siguiente cuadro se ve qu´e aspecto de la cara afecta cada variable.
29
30. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
modified item Variable
1 height of face pr goles convertidos
2 width of face pr asistencias
3 structure of face pr disparo afuera
4 height of mouth pr disparo atajado
5 width of mouth pr faltas
6 smiling pr faltas recibidos
7 height of eyes pr offsides
8 width of eyes pr amarillas
9 height of hair pr expulsados
10 width of hair pr pase correcto
11 style of hair pr incorrecto
12 height of nose pr despejes
13 width of nose pr quites
14 width of ear pr atajadas
15 height of ear pr goles convertidos
Cuadro 3: Variables y Aspecto que modifican
4.3.2. Caras de Chernoff
Ya se demostr´o c´omo podemos agrupar a los equipos, ahora, se ver´a
cu´ales se parecen entre s´ı.
Figura 22: Equipos y sus caras
Lo primero que resulta interesante observar es que Atl´etico de Tucum´an
30
31. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
es bastante particular, porque no es f´acil encontrarle similitudes con el resto
de los planteles. Si nos ponemos a pensar cu´al fue la consecuencia de este
comportamiento, la encontramos en que es la primera vez en la historia que
juega la copa Libertadores. ¿Un equipo con pocos recursos necesita encon-
trar combinaciones distintas para poder lograr esos hitos? Es una pregunta
interesante de plantear.
Entre los equipos que no tuvieron buenos rendimientos pareciera haber bas-
tante similitudes; Sarmiento, Temperley, All Boys, Argentinos Juniors, Olim-
po, Crucero del Norte. Equipos que descendieron o tuvieron muy malos tor-
neos.
Podr´ıamos continuar con este juego de parecidos, la realidad es que esto sirve
para ver r´apidamente si nuestro objetivo es parecernos al equipo campe´on,
que tan distintos somos, ¿somos parecidos River Plate o a Sarmiento?
31
32. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
5. Bonus Track - Marcelo Meli como contrataci´on
Como bonus de este informe realizar´e un an´alisis muy individual: el ob-
jetivo es ver si Racing, que necesitaba un jugador que se desempe˜ne como
volante por derecha termin´o incorporando a Marcelo Meli, tiene m´as pare-
cido con mediocampistas del tipo defensivo o con el “Huevo” Acu˜na, que es
un jugador con mucha llegada ofensiva y aporte en lo defensivo.
Para esto se compara a Meli con Aued, Cerro, Acu˜na, Gonz´alez (alias
“Pulpito”),Gast´on D´ıaz y Videla. La primera comparaci´on se realiz´o con
una gr´afico de radar.
Figura 23: Mediocampistas de Racing
Lo primero que se ve a simple vista es que Meli es muy parecido a
Gonz´alez, lo que rescata el diario Ol´e de donde se tiene pensado ponerlo,
“¿D´onde jugar´ıa Meli? Cocca lo piensa como volante por derecha en el 4-4-2
o interno en el 4-3-3 , funci´on que m´as ha cumplido en su carrera.”, esto
podr´ıa parecer una contradicci´on, se busca un jugador por afuera pero no
tiene caracter´ısticas de un jugador que llegue y brinde asistencias, tampoco
que llegue al gol.
Tiene caracter´ısticas muy parecidas a Aued y a Gonz´alez, por lo que la po-
sici´on de externo no parecer´ıa que le siente natural, ya que un jugador que
tendr´ıa que tener caracter´ısticas similares pero cumplir el rol por la derecha
del campo es Acu˜na y no se parece a este jugador.
32
33. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 24: Mediocampistas de Racing
Chernoff parece estar de acuerdo con las primeras apreciaciones, lo que
queda entonces por ver antes que comience el torneo es, ¿la capacidad del
t´ecnico para pensar que un jugador puede cumplir funciones que no viene
realizando es superior a lo que los datos dicen acerca del jugador?
33
34. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Referencias
Lˆe, S., Josse, J. Husson, F. (2008). FactoMineR: An R
Package for Multivariate Analysis. Journal of Statistical
Software. 25(1). pp. 1-18.
Pe˜na, Daniel. An´alisis de Datos Multivariantes.
Chan, D´ebora (2016). An´alisis de Componentes Princi-
pales.
Chan, D´ebora (2016). Contrastes de Homogeneidad e
Independencia.
Chan, D´ebora (2016). Comparaci´on de Medias- ANOVA-
Hotelling.
Chan, D´ebora (2016). Clusters.
34