SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
Trabajo Final AID - An´alisis de equipos y
jugadores del f´utbol argentino
Pablo Mat´ıas Tempone
A˜no 2017
1
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
´Indice
1. Introducci´on y objetivos 3
2. Descripci´on de la base de datos 4
2.1. Sumario de variables . . . . . . . . . . . . . . . . . . . . . . . 4
2.2. Caracter´ısticas de la base . . . . . . . . . . . . . . . . . . . . 6
3. Aplicaci´on de t´ecnicas con el foco en los jugadores 7
3.1. An´alisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . 7
3.2. Correlaci´on en las variables . . . . . . . . . . . . . . . . . . . 11
3.3. An´alisis de componentes principales . . . . . . . . . . . . . . 12
3.4. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.5. ¿Los jugadores son m´as ofensivos cuando son locales? . . . . 18
3.5.1. Exploraci´on de las poblaciones . . . . . . . . . . . . . 18
3.5.2. Prueba de la hip´otesis . . . . . . . . . . . . . . . . . . 20
4. Aplicaci´on de t´ecnicas con el foco en los equipos 23
4.1. An´alisis de componentes principales . . . . . . . . . . . . . . 23
4.2. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3. ¿Qu´e equipos son parecidos entre s´ı? . . . . . . . . . . . . . . 29
4.3.1. Variables de cada aspecto . . . . . . . . . . . . . . . . 29
4.3.2. Caras de Chernoff . . . . . . . . . . . . . . . . . . . . 30
5. Bonus Track - Marcelo Meli como contrataci´on 32
2
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
1. Introducci´on y objetivos
Cada vez hay m´as datos deportivos sobre equipos, jugadores profesio-
nales e incluso sobre divisiones inferiores. Pero lo que se observa en las
instituciones en Latinoam´erica es que sus tomas de decisiones no se apo-
yan en el an´alisis de esa informaci´on. En este trabajo se identificar´an las
caracter´ısticas de los jugadores a trav´es de sus datos (tiros al arco, quites,
atajadas, disparos al arco, goles, asistencias, etc.).
Existe el mito de que el equipo que juega de local es el que va a buscar el
partido y el visitante, en consecuencia, esperara a ver qu´e jugadas hace el
rival para esconder sus caracter´ısticas habituales de juego. Se verificar´a si
ese mito se sustenta o no.
Luego se pasar´a a un an´alisis global del equipo. Para ello, se crear´an agru-
pamientos basados en los rendimientos deportivos y se tratar´a de ver si hay
clubes parecidos entre s´ı.
Por ´ultimo, el estudio se centrar´a en un caso (la contrataci´on de Marcelo
Meli) para evaluar si el jugador cumple con el rol de volante externo que
necesitaba el plantel de Racing.
3
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
2. Descripci´on de la base de datos
Se cuenta con 4 bases de datos de estad´ısticas sobre los comportamientos
de los jugadores en cada partido disputado desde 2013 a 2016.
2.1. Sumario de variables
A continuaci´on se detallan las variables pertenecientes al set de datos.
4
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
variable q ceros p ceros q NA p NA q inf p inf type unique
fecha 0 0 0 0 0 0 factor 68
torneo 0 0 0 0 0 0 factor 1
cate nombre categoria 0 0 0 0 0 0 factor 1
even id evento 0 0 0 0 0 0 integer 242
local.1 0 0 0 0 0 0 character 30
fixt local goles 1972 26.45 0 0 0 0 integer 6
visitante.1 0 0 0 0 0 0 factor 30
fixt visitante goles 2858 38.34 0 0 0 0 integer 7
perso id personas 0 0 0 0 0 0 integer 842
perso nombre.1 0 0 0 0 0 0 factor 447
perso apellido.1 0 0 0 0 0 0 factor 669
perso apodo 0 0 0 0 0 0 factor 32
rol id rol 0 0 0 0 0 0 integer 7
team.1 0 0 0 0 0 0 character 31
titular 0 0 0 0 0 0 factor 2
minutos jugados 0 0 0 0 0 0 integer 104
goles convertidos 6919 92.81 0 0 0 0 integer 4
goles encontra 7455 100 0 0 0 0 integer 1
asistencias 7104 95.29 0 0 0 0 integer 4
disparo afuera 5656 75.87 0 0 0 0 integer 7
disparo palo 7341 98.47 0 0 0 0 integer 3
disparo atajado 5912 79.3 0 0 0 0 integer 6
penal errado 7442 99.83 0 0 0 0 integer 2
faltas 3660 49.09 0 0 0 0 integer 10
faltas recibidas 3835 51.44 0 0 0 0 integer 9
offsides 6709 89.99 0 0 0 0 integer 7
amarillas 6257 83.93 0 0 0 0 integer 2
doble amarilla 7404 99.32 0 0 0 0 integer 2
rojas 7394 99.18 0 0 0 0 integer 2
pase correcto 939 12.6 0 0 0 0 integer 79
pase incorrecto 1893 25.39 0 0 0 0 integer 21
despejes 4400 59.02 0 0 0 0 integer 20
quites 3739 50.15 0 0 0 0 integer 15
atajadas 6580 88.26 0 0 0 0 integer 10
atajada penal 7446 99.88 0 0 0 0 integer 2
Cuadro 1: Sumario Variables
5
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Se usar´an variables de goles por equipo para determinar el resultado del
partido. Se promediar´an las variables de rendimientos por partido seg´un
los minutos jugados. As´ı se igualar´a los jugadores que disputaron m´as
partidos con los que menos partidos disputaron. Adem´as, se crear´a una
variable para identificar si el futbolista jug´o de visitante o local.
2.2. Caracter´ısticas de la base
La base cuenta con 40860 registros y 35 variables. Corresponde a los
torneos de primera divisi´on disputados de 2013 a 2016. Fue provista por la
empresa DataFactory para el desarrollo de este informe acad´emico.
Los datos fueron entregados en cuatro archivos xlsx, uno por cada a˜no. El
procesamiento y an´alisis se hizo con R y Rstudio.
6
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
3. Aplicaci´on de t´ecnicas con el foco en los juga-
dores
3.1. An´alisis exploratorio
Se analizan las caracter´ısticas de los jugadores para visualizar patrones.
Figura 1: Caracter´ısticas de los jugadores
Se puede observar que hay un grupo que tiene niveles m´as altos de ata-
jadas, lo que los identifica como arqueros.
Para poder identificar a futuro como ponderar a los jugadores suplentes
en el rendimiento de los equipos, se generaron algunas visualziaciones para
entender su participaci´on en minutos jugados de titulares y suplentes.
7
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 2: Minutos jugados por titularidad
8
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 3: Minutos jugados por titularidad
9
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
No es lo mismo ponderar a todos los jugadores suplentes, por eso se ana-
liza la participaci´on de ellos seg´un su posici´on.
Para los fines de este trabajo se reemplazar´an las variables originales por
una proporci´on de los minutos disputados en cada partido, de esta manera
se igualan los valores de participaci´on de cada jugador por cada minuto
disputado.
Figura 4: Rol del jugador por titularidad
10
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Ac´a se empiezan a ver datos interesantes: los entrenadores suplantan de-
lanteros en una proporci´on mayor a otra clase de jugadores. Es decir, los
delanteros suplentes tienen m´as posibilidades de ingresar a un partido que
los defensores. Esto tambi´en plantea que los t´ecnicos hacen muy pocos cam-
bios defensivos.
3.2. Correlaci´on en las variables
¿Hay correlaciones en las variables analizadas?
Figura 5: Correlograma
No se encuentran altas correlaciones, tampoco una llamativa. La correla-
ci´on mayor es la que ocurre entre disparos desde fuera del ´area y la cantidad
de disparos atajados. La relaci´on es obvia, dado que a mayor cantidad de
tiros desde larga distancia, m´as sencillo es para el arquero atajar esos dis-
paros. Por lo que se continuar´a con otro tipo de an´alisis para reducir la
dimensionalidad.
11
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
3.3. An´alisis de componentes principales
Se va a realizar un an´alisis de componentes principales sobre el set de
datos, primero se revisar´a que cantidad de componentes son los ´optimos pa-
ra mantener:
Figura 6: Screeplot
En la Figura 6 se observa que, utilizando el criterio del bast´on roto, se
estabiliza luego del quinto componente la variabilidad explicada por cada
componente extra. Bas´andonos en esta t´ecnica, con 5 componentes nos al-
canza para explicar la variabilidad del dataset.
Para simplificar la visualizaci´on y el an´alisis se usar´an los dos primeros com-
ponentes.
A continuaci´on se grafican los dos primeros componentes:
12
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 7: PCA Jugadores 1era divisi´on Argentina
13
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 8: Factor Map
Se puede ver c´omo en cada cuadrante se visualizan las caracter´ısticas m´as
destacadas de cada posici´on. En cada cuadrante se visualizan las caracter´ısti-
cas m´as destacadas de cada posici´on. En el cuadrante superior izquierdo, se
observan las caracter´ısticas propias de los defensores. En el inferior izquier-
do, las acciones m´as comunes de los arqueros: las atajadas.
Los delanteros est´an en todo el eje inferior a la dim 2, que es donde se desta-
can los tiros que les atajaron, los goles convertidos y los offsides (posiciones
fuera de juego) que sufrieron por jugar adelantados.
Por ´ultimo, en el cuadrante superior derecho, se agrupan caracter´ısticas de
los medio campistas, ´estas son los pases y las faltas recibidas y hechas. Al
estar en la zona de mayor poblaci´on de jugadores, se observan m´as faltas.
3.4. Clustering
En esta etapa se busca encontrar una agrupaci´on para los jugadores. Los
resultados fueron interesantes.
Se hallaron 3 grupos:
14
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 9: Cluster Jer´arquico
15
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 10: Cluster Jer´arquico
16
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 11: PCA Clusters
Lo que se ve en los distintos clusters, es que se separa a los arqueros
de los dem´as jugadores en el “Cluster 1”. Y que los “Cluster 2” y “Clus-
ter 3” marcan una diferencia entre jugadores ofensivos y defensivos. Esta
diferenciaci´on es interesante ya que no siempre es f´acil saber qu´e jugadores
mediocampistas tienen m´as orientaci´on defensiva que ofensiva.
En la figura siguiente se combinan las variables con los clusters para reforzar
el concepto.
:
17
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 12: Biplot con clusters
3.5. ¿Los jugadores son m´as ofensivos cuando son locales?
En la previa a un partido, se suelen escuchar frases como ”juegan de lo-
cal, seguramente vayan a buscar el partido”. Esa suposici´on se repite tanto
en programas deportivos como entre los hinchas de los clubes. La frase asu-
me que los jugadores se compartan de distinta manera, seg´un sean visitantes
o locales.
3.5.1. Exploraci´on de las poblaciones
Para verificar la teor´ıa anterior se analizar´a el comportamiento de los
jugadores en una variable que demuestra vocaci´on ofensiva, como se vio en
el an´alisis de componentes principales y de clusters, al ser una caracter´ıstica
destacada de jugadores ofensivos: “pr disparo afuera”.
18
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 13: Densidad de disparos al arco de afuera del ´area
19
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 14: Boxplot de disparos al arco de afuera del ´area
Si bien en el gr´afico de densidad se notan algunas diferencias, cuando se
analizan los boxplots esas disimilitudes no parecen tan llamativas.
Otro rasgo que se observa es que no son poblaciones con distribuciones nor-
males.
3.5.2. Prueba de la hip´otesis
A continuaci´on se har´a la prueba de los rangos con signo de Wilcoxon
para ver si existen diferencias en los comportamientos de los jugadores de
visitante y de local.
Como preparaci´on previa, en el an´alisis se tomar´a s´olo a los jugadores que
se desempe˜naron como titulares y suplentes. Es decir, que ocuparon los dos
roles.
Planteo de la hip´otesis:
20
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Los jugadores de local y de visitante hicieron la misma cantidad de tiros
al arco.
H0:θ1 − θ2 = 0
Hip´otesis alternativa:
Hay evidencia de que los jugadores de visitante no se comportan igual
que jugando como local.
Ha:θ1 − θ2 = 0
Grupo media sd
L 0.006147214 0.009922329
V 0.004926489 0.006696114
Cuadro 2: Medias y desv´ıos por grupo
Se hace el test de Wilcoxon sobre el listado de los jugadores y se ve lo
siguiente:
wilcox . t e s t ( jugadores t i r o s $L, jugadores t i r o s $V, paired = TRUE)
Wilcoxon signed rank test with continuity correction
data: jugadores tiros$L and jugadores tiros$V
V = 395180, p-value = 2.404e-13
alternative hypothesis: true location shift is not equal to 0
Conclusi´on: con un 0.05 de significaci´on, los futbolistas argentinos no se
comportan ofensivamente de la misma manera cuando son locales o visitan-
tes.
21
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Esto da soporte a la suposici´on popular, quiz´as la preparaci´on para par-
tidos se tendr´ıa que centrar en lograr llevar a niveles similares los tiros
realizados por los jugadores cuando juegan en su cancha que cuando juegan
de visitante.
Como vimos antes, encontramos una leve correlaci´on entre estos dos facto-
res, donde obviamente m´as tiros equivalen a m´as chances de realizar goles.
Figura 15: Disparos de afuera vs Goles convertidos
22
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
4. Aplicaci´on de t´ecnicas con el foco en los equipos
En esta secci´on se pondr´a como centro del an´alisis las caracter´ısticas de
los 33 equipos durante las temporadas del 2013 a 2016, dividir´e el an´alisis
en 3 partes, un an´alisis de componentes principales, otro de agrupamientos,
finalmente, visualizaremos con las caras de Chernoff los distintos equipos.
Para la preparaci´on vamos a promediar los valores totales de cada variable
por la cantidad de partidos jugados para igualar a todos los equipos.
Antes de empezar a ver que nos “dicen” los datos, vamos a repasar
como se clasifican los equipos hist´oricamente denominados “grandes”: Boca,
Independiente, Racing, River y San Lorenzo.
Luego se pueden tomar discusiones para ver cual es el 6to grande y de ah´ı
en adelante.
Se ver´a si con los datos de los ´ultimos 4 a˜nos encontramos nuevas maneras
de agruparlos.
4.1. An´alisis de componentes principales
Veremos a continuaci´on como se ubican los equipos una vez que aplica-
mos PCA, que tienen en com´un y que caracter´ısticas son las que destacan
en cada uno.
Para esto se grafic´o un biplot y se analiz´o en qu´e cuadrante se coloca
cada equipo.
23
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 16: Biplot equipos
24
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 17: Biplot caracter´ısticas de cada cuadrante
Resulta interesante ver que si bien cantidad de goles, tiros y asistencias
hacen que un equipo sea mejor, las dos caracter´ısticas que son diferenciado-
ras a la hora de destacarse son la cantidad de pases correctos y de quites;
la sumatoria de esas dos variables con las anteriores hacen que un equipo
tenga m´as posibilidades de estar en los primeros puestos.
4.2. Clustering
Se ver´a en cuantos clusters podemos dividir a los distintos equipos. Estas
ser´ıan agrupaciones en donde se toma en cuenta solamente el rendimiento
de sus jugadores dentro del campo.
Resultar´ıa interesante agregar a estos datos cantidad de socios, rating tele-
visivo, ya esos datos nos dar´ıan tambi´en una idea de la gente que sigue a los
clubes y no solo por rendimientos deportivos.
Esto quedar´a para agregar en un futuro de ser posible.
25
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
subsubsectionPartici´on en dos grupos
Como se ver´a a continuaci´on la primera separaci´on que se nota es que
hay dos grandes grupos de equipos, representamos como quedar´ıan.
Figura 18: Cluster Jer´arquico de Equipos
26
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 19: Cluster de Equipos
27
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 20: Biplot con Clusters de equipos
Parece ser que los equipos m´as ofensivos se encuentran en un grupo y
el resto en el otro. Como se ve en la Figura 20 lo primero que la dimen-
si´on 1, aquella que destaca la mayor cantidad de situaciones ofensivas, goles,
asistencias realizadas, es donde se encuentran los equipos que suelen tener
torneos m´as destacados. Otro detalle es que los “5 grandes” del f´utbol argen-
tino se encuentran en ese grupo, a pesar de que varios de ellos como Racing
e Independiente tienen torneos irregulares, todav´ıa siguen perteneciendo a
este grupo de equipos ofensivos.
28
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 21: Biplot con Clusters de equipos
Este tipo de agrupamientos y visualizaciones permitir´ıa ver si los can-
didatos se pueden preveer de manera m´as simple sabiendo el jugador que
incorporan y sus cualidades para conocer que aportar´ıa en el nuevo equipo.
4.3. ¿Qu´e equipos son parecidos entre s´ı?
Tenemos 33 equipos en este an´alisis; podemos decir que Lan´us (con Al-
mir´on como DT) y San Lorenzo (con Aguirre como DT) tienen ideas simila-
res, pero cuando comparamos varias temporadas para ver si en el tiempo se
sostienen ideas, ¿podemos decir con tanta seguridad qu´e equipos presentan
ideas parecidas?
Para esto se aplic´o la t´ecnica “caras de Chernoff”, para ver de una ma-
nera m´as amigable que equipos se parecen entre s´ı y como se diferencian.
4.3.1. Variables de cada aspecto
En el siguiente cuadro se ve qu´e aspecto de la cara afecta cada variable.
29
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
modified item Variable
1 height of face pr goles convertidos
2 width of face pr asistencias
3 structure of face pr disparo afuera
4 height of mouth pr disparo atajado
5 width of mouth pr faltas
6 smiling pr faltas recibidos
7 height of eyes pr offsides
8 width of eyes pr amarillas
9 height of hair pr expulsados
10 width of hair pr pase correcto
11 style of hair pr incorrecto
12 height of nose pr despejes
13 width of nose pr quites
14 width of ear pr atajadas
15 height of ear pr goles convertidos
Cuadro 3: Variables y Aspecto que modifican
4.3.2. Caras de Chernoff
Ya se demostr´o c´omo podemos agrupar a los equipos, ahora, se ver´a
cu´ales se parecen entre s´ı.
Figura 22: Equipos y sus caras
Lo primero que resulta interesante observar es que Atl´etico de Tucum´an
30
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
es bastante particular, porque no es f´acil encontrarle similitudes con el resto
de los planteles. Si nos ponemos a pensar cu´al fue la consecuencia de este
comportamiento, la encontramos en que es la primera vez en la historia que
juega la copa Libertadores. ¿Un equipo con pocos recursos necesita encon-
trar combinaciones distintas para poder lograr esos hitos? Es una pregunta
interesante de plantear.
Entre los equipos que no tuvieron buenos rendimientos pareciera haber bas-
tante similitudes; Sarmiento, Temperley, All Boys, Argentinos Juniors, Olim-
po, Crucero del Norte. Equipos que descendieron o tuvieron muy malos tor-
neos.
Podr´ıamos continuar con este juego de parecidos, la realidad es que esto sirve
para ver r´apidamente si nuestro objetivo es parecernos al equipo campe´on,
que tan distintos somos, ¿somos parecidos River Plate o a Sarmiento?
31
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
5. Bonus Track - Marcelo Meli como contrataci´on
Como bonus de este informe realizar´e un an´alisis muy individual: el ob-
jetivo es ver si Racing, que necesitaba un jugador que se desempe˜ne como
volante por derecha termin´o incorporando a Marcelo Meli, tiene m´as pare-
cido con mediocampistas del tipo defensivo o con el “Huevo” Acu˜na, que es
un jugador con mucha llegada ofensiva y aporte en lo defensivo.
Para esto se compara a Meli con Aued, Cerro, Acu˜na, Gonz´alez (alias
“Pulpito”),Gast´on D´ıaz y Videla. La primera comparaci´on se realiz´o con
una gr´afico de radar.
Figura 23: Mediocampistas de Racing
Lo primero que se ve a simple vista es que Meli es muy parecido a
Gonz´alez, lo que rescata el diario Ol´e de donde se tiene pensado ponerlo,
“¿D´onde jugar´ıa Meli? Cocca lo piensa como volante por derecha en el 4-4-2
o interno en el 4-3-3 , funci´on que m´as ha cumplido en su carrera.”, esto
podr´ıa parecer una contradicci´on, se busca un jugador por afuera pero no
tiene caracter´ısticas de un jugador que llegue y brinde asistencias, tampoco
que llegue al gol.
Tiene caracter´ısticas muy parecidas a Aued y a Gonz´alez, por lo que la po-
sici´on de externo no parecer´ıa que le siente natural, ya que un jugador que
tendr´ıa que tener caracter´ısticas similares pero cumplir el rol por la derecha
del campo es Acu˜na y no se parece a este jugador.
32
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Figura 24: Mediocampistas de Racing
Chernoff parece estar de acuerdo con las primeras apreciaciones, lo que
queda entonces por ver antes que comience el torneo es, ¿la capacidad del
t´ecnico para pensar que un jugador puede cumplir funciones que no viene
realizando es superior a lo que los datos dicen acerca del jugador?
33
An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo
Referencias
Lˆe, S., Josse, J. Husson, F. (2008). FactoMineR: An R
Package for Multivariate Analysis. Journal of Statistical
Software. 25(1). pp. 1-18.
Pe˜na, Daniel. An´alisis de Datos Multivariantes.
Chan, D´ebora (2016). An´alisis de Componentes Princi-
pales.
Chan, D´ebora (2016). Contrastes de Homogeneidad e
Independencia.
Chan, D´ebora (2016). Comparaci´on de Medias- ANOVA-
Hotelling.
Chan, D´ebora (2016). Clusters.
34

Más contenido relacionado

Similar a Analisis de equipos y jugadores del futbol argentino

Entrenamiento Físico del Futbolista tomando como referencia La Competición
Entrenamiento Físico del Futbolista tomando como referencia La CompeticiónEntrenamiento Físico del Futbolista tomando como referencia La Competición
Entrenamiento Físico del Futbolista tomando como referencia La CompeticiónMarinoSolares
 
Revista Training futbol 210
Revista Training futbol 210Revista Training futbol 210
Revista Training futbol 210elmaestrosv
 
Reglamento oficial
Reglamento oficialReglamento oficial
Reglamento oficialchamby_cab
 
Training futbol 200
Training futbol 200Training futbol 200
Training futbol 200elmaestrosv
 
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...Antonio José Blanco
 
Redes centralidad y poder en brasil 2014 version panini
Redes centralidad y poder en brasil 2014 version paniniRedes centralidad y poder en brasil 2014 version panini
Redes centralidad y poder en brasil 2014 version paninimfangaritav
 
Revista Training futbol 213
Revista Training futbol 213Revista Training futbol 213
Revista Training futbol 213elmaestrosv
 
Como preparar a un jugador
Como preparar a un jugadorComo preparar a un jugador
Como preparar a un jugadorRonnaldRaffo
 
Modelo de Educación Deportiva (informes)
Modelo de Educación Deportiva (informes)Modelo de Educación Deportiva (informes)
Modelo de Educación Deportiva (informes)Maeztro Alberto
 
Reglas oficiales del voleibol 2013 al 2016
Reglas oficiales del voleibol 2013 al 2016Reglas oficiales del voleibol 2013 al 2016
Reglas oficiales del voleibol 2013 al 2016Mauricio Lozano Almauro
 
Versión incompleta libro Análisis y Lectura de Partidos
Versión incompleta libro Análisis y Lectura de PartidosVersión incompleta libro Análisis y Lectura de Partidos
Versión incompleta libro Análisis y Lectura de PartidosUNAM
 

Similar a Analisis de equipos y jugadores del futbol argentino (20)

Entrenamiento Físico del Futbolista tomando como referencia La Competición
Entrenamiento Físico del Futbolista tomando como referencia La CompeticiónEntrenamiento Físico del Futbolista tomando como referencia La Competición
Entrenamiento Físico del Futbolista tomando como referencia La Competición
 
Revista Training futbol 210
Revista Training futbol 210Revista Training futbol 210
Revista Training futbol 210
 
Reglamento oficial
Reglamento oficialReglamento oficial
Reglamento oficial
 
Analisis planificacion
Analisis planificacionAnalisis planificacion
Analisis planificacion
 
Training Fútbol 207
Training Fútbol 207Training Fútbol 207
Training Fútbol 207
 
Training Fútbol 210
Training Fútbol 210Training Fútbol 210
Training Fútbol 210
 
Sistema de juego en el futbol
Sistema de juego en el futbolSistema de juego en el futbol
Sistema de juego en el futbol
 
Training futbol 200
Training futbol 200Training futbol 200
Training futbol 200
 
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...
Poster prediccion mediante analisis datos de zona destino de tiros a puerta a...
 
1
11
1
 
Redes centralidad y poder en brasil 2014 version panini
Redes centralidad y poder en brasil 2014 version paniniRedes centralidad y poder en brasil 2014 version panini
Redes centralidad y poder en brasil 2014 version panini
 
Revista Training futbol 213
Revista Training futbol 213Revista Training futbol 213
Revista Training futbol 213
 
Taller de practica 32010
Taller de practica 32010Taller de practica 32010
Taller de practica 32010
 
Trabajo 4
Trabajo 4Trabajo 4
Trabajo 4
 
ArsnFútbol
ArsnFútbolArsnFútbol
ArsnFútbol
 
Como preparar a un jugador
Como preparar a un jugadorComo preparar a un jugador
Como preparar a un jugador
 
Modelo de Educación Deportiva (informes)
Modelo de Educación Deportiva (informes)Modelo de Educación Deportiva (informes)
Modelo de Educación Deportiva (informes)
 
Reglas oficiales del voleibol 2013 al 2016
Reglas oficiales del voleibol 2013 al 2016Reglas oficiales del voleibol 2013 al 2016
Reglas oficiales del voleibol 2013 al 2016
 
Andreaymiriam
AndreaymiriamAndreaymiriam
Andreaymiriam
 
Versión incompleta libro Análisis y Lectura de Partidos
Versión incompleta libro Análisis y Lectura de PartidosVersión incompleta libro Análisis y Lectura de Partidos
Versión incompleta libro Análisis y Lectura de Partidos
 

Último

Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfalexanderleonyonange
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdfJC Díaz Herrera
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticJamithGarcia1
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirluis809799
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfJC Díaz Herrera
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfJC Díaz Herrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalMarcosAlvarezSalinas
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICAYOSHELINSARAIMAMANIS2
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllJulietaCarbajalOsis
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptMelina Alama Visitacion
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaRosaHurtado26
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOJuan Carlos Fonseca Mata
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024AndrsReinosoSnchez1
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfDodiAcuaArstica
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfJC Díaz Herrera
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaJoellyAlejandraRodrg
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyraestudiantes2010
 

Último (20)

Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Países por velocidad de sus misiles hipersónicos (2024).pdf
Países por velocidad de sus misiles hipersónicos  (2024).pdfPaíses por velocidad de sus misiles hipersónicos  (2024).pdf
Países por velocidad de sus misiles hipersónicos (2024).pdf
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudirTriptico-del-Bullying qué es, cómo detectarlo, donde acudir
Triptico-del-Bullying qué es, cómo detectarlo, donde acudir
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
Gestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajalGestión Logística maria palmira guti cabajal
Gestión Logística maria palmira guti cabajal
 
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICACNEB-CURRICULO NACIONAL DE EDUCACION BASICA
CNEB-CURRICULO NACIONAL DE EDUCACION BASICA
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllll
 
presentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.pptpresentacion de conjuntos para primaria.ppt
presentacion de conjuntos para primaria.ppt
 
PANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitecturaPANTEÓN DE Paris en historia de la arquitectura
PANTEÓN DE Paris en historia de la arquitectura
 
Panorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATOPanorama Sociodemográfico de México 2020: GUANAJUATO
Panorama Sociodemográfico de México 2020: GUANAJUATO
 
Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024Listas de Fundamentos de Programación 2024
Listas de Fundamentos de Programación 2024
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
Presentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdfPresentacion-Prevencion-Incendios-Forestales.pdf
Presentacion-Prevencion-Incendios-Forestales.pdf
 
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdfPosiciones de México en el PNB PPA per cápita (1982-2024).pdf
Posiciones de México en el PNB PPA per cápita (1982-2024).pdf
 
Qué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problemaQué es un Histograma estadístico teoria y problema
Qué es un Histograma estadístico teoria y problema
 
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
Cesar Vilchis Vieyra  Cesar Vilchis VieyraCesar Vilchis Vieyra  Cesar Vilchis Vieyra
Cesar Vilchis Vieyra Cesar Vilchis Vieyra
 

Analisis de equipos y jugadores del futbol argentino

  • 1. Trabajo Final AID - An´alisis de equipos y jugadores del f´utbol argentino Pablo Mat´ıas Tempone A˜no 2017 1
  • 2. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo ´Indice 1. Introducci´on y objetivos 3 2. Descripci´on de la base de datos 4 2.1. Sumario de variables . . . . . . . . . . . . . . . . . . . . . . . 4 2.2. Caracter´ısticas de la base . . . . . . . . . . . . . . . . . . . . 6 3. Aplicaci´on de t´ecnicas con el foco en los jugadores 7 3.1. An´alisis exploratorio . . . . . . . . . . . . . . . . . . . . . . . 7 3.2. Correlaci´on en las variables . . . . . . . . . . . . . . . . . . . 11 3.3. An´alisis de componentes principales . . . . . . . . . . . . . . 12 3.4. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.5. ¿Los jugadores son m´as ofensivos cuando son locales? . . . . 18 3.5.1. Exploraci´on de las poblaciones . . . . . . . . . . . . . 18 3.5.2. Prueba de la hip´otesis . . . . . . . . . . . . . . . . . . 20 4. Aplicaci´on de t´ecnicas con el foco en los equipos 23 4.1. An´alisis de componentes principales . . . . . . . . . . . . . . 23 4.2. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.3. ¿Qu´e equipos son parecidos entre s´ı? . . . . . . . . . . . . . . 29 4.3.1. Variables de cada aspecto . . . . . . . . . . . . . . . . 29 4.3.2. Caras de Chernoff . . . . . . . . . . . . . . . . . . . . 30 5. Bonus Track - Marcelo Meli como contrataci´on 32 2
  • 3. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 1. Introducci´on y objetivos Cada vez hay m´as datos deportivos sobre equipos, jugadores profesio- nales e incluso sobre divisiones inferiores. Pero lo que se observa en las instituciones en Latinoam´erica es que sus tomas de decisiones no se apo- yan en el an´alisis de esa informaci´on. En este trabajo se identificar´an las caracter´ısticas de los jugadores a trav´es de sus datos (tiros al arco, quites, atajadas, disparos al arco, goles, asistencias, etc.). Existe el mito de que el equipo que juega de local es el que va a buscar el partido y el visitante, en consecuencia, esperara a ver qu´e jugadas hace el rival para esconder sus caracter´ısticas habituales de juego. Se verificar´a si ese mito se sustenta o no. Luego se pasar´a a un an´alisis global del equipo. Para ello, se crear´an agru- pamientos basados en los rendimientos deportivos y se tratar´a de ver si hay clubes parecidos entre s´ı. Por ´ultimo, el estudio se centrar´a en un caso (la contrataci´on de Marcelo Meli) para evaluar si el jugador cumple con el rol de volante externo que necesitaba el plantel de Racing. 3
  • 4. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 2. Descripci´on de la base de datos Se cuenta con 4 bases de datos de estad´ısticas sobre los comportamientos de los jugadores en cada partido disputado desde 2013 a 2016. 2.1. Sumario de variables A continuaci´on se detallan las variables pertenecientes al set de datos. 4
  • 5. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo variable q ceros p ceros q NA p NA q inf p inf type unique fecha 0 0 0 0 0 0 factor 68 torneo 0 0 0 0 0 0 factor 1 cate nombre categoria 0 0 0 0 0 0 factor 1 even id evento 0 0 0 0 0 0 integer 242 local.1 0 0 0 0 0 0 character 30 fixt local goles 1972 26.45 0 0 0 0 integer 6 visitante.1 0 0 0 0 0 0 factor 30 fixt visitante goles 2858 38.34 0 0 0 0 integer 7 perso id personas 0 0 0 0 0 0 integer 842 perso nombre.1 0 0 0 0 0 0 factor 447 perso apellido.1 0 0 0 0 0 0 factor 669 perso apodo 0 0 0 0 0 0 factor 32 rol id rol 0 0 0 0 0 0 integer 7 team.1 0 0 0 0 0 0 character 31 titular 0 0 0 0 0 0 factor 2 minutos jugados 0 0 0 0 0 0 integer 104 goles convertidos 6919 92.81 0 0 0 0 integer 4 goles encontra 7455 100 0 0 0 0 integer 1 asistencias 7104 95.29 0 0 0 0 integer 4 disparo afuera 5656 75.87 0 0 0 0 integer 7 disparo palo 7341 98.47 0 0 0 0 integer 3 disparo atajado 5912 79.3 0 0 0 0 integer 6 penal errado 7442 99.83 0 0 0 0 integer 2 faltas 3660 49.09 0 0 0 0 integer 10 faltas recibidas 3835 51.44 0 0 0 0 integer 9 offsides 6709 89.99 0 0 0 0 integer 7 amarillas 6257 83.93 0 0 0 0 integer 2 doble amarilla 7404 99.32 0 0 0 0 integer 2 rojas 7394 99.18 0 0 0 0 integer 2 pase correcto 939 12.6 0 0 0 0 integer 79 pase incorrecto 1893 25.39 0 0 0 0 integer 21 despejes 4400 59.02 0 0 0 0 integer 20 quites 3739 50.15 0 0 0 0 integer 15 atajadas 6580 88.26 0 0 0 0 integer 10 atajada penal 7446 99.88 0 0 0 0 integer 2 Cuadro 1: Sumario Variables 5
  • 6. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Se usar´an variables de goles por equipo para determinar el resultado del partido. Se promediar´an las variables de rendimientos por partido seg´un los minutos jugados. As´ı se igualar´a los jugadores que disputaron m´as partidos con los que menos partidos disputaron. Adem´as, se crear´a una variable para identificar si el futbolista jug´o de visitante o local. 2.2. Caracter´ısticas de la base La base cuenta con 40860 registros y 35 variables. Corresponde a los torneos de primera divisi´on disputados de 2013 a 2016. Fue provista por la empresa DataFactory para el desarrollo de este informe acad´emico. Los datos fueron entregados en cuatro archivos xlsx, uno por cada a˜no. El procesamiento y an´alisis se hizo con R y Rstudio. 6
  • 7. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 3. Aplicaci´on de t´ecnicas con el foco en los juga- dores 3.1. An´alisis exploratorio Se analizan las caracter´ısticas de los jugadores para visualizar patrones. Figura 1: Caracter´ısticas de los jugadores Se puede observar que hay un grupo que tiene niveles m´as altos de ata- jadas, lo que los identifica como arqueros. Para poder identificar a futuro como ponderar a los jugadores suplentes en el rendimiento de los equipos, se generaron algunas visualziaciones para entender su participaci´on en minutos jugados de titulares y suplentes. 7
  • 8. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 2: Minutos jugados por titularidad 8
  • 9. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 3: Minutos jugados por titularidad 9
  • 10. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo No es lo mismo ponderar a todos los jugadores suplentes, por eso se ana- liza la participaci´on de ellos seg´un su posici´on. Para los fines de este trabajo se reemplazar´an las variables originales por una proporci´on de los minutos disputados en cada partido, de esta manera se igualan los valores de participaci´on de cada jugador por cada minuto disputado. Figura 4: Rol del jugador por titularidad 10
  • 11. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Ac´a se empiezan a ver datos interesantes: los entrenadores suplantan de- lanteros en una proporci´on mayor a otra clase de jugadores. Es decir, los delanteros suplentes tienen m´as posibilidades de ingresar a un partido que los defensores. Esto tambi´en plantea que los t´ecnicos hacen muy pocos cam- bios defensivos. 3.2. Correlaci´on en las variables ¿Hay correlaciones en las variables analizadas? Figura 5: Correlograma No se encuentran altas correlaciones, tampoco una llamativa. La correla- ci´on mayor es la que ocurre entre disparos desde fuera del ´area y la cantidad de disparos atajados. La relaci´on es obvia, dado que a mayor cantidad de tiros desde larga distancia, m´as sencillo es para el arquero atajar esos dis- paros. Por lo que se continuar´a con otro tipo de an´alisis para reducir la dimensionalidad. 11
  • 12. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 3.3. An´alisis de componentes principales Se va a realizar un an´alisis de componentes principales sobre el set de datos, primero se revisar´a que cantidad de componentes son los ´optimos pa- ra mantener: Figura 6: Screeplot En la Figura 6 se observa que, utilizando el criterio del bast´on roto, se estabiliza luego del quinto componente la variabilidad explicada por cada componente extra. Bas´andonos en esta t´ecnica, con 5 componentes nos al- canza para explicar la variabilidad del dataset. Para simplificar la visualizaci´on y el an´alisis se usar´an los dos primeros com- ponentes. A continuaci´on se grafican los dos primeros componentes: 12
  • 13. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 7: PCA Jugadores 1era divisi´on Argentina 13
  • 14. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 8: Factor Map Se puede ver c´omo en cada cuadrante se visualizan las caracter´ısticas m´as destacadas de cada posici´on. En cada cuadrante se visualizan las caracter´ısti- cas m´as destacadas de cada posici´on. En el cuadrante superior izquierdo, se observan las caracter´ısticas propias de los defensores. En el inferior izquier- do, las acciones m´as comunes de los arqueros: las atajadas. Los delanteros est´an en todo el eje inferior a la dim 2, que es donde se desta- can los tiros que les atajaron, los goles convertidos y los offsides (posiciones fuera de juego) que sufrieron por jugar adelantados. Por ´ultimo, en el cuadrante superior derecho, se agrupan caracter´ısticas de los medio campistas, ´estas son los pases y las faltas recibidas y hechas. Al estar en la zona de mayor poblaci´on de jugadores, se observan m´as faltas. 3.4. Clustering En esta etapa se busca encontrar una agrupaci´on para los jugadores. Los resultados fueron interesantes. Se hallaron 3 grupos: 14
  • 15. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 9: Cluster Jer´arquico 15
  • 16. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 10: Cluster Jer´arquico 16
  • 17. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 11: PCA Clusters Lo que se ve en los distintos clusters, es que se separa a los arqueros de los dem´as jugadores en el “Cluster 1”. Y que los “Cluster 2” y “Clus- ter 3” marcan una diferencia entre jugadores ofensivos y defensivos. Esta diferenciaci´on es interesante ya que no siempre es f´acil saber qu´e jugadores mediocampistas tienen m´as orientaci´on defensiva que ofensiva. En la figura siguiente se combinan las variables con los clusters para reforzar el concepto. : 17
  • 18. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 12: Biplot con clusters 3.5. ¿Los jugadores son m´as ofensivos cuando son locales? En la previa a un partido, se suelen escuchar frases como ”juegan de lo- cal, seguramente vayan a buscar el partido”. Esa suposici´on se repite tanto en programas deportivos como entre los hinchas de los clubes. La frase asu- me que los jugadores se compartan de distinta manera, seg´un sean visitantes o locales. 3.5.1. Exploraci´on de las poblaciones Para verificar la teor´ıa anterior se analizar´a el comportamiento de los jugadores en una variable que demuestra vocaci´on ofensiva, como se vio en el an´alisis de componentes principales y de clusters, al ser una caracter´ıstica destacada de jugadores ofensivos: “pr disparo afuera”. 18
  • 19. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 13: Densidad de disparos al arco de afuera del ´area 19
  • 20. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 14: Boxplot de disparos al arco de afuera del ´area Si bien en el gr´afico de densidad se notan algunas diferencias, cuando se analizan los boxplots esas disimilitudes no parecen tan llamativas. Otro rasgo que se observa es que no son poblaciones con distribuciones nor- males. 3.5.2. Prueba de la hip´otesis A continuaci´on se har´a la prueba de los rangos con signo de Wilcoxon para ver si existen diferencias en los comportamientos de los jugadores de visitante y de local. Como preparaci´on previa, en el an´alisis se tomar´a s´olo a los jugadores que se desempe˜naron como titulares y suplentes. Es decir, que ocuparon los dos roles. Planteo de la hip´otesis: 20
  • 21. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Los jugadores de local y de visitante hicieron la misma cantidad de tiros al arco. H0:θ1 − θ2 = 0 Hip´otesis alternativa: Hay evidencia de que los jugadores de visitante no se comportan igual que jugando como local. Ha:θ1 − θ2 = 0 Grupo media sd L 0.006147214 0.009922329 V 0.004926489 0.006696114 Cuadro 2: Medias y desv´ıos por grupo Se hace el test de Wilcoxon sobre el listado de los jugadores y se ve lo siguiente: wilcox . t e s t ( jugadores t i r o s $L, jugadores t i r o s $V, paired = TRUE) Wilcoxon signed rank test with continuity correction data: jugadores tiros$L and jugadores tiros$V V = 395180, p-value = 2.404e-13 alternative hypothesis: true location shift is not equal to 0 Conclusi´on: con un 0.05 de significaci´on, los futbolistas argentinos no se comportan ofensivamente de la misma manera cuando son locales o visitan- tes. 21
  • 22. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Esto da soporte a la suposici´on popular, quiz´as la preparaci´on para par- tidos se tendr´ıa que centrar en lograr llevar a niveles similares los tiros realizados por los jugadores cuando juegan en su cancha que cuando juegan de visitante. Como vimos antes, encontramos una leve correlaci´on entre estos dos facto- res, donde obviamente m´as tiros equivalen a m´as chances de realizar goles. Figura 15: Disparos de afuera vs Goles convertidos 22
  • 23. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 4. Aplicaci´on de t´ecnicas con el foco en los equipos En esta secci´on se pondr´a como centro del an´alisis las caracter´ısticas de los 33 equipos durante las temporadas del 2013 a 2016, dividir´e el an´alisis en 3 partes, un an´alisis de componentes principales, otro de agrupamientos, finalmente, visualizaremos con las caras de Chernoff los distintos equipos. Para la preparaci´on vamos a promediar los valores totales de cada variable por la cantidad de partidos jugados para igualar a todos los equipos. Antes de empezar a ver que nos “dicen” los datos, vamos a repasar como se clasifican los equipos hist´oricamente denominados “grandes”: Boca, Independiente, Racing, River y San Lorenzo. Luego se pueden tomar discusiones para ver cual es el 6to grande y de ah´ı en adelante. Se ver´a si con los datos de los ´ultimos 4 a˜nos encontramos nuevas maneras de agruparlos. 4.1. An´alisis de componentes principales Veremos a continuaci´on como se ubican los equipos una vez que aplica- mos PCA, que tienen en com´un y que caracter´ısticas son las que destacan en cada uno. Para esto se grafic´o un biplot y se analiz´o en qu´e cuadrante se coloca cada equipo. 23
  • 24. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 16: Biplot equipos 24
  • 25. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 17: Biplot caracter´ısticas de cada cuadrante Resulta interesante ver que si bien cantidad de goles, tiros y asistencias hacen que un equipo sea mejor, las dos caracter´ısticas que son diferenciado- ras a la hora de destacarse son la cantidad de pases correctos y de quites; la sumatoria de esas dos variables con las anteriores hacen que un equipo tenga m´as posibilidades de estar en los primeros puestos. 4.2. Clustering Se ver´a en cuantos clusters podemos dividir a los distintos equipos. Estas ser´ıan agrupaciones en donde se toma en cuenta solamente el rendimiento de sus jugadores dentro del campo. Resultar´ıa interesante agregar a estos datos cantidad de socios, rating tele- visivo, ya esos datos nos dar´ıan tambi´en una idea de la gente que sigue a los clubes y no solo por rendimientos deportivos. Esto quedar´a para agregar en un futuro de ser posible. 25
  • 26. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo subsubsectionPartici´on en dos grupos Como se ver´a a continuaci´on la primera separaci´on que se nota es que hay dos grandes grupos de equipos, representamos como quedar´ıan. Figura 18: Cluster Jer´arquico de Equipos 26
  • 27. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 19: Cluster de Equipos 27
  • 28. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 20: Biplot con Clusters de equipos Parece ser que los equipos m´as ofensivos se encuentran en un grupo y el resto en el otro. Como se ve en la Figura 20 lo primero que la dimen- si´on 1, aquella que destaca la mayor cantidad de situaciones ofensivas, goles, asistencias realizadas, es donde se encuentran los equipos que suelen tener torneos m´as destacados. Otro detalle es que los “5 grandes” del f´utbol argen- tino se encuentran en ese grupo, a pesar de que varios de ellos como Racing e Independiente tienen torneos irregulares, todav´ıa siguen perteneciendo a este grupo de equipos ofensivos. 28
  • 29. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 21: Biplot con Clusters de equipos Este tipo de agrupamientos y visualizaciones permitir´ıa ver si los can- didatos se pueden preveer de manera m´as simple sabiendo el jugador que incorporan y sus cualidades para conocer que aportar´ıa en el nuevo equipo. 4.3. ¿Qu´e equipos son parecidos entre s´ı? Tenemos 33 equipos en este an´alisis; podemos decir que Lan´us (con Al- mir´on como DT) y San Lorenzo (con Aguirre como DT) tienen ideas simila- res, pero cuando comparamos varias temporadas para ver si en el tiempo se sostienen ideas, ¿podemos decir con tanta seguridad qu´e equipos presentan ideas parecidas? Para esto se aplic´o la t´ecnica “caras de Chernoff”, para ver de una ma- nera m´as amigable que equipos se parecen entre s´ı y como se diferencian. 4.3.1. Variables de cada aspecto En el siguiente cuadro se ve qu´e aspecto de la cara afecta cada variable. 29
  • 30. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo modified item Variable 1 height of face pr goles convertidos 2 width of face pr asistencias 3 structure of face pr disparo afuera 4 height of mouth pr disparo atajado 5 width of mouth pr faltas 6 smiling pr faltas recibidos 7 height of eyes pr offsides 8 width of eyes pr amarillas 9 height of hair pr expulsados 10 width of hair pr pase correcto 11 style of hair pr incorrecto 12 height of nose pr despejes 13 width of nose pr quites 14 width of ear pr atajadas 15 height of ear pr goles convertidos Cuadro 3: Variables y Aspecto que modifican 4.3.2. Caras de Chernoff Ya se demostr´o c´omo podemos agrupar a los equipos, ahora, se ver´a cu´ales se parecen entre s´ı. Figura 22: Equipos y sus caras Lo primero que resulta interesante observar es que Atl´etico de Tucum´an 30
  • 31. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo es bastante particular, porque no es f´acil encontrarle similitudes con el resto de los planteles. Si nos ponemos a pensar cu´al fue la consecuencia de este comportamiento, la encontramos en que es la primera vez en la historia que juega la copa Libertadores. ¿Un equipo con pocos recursos necesita encon- trar combinaciones distintas para poder lograr esos hitos? Es una pregunta interesante de plantear. Entre los equipos que no tuvieron buenos rendimientos pareciera haber bas- tante similitudes; Sarmiento, Temperley, All Boys, Argentinos Juniors, Olim- po, Crucero del Norte. Equipos que descendieron o tuvieron muy malos tor- neos. Podr´ıamos continuar con este juego de parecidos, la realidad es que esto sirve para ver r´apidamente si nuestro objetivo es parecernos al equipo campe´on, que tan distintos somos, ¿somos parecidos River Plate o a Sarmiento? 31
  • 32. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo 5. Bonus Track - Marcelo Meli como contrataci´on Como bonus de este informe realizar´e un an´alisis muy individual: el ob- jetivo es ver si Racing, que necesitaba un jugador que se desempe˜ne como volante por derecha termin´o incorporando a Marcelo Meli, tiene m´as pare- cido con mediocampistas del tipo defensivo o con el “Huevo” Acu˜na, que es un jugador con mucha llegada ofensiva y aporte en lo defensivo. Para esto se compara a Meli con Aued, Cerro, Acu˜na, Gonz´alez (alias “Pulpito”),Gast´on D´ıaz y Videla. La primera comparaci´on se realiz´o con una gr´afico de radar. Figura 23: Mediocampistas de Racing Lo primero que se ve a simple vista es que Meli es muy parecido a Gonz´alez, lo que rescata el diario Ol´e de donde se tiene pensado ponerlo, “¿D´onde jugar´ıa Meli? Cocca lo piensa como volante por derecha en el 4-4-2 o interno en el 4-3-3 , funci´on que m´as ha cumplido en su carrera.”, esto podr´ıa parecer una contradicci´on, se busca un jugador por afuera pero no tiene caracter´ısticas de un jugador que llegue y brinde asistencias, tampoco que llegue al gol. Tiene caracter´ısticas muy parecidas a Aued y a Gonz´alez, por lo que la po- sici´on de externo no parecer´ıa que le siente natural, ya que un jugador que tendr´ıa que tener caracter´ısticas similares pero cumplir el rol por la derecha del campo es Acu˜na y no se parece a este jugador. 32
  • 33. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Figura 24: Mediocampistas de Racing Chernoff parece estar de acuerdo con las primeras apreciaciones, lo que queda entonces por ver antes que comience el torneo es, ¿la capacidad del t´ecnico para pensar que un jugador puede cumplir funciones que no viene realizando es superior a lo que los datos dicen acerca del jugador? 33
  • 34. An´alisis de equipos y jugadores del f´utbol argentino Tempone, Pablo Referencias Lˆe, S., Josse, J. Husson, F. (2008). FactoMineR: An R Package for Multivariate Analysis. Journal of Statistical Software. 25(1). pp. 1-18. Pe˜na, Daniel. An´alisis de Datos Multivariantes. Chan, D´ebora (2016). An´alisis de Componentes Princi- pales. Chan, D´ebora (2016). Contrastes de Homogeneidad e Independencia. Chan, D´ebora (2016). Comparaci´on de Medias- ANOVA- Hotelling. Chan, D´ebora (2016). Clusters. 34