2. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
1
INTRODUCCIÓN
Para la realización de este análisis bidimensional se ha escogido una base de datos que
almacenaba todos los atletas en Juegos Olímpicos de verano e invierno desde Atenas 1896
hasta Rio en 2016. A continuación, podemos ver un pequeño fragmento de dicha base de
datos.
Dada la extensión de esta base de datos refinamos nuestra fuente, en primer lugar, se
eliminaron a todos los competidores que no consiguieron medalla, en segundo lugar, dejamos
en la base de datos solamente a los medallistas en Juegos Olímpicos de verano y a aquellos
que compitieron en halterofilia. Finalmente dada la diferencia de marcas en este deporte entre
hombres y mujeres, y que las variables a analizar, peso y altura, están fuertemente
condicionadas por él sexo, decidimos centrarnos en solo un sexo, por ello nuestra base de
datos consta tan solo de halterófilos varones que consiguieron su medalla entre 1896 y 2016.
Una vez realizados estos cambios obtuvimos esto:
ID Name Sex Age Height Weight Team NOC Games Year Season City Sport Event Medal
1 A Dijiang M 24 180 80 China CHN 1992 Summer 1992 Summer Barcelona Basketball Basketball Men's Basketball NA
2 A Lamusi M 23 170 60 China CHN 2012 Summer 2012 Summer London Judo Judo Men's Extra-Lightweight NA
3 Gunnar Nielsen Aaby M 24 NA NA Denmark DEN 1920 Summer 1920 Summer Antwerpen Football Football Men's Football NA
4 Edgar Lindenau Aabye M 34 NA NA Denmark/Sweden DEN 1900 Summer 1900 Summer Paris Tug-Of-War Tug-Of-War Men's Tug-Of-War Gold
5 Christine Jacoba Aaftink F 21 185 82 Netherlands NED 1988 Winter 1988 Winter Calgary Speed Skating Speed Skating Women's 500 metres NA
5 Christine Jacoba Aaftink F 21 185 82 Netherlands NED 1988 Winter 1988 Winter Calgary Speed Skating Speed Skating Women's 1,000 metres NA
5 Christine Jacoba Aaftink F 25 185 82 Netherlands NED 1992 Winter 1992 Winter Albertville Speed Skating Speed Skating Women's 500 metres NA
5 Christine Jacoba Aaftink F 25 185 82 Netherlands NED 1992 Winter 1992 Winter Albertville Speed Skating Speed Skating Women's 1,000 metres NA
5 Christine Jacoba Aaftink F 27 185 82 Netherlands NED 1994 Winter 1994 Winter Lillehammer Speed Skating Speed Skating Women's 500 metres NA
5 Christine Jacoba Aaftink F 27 185 82 Netherlands NED 1994 Winter 1994 Winter Lillehammer Speed Skating Speed Skating Women's 1,000 metres NA
6 Per Knut Aaland M 31 188 75 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 10 kilometres NA
6 Per Knut Aaland M 31 188 75 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 50 kilometres NA
6 Per Knut Aaland M 31 188 75 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 10/15 kilometres Pursuit NA
6 Per Knut Aaland M 31 188 75 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 4 x 10 kilometres Relay NA
6 Per Knut Aaland M 33 188 75 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 10 kilometres NA
6 Per Knut Aaland M 33 188 75 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 30 kilometres NA
6 Per Knut Aaland M 33 188 75 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 10/15 kilometres Pursuit NA
6 Per Knut Aaland M 33 188 75 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 4 x 10 kilometres Relay NA
7 John Aalberg M 31 183 72 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 10 kilometres NA
7 John Aalberg M 31 183 72 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 50 kilometres NA
7 John Aalberg M 31 183 72 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 10/15 kilometres Pursuit NA
7 John Aalberg M 31 183 72 United States USA 1992 Winter 1992 Winter Albertville Cross Country Skiing Cross Country Skiing Men's 4 x 10 kilometres Relay NA
7 John Aalberg M 33 183 72 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 10 kilometres NA
7 John Aalberg M 33 183 72 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 30 kilometres NA
7 John Aalberg M 33 183 72 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 10/15 kilometres Pursuit NA
7 John Aalberg M 33 183 72 United States USA 1994 Winter 1994 Winter Lillehammer Cross Country Skiing Cross Country Skiing Men's 4 x 10 kilometres Relay NA
8 Cornelia "Cor" Aalten (-Strannood) F 18 168 NA Netherlands NED 1932 Summer 1932 Summer Los Angeles Athletics Athletics Women's 100 metres NA
8 Cornelia "Cor" Aalten (-Strannood) F 18 168 NA Netherlands NED 1932 Summer 1932 Summer Los Angeles Athletics Athletics Women's 4 x 100 metres Relay NA
9 Antti Sami Aalto M 26 186 96 Finland FIN 2002 Winter 2002 Winter Salt Lake City Ice Hockey Ice Hockey Men's Ice Hockey NA
10 Einar Ferdinand "Einari" Aalto M 26 NA NA Finland FIN 1952 Summer 1952 Summer Helsinki Swimming Swimming Men's 400 metres Freestyle NA
11 Jorma Ilmari Aalto M 22 182 76.5 Finland FIN 1980 Winter 1980 Winter Lake Placid Cross Country Skiing Cross Country Skiing Men's 30 kilometres NA
12 Jyri Tapani Aalto M 31 172 70 Finland FIN 2000 Summer 2000 Summer Sydney Badminton Badminton Men's Singles NA
13 Minna Maarit Aalto F 30 159 55.5 Finland FIN 1996 Summer 1996 Summer Atlanta Sailing Sailing Women's Windsurfer NA
13 Minna Maarit Aalto F 34 159 55.5 Finland FIN 2000 Summer 2000 Summer Sydney Sailing Sailing Women's Windsurfer NA
14 Pirjo Hannele Aalto (Mattila-) F 32 171 65 Finland FIN 1994 Winter 1994 Winter Lillehammer Biathlon Biathlon Women's 7.5 kilometres Sprint NA
15 Arvo Ossian Aaltonen M 22 NA NA Finland FIN 1912 Summer 1912 Summer Stockholm Swimming Swimming Men's 200 metres Breaststroke NA
15 Arvo Ossian Aaltonen M 22 NA NA Finland FIN 1912 Summer 1912 Summer Stockholm Swimming Swimming Men's 400 metres Breaststroke NA
15 Arvo Ossian Aaltonen M 30 NA NA Finland FIN 1920 Summer 1920 Summer Antwerpen Swimming Swimming Men's 200 metres Breaststroke Bronze
15 Arvo Ossian Aaltonen M 30 NA NA Finland FIN 1920 Summer 1920 Summer Antwerpen Swimming Swimming Men's 400 metres Breaststroke Bronze
15 Arvo Ossian Aaltonen M 34 NA NA Finland FIN 1924 Summer 1924 Summer Paris Swimming Swimming Men's 200 metres Breaststroke NA
16 Juhamatti Tapio Aaltonen M 28 184 85 Finland FIN 2014 Winter 2014 Winter Sochi Ice Hockey Ice Hockey Men's Ice Hockey Bronze
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Individual All-Around Bronze
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Team All-Around Gold
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Floor Exercise NA
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Horse Vault Gold
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Parallel Bars NA
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Horizontal Bar NA
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Rings NA
17 Paavo Johannes Aaltonen M 28 175 64 Finland FIN 1948 Summer 1948 Summer London Gymnastics Gymnastics Men's Pommelled Horse Gold
17 Paavo Johannes Aaltonen M 32 175 64 Finland FIN 1952 Summer 1952 Summer Helsinki Gymnastics Gymnastics Men's Individual All-Around NA
17 Paavo Johannes Aaltonen M 32 175 64 Finland FIN 1952 Summer 1952 Summer Helsinki Gymnastics Gymnastics Men's Team All-Around Bronze
17 Paavo Johannes Aaltonen M 32 175 64 Finland FIN 1952 Summer 1952 Summer Helsinki Gymnastics Gymnastics Men's Floor Exercise NA
Height Weight Team Medal
140 56 United StatesGold
144 55 Soviet Union Gold
145 55 Hungary Silver
148 57 Bulgaria Bronze
150 52 Iran Gold
150 52 Iran Silver
150 52 Iran Bronze
150 54 China Bronze
150 54 Turkey Gold
150 54 Turkey Gold
150 54 Turkey Gold
150 56 Hungary Silver
150 56 Hungary Silver
3. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
2
A continuación, se pueden ver la forma en la que se han agrupado por intervalos las dos
variables continuas, peso y altura. En ambas hemos elegido utilizar 10 intervalos con una
longitud por intervalo de 7 kg en el caso de peso y 7 cm en el caso de la altura.
Estas tablas también se pueden observar en nuestra tabla de frecuencias bidimensional en las
marginales de las variables correspondientes.
[137,144) 1 0,002331
[144,151) 18 0,041958
[151,158) 48 0,111888
[158,165) 70 0,16317
[165,172) 106 0,247086
[172,179) 97 0,226107
[179,186) 73 0,170163
[186,193) 14 0,032634
[193,200) 1 0,002331
[200,207] 1 0,002331
Altura
[51-63) 103 0,24009324
[63-75) 70 0,16317016
[75-87) 109 0,25407925
[87-99) 43 0,1002331
[99-111) 51 0,11888112
[111-123) 11 0,02564103
[123-135) 14 0,03263403
[135-147) 12 0,02797203
[147-159) 8 0,01864802
[159-171) 8 0,01864802
Peso
5. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
4
¿EXISTE DEPENDENCIA ESTADÍSTICA ENTRE LA ALTURA DE UN ATLETA Y SU RENDIMIENTO?
Recordemos que dos variables presentan independencia estadística cuando 𝑥
𝑦 = 𝑦⁄ se
distribuye de la misma manera que 𝑥. Para ello comparamos la marginal de 𝑥 que es la altura y
𝑎𝑙𝑡𝑢𝑟𝑎
𝑜𝑟𝑜⁄ (la altura condicionada a que la medalla sea de oro). Posteriormente, se procede
al calculo de las frecuencias relativas de ambas distribuciones.
Al compara las frecuencias relativas observamos que se distribuyen de manera muy similar,
por lo tanto, se podría decir que existe independencia entre la altura de un halterófilo y su
rendimiento en competición. Sin embargo, podría ser interesante realizar una tabla de
frecuencias que relacione el peso de un atleta con su rendimiento, ya que, dado el carácter del
deporte en particular, en el cual las competiciones se estructuran por categorías de peso,
podríamos extraer conclusiones interesantes en relación con ese caso particular, sobre todo
debido a que los atletas más celebres y donde hay un mayor número de levantadores es en las
categorías que se encuentran entre los 70 y 85 kg, siendo esto último especialmente relevante
en el análisis dependencia estadística de las tablas de frecuencias.
También cabria comentar, que en este estudio estadístico concreto se extrae como conclusión
que no existe dependencia entre la altura de un levantador y que consigan una medalla de
bronce, oro o plata. Sin embargo, es probable la posibilidad de extrapolar estos resultados a
que no existe dependencia en el rendimiento general de un levantador y su altura, aunque
esto solo lo podríamos comprobar si en esta base de datos contásemos también con aquellos
levantadores que no obtuvieron medalla.
Finalmente, decir, y como curiosidad con respecto al deporte en cuestión y en relación con las
conclusiones del análisis, que dentro de los practicantes amateur de este deporte este
considerado como una desventaja el ser alto para realizar levantamientos olímpicos.
[137,144) 1 0,006803
[144,151) 11 0,07483
[151,158) 19 0,129252
[158,165) 19 0,129252
[165,172) 39 0,265306
[172,179) 30 0,204082
[179,186) 22 0,14966
[186,193) 5 0,034014
[193,200) 1 0,006803
[200,207] 0 0
Altura
Oro
𝑎𝑙𝑡𝑢𝑟𝑎 𝑜𝑟𝑜
[137,144) 1 0,002331
[144,151) 18 0,041958
[151,158) 48 0,111888
[158,165) 70 0,16317
[165,172) 106 0,247086
[172,179) 97 0,226107
[179,186) 73 0,170163
[186,193) 14 0,032634
[193,200) 1 0,002331
[200,207] 1 0,002331
Altura
6. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
5
¿EXISTE DEPENDENCIA ESTADÍSTICA ENTRE LA ALTURA DE UN ATLETA Y SU PESO?
Contamos para este análisis con dos tablas de frecuencias una de ellas es
𝑎𝑙𝑡𝑢𝑟𝑎
𝑝𝑒𝑠𝑜: [75 − 87)⁄ (altura condicionada a que el peso este entre 75 y 87 kilogramos), y la
otra en la marginal de la altura.
Si observamos las frecuencias relativas de ambas tablas podemos observar como se
distribuyen de manera diferente, por lo tanto, podemos afirmar que existe dependencia entre
el peso y la altura de los levantadores. Algo que como es normal ocurre también con la
población general.
Dado esta dependencia entre las dos variables cobra sentido el análisis de regresión realizado
posteriormente en este trabajo.
[137-144) 0 0
[144-151) 0 0
[151-158) 0 0
[158-165) 11 0,10091743
[165-172) 52 0,47706422
[172-179) 42 0,3853211
[179-186) 4 0,03669725
[186-193) 0 0
[193-200) 0 0
[200-207) 0 0
Altura
Peso [75-87)
𝑎𝑙𝑡𝑢𝑟𝑎 𝑝𝑒𝑠𝑜
[137,144) 1 0,002331
[144,151) 18 0,041958
[151,158) 48 0,111888
[158,165) 70 0,16317
[165,172) 106 0,247086
[172,179) 97 0,226107
[179,186) 73 0,170163
[186,193) 14 0,032634
[193,200) 1 0,002331
[200,207] 1 0,002331
Altura
7. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
6
REGRESIÓN
Se han realizado cuatro tipos de ajustes para el estudio de la regresión, para visualizar dichas
funciones se cuenta con dos gráficas, una de ellas incluye las funciones: exponencial, potencial
y lineal, además de la nube de puntos de los datos originales. Por otro lado, contamos con la
función que nos da la regresión reciproca.
Lineal Exponencial Reciproca Potencial
Ecuación
2,0789x
− 267,65 1,409e0,0239x
1
−0 000293174𝑥 +
0 062473563
⁄
1E − 07x4,0074
Coeficiente
de
Determinación
0,7072 0,78 0,81 0,7738
Varianza
residual
193 83,01 400 87
8. Roberto Saavedra ESTADÍSTICA APLICADA
Jingyang Zhang
7
Teniendo en cuenta dos factores como el coeficiente de determinación y la varianza residual,
nos disponemos a elegir cual es el mejor de los 4 ajustes. Si atendiésemos simplemente al
coeficiente de determinación el mejor de los ajustes sería el ajuste reciproco, ya que tiene el
coeficiente de determinación mas alto, en este caso de 0,81. Sin embargo si atendemos
también a la varianza residual vemos como el ajuste reciproco tiene un mayor error. Esto
puede ser atribuido a que como vemos en la gráfica donde se encuentra la función reciproca,
cuando nos acercamos a los 200cm se predicen valores irreales de peso, llegando a
predicciones de 400 kg.
Por tanto y atendiendo a una mejor predicción global del problema, podemos decir que el
mejor de los ajustes es el exponencial ya que tiene un coeficiente de determinación de 0,78, el
segundo coeficiente de determinación más alto, y la varianza residual más baja, en este caso
de 83.