2. PLANTEAMIENTO TÉORICO-CONCEPTUAL
El conocimiento de la forma de la distribución y del respectivo promedio de una
colección de valores de una variable, puede servir para tener una idea bastante clara de
la conformación, pero no de la homogeneidad de cada una de los valores con respecto a
la medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en términos de
alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que
permite apreciar el grado de dispersión o variabilidad existente en el grupo de variantes
en estudio.
A estos indicadores les llamamos medidas de dispersión, por cuanto que están referidos
a la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere
variabilidad o dispersión en los datos interés, entonces no habría necesidad de la gran
mayoría de las medidas de la estadística descriptiva.
JuanMiguelCustodioMacgiver162020
2
3. Medidas de Dispersión
La variabilidad o dispersión hace referencia al grado de variación que hay en un conjunto
de puntuaciones.
La dispersión es importante porque:
• Proporciona información adicional que permite juzgar la confiabilidad de la
medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posición central es menos representativa de los datos.
• Coexisten problemas característicos para datos ampliamente dispersos, debemos
ser capaces de distinguir que presentan esa dispersión antes de abordar esos
problemas.
• Comparar las dispersiones de diferentes muestras. Si no se desea tener una
amplia dispersión de valores con respecto al centro de distribución o esto presenta
riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger
distribuciones que tengan las dispersiones más grandes.
• Dispersión en la mayoría de los datos, y debemos estar en capacidad de
describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad.
JuanMiguelCustodioMacgiver162020
3
6. El rango intercuartil
RANGO O RECORRIDO INTERCUATÍLICO
Es la diferencia entre el tercer cuartil y el primero, el rango donde
se encuentra el 50% central de los datos.
RI = Q3 - Q1
Es la distancia entre el primer y tercer cuartiles . Es algunas veces
llamado la dispersión H.
JuanMiguelCustodioMacgiver162020
6
7. La Importancia del rango intercuartil
La gama nos da una medida de cómo distribuir la totalidad de
nuestro conjunto de datos es. El rango intercuartil, lo que nos dice a
qué distancia del primer y tercer cuartil son, indica cómo hacia fuera
la media del 50% de nuestro conjunto de datos es.
Resistencia a los valores atípicos
La ventaja principal de utilizar el rango intercuartil en lugar de la
gama para la medición de la propagación de un conjunto de datos
es que el rango intercuartil no es sensible a los valores atípicos.
JuanMiguelCustodioMacgiver162020
7
8. El uso del rango intercuartil
Además de ser una medida menos sensible de la propagación de un
conjunto de datos, el rango intercuartil tiene otro uso
importante. Debido a su resistencia a los valores atípicos, el rango
intercuartil es útil para identificar cuando un valor es un valor atípico.
La regla de rango intercuartil es lo que nos informa si tenemos un
valor atípico leve o fuerte. Para buscar un valor atípico, hay que
mirar debajo del primer cuartil o por encima del tercer cuartil. Hasta
dónde debemos ir depende del valor del rango intercuartil.
JuanMiguelCustodioMacgiver162020
8
14. Ejemplo Sea un conjunto ordenado de las edades de
los veinte sujetos (N=20) de un club.
JuanMiguelCustodioMacgiver162020
14
15. Primer cuartil
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, será
un número entre el X5=28 y X6=29.
El número decimal es el 5,25, por lo que i=5
y d=0,25. El cuartil 1 es:
JuanMiguelCustodioMacgiver162020
15
16. Rango intercuartílico
Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular
el rango intercuartílico.
JuanMiguelCustodioMacgiver162020
16
17. Tercer cuartil
El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como
el número es decimal, el cuartil estará entre X15=52 y X16=53.
El número decimal es el 15,75,
por lo que i=15 y d=0,75. El
cuartil 3 es:
JuanMiguelCustodioMacgiver162020
17
18. Desviación Media
La desviación absoluta promedio o desviación media o también conocida
como promedio de un conjunto de datos se puede definir como la media de
las desviaciones absolutas
Desviación respecto a la media
La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de
la variable estadística y la media aritmética.
JuanMiguelCustodioMacgiver162020
18
19. Desviación media
La desviación media es la media aritmética de los valores absolutos de
las desviaciones respecto a la media y se representa por
JuanMiguelCustodioMacgiver162020
19
20. Ejemplo:
Calcular la desviación media de la distribución:
1. Calculamos la media aritmética para poder hallar las desviaciones respecto a la
media
JuanMiguelCustodioMacgiver162020
20
21. 2. Aplicamos la fórmula de la desviación media
JuanMiguelCustodioMacgiver162020
21
22. Desviación media paradatos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión
de la desviación media es:
JuanMiguelCustodioMacgiver162020
22
23. Ejemplode calculo de desviación media paradatos agrupados
Calcular la desviación media de la distribución de las edades de los jugadores de un club:
Edades(Años) xi fi
[10-15) 12.5 3
[15-20) 17.5 5
[20-25) 22.5 7
[25-30) 27.5 4
[30-35) 32.5 2
JuanMiguelCustodioMacgiver162020
23
24. 1. En primer lugar calculamos la media aritmética:
Edades(Años) xi fi xi * fi
[10-15) 12.5 3 37.5
[15-20) 17.5 5 87.5
[20-25) 22.5 7 157.5
[25-30) 27.5 4 110.0
[30-35) 32.5 2 65.0
Total 21 457.5
JuanMiguelCustodioMacgiver162020
24
25. 2. Añadimos otra columna a la tabla con las desviaciones respecto a la media
Edades(Años) xi fi xi * fi
[10-15) 12.5 3 37.5 9.286
[15-20) 17.5 5 87.5 4.286
[20-25) 22.5 7 157.5 0.714
[25-30) 27.5 4 110.0 5.714
[30-35) 32.5 2 65.0 10.714
Total 21 457.5
JuanMiguelCustodioMacgiver162020
25
26. 3. Calcular la desviacion media
Edades(Años) xi fi xi * fi ( | Xi – X’| ) ( | Xi – X’| ) * fi
10-15 12.5 3 37.5 9.826 27.858
15-20 17.5 5 87.5 4.286 21.43
20-25 22.5 7 157.5 0.714 4.998
25-30 27.5 4 110.0 5.714 22.856
30-35 32.5 2 65.0 10.714 21.428
Total 21 457.5 98.57
JuanMiguelCustodioMacgiver162020
26
27. Informa de lo muy dispersados (o no) que están los datos. Una
desviación media elevada implica mucha variabilidad en los
datos, mientras que una desviación media igual a cero implica
que todos los valores son iguales y por lo tanto coinciden con la
media.
El valor absoluto de la desviación respecto a la media indica
lo lejos que está el valor de la media. Un valor igual a cero
indica que el valor coincide con la media, mientras que un
valor elevado con respecto a las demás desviaciones informa
de que el dato está alejado de los demás datos.
La desviación media es de aproximadamente 4.69 años.
Concluimos que con datos suministrados de una muestra, el club
de los 21 jugadores con un promedio de 21.786 años. con una
desviación media de 4.69 años.
JuanMiguelCustodioMacgiver162020
27
28. Notas:
A efectos comparativos, es importante indicar que debemos
comparar siempre variables con las mismas unidades de
medida. Por ejemplo, no tendría mucho sentido decir que la
variabilidad del producto interior bruto (PIB) es mayor que la
de la venta de helados. Por poder, se puede indicar, pero
comparar euros con número de helados no tiene sentido. Por
tanto, siempre mejor comparar variables con la misma unidad
de medida.
Lo mismo ocurre con las medidas de dispersión. Si lo que se
quiere es comparar dos variables, es preferible hacerlo con las
mismas medidas de dispersión para cada una de ellas y
preferiblemente en la misma unidad.
JuanMiguelCustodioMacgiver162020
28