Este documento resume diferentes medidas de dispersión, incluyendo medidas absolutas como rango, varianza y desviación típica, y medidas relativas como el coeficiente de variación. Explica cómo calcular e interpretar cada medida y cómo usarlas para comparar la variabilidad entre conjuntos de datos.
2. Una medida de dispersión permite cuantificar el grado de
dispersión de los datos con respecto a alguna medida de
tendencia central.
Al interpretar una medida de dispersión es importante tener
en cuenta lo siguiente: a menor valor obtenido menos
variabilidad de los datos y a mayor valor obtenido más
variabilidad entre los datos.
3. Medidas de
dispersión
Absolutas:
Rango o amplitud.
Rango intercuartilar.
Desviación semi_intercuartilar.
Desviación media
Varianza.
Desviación típica.
Relativas:
Coeficiente de variación.
4. Las medidas de dispersión absolutas se expresan usando la
unidad de medición de la variable.
Ejemplo:
Si se trata de estaturas se pueden expresar en metros,
centímetros, etc.
Si se trata del peso de un grupo de niños, estás pueden
expresarse en kilogramos.
Si se trata de mediciones de glicemia, triglicéridos o
colesterol, los valores se pueden expresar en mg/dl.
Las medidas de dispersión relativas no se expresan en las
unidades de medición de la variable. Por ejemplo, el
coeficiente de variación se expresa como una proporción.
6. Las medidas de dispersión absolutas que serán estudiadas acá
son:
1. Rango o amplitud.
2. Varianza.
3. Desviación típica.
7. Amplitud o Rango
Amplitud o rango: Se define como la diferencia entre el valor
máximo y el valor mínimo del conjunto de datos.
Amplitud o rango = Valor máximo – Valor mínimo.
Esta medida de dispersión se puede calcular si la variable está
medida en la escala de intervalo o la escala de razón.
Ejemplo 1: Calcular e interpretar el rango del siguiente conjunto
de estaturas (en metros): 1,74; 1,76; 1,74; 1,75; 1,75; 1,77.
Rango = Máximo – Mínimo = 1,77 mtrs – 1,74 mtrs = 0,03 mtrs
Esto nos indica que la diferencia entre la estatura del sujeto más
alto y el más bajo es igual 0,03 metros (3 cm)
8. Ejemplo 2: Para cada uno de los siguientes conjuntos
calcule el rango o amplitud. Compare los valores obtenidos
¿Qué puede concluir?
Conjunto 1: 10 10 10 10 10 10 10 10 15
Conjunto 2: 10 11 11 11 11 11 15 12 12
Conjunto 3: 6 6 5 6 6 7 7 8 10 9 9 8
9. Amplitud o Rango.
Ventajas:
Es de fácil cálculo e interpretación.
Desventajas:
1. No aporta información de la variabilidad de los datos con
respecto a alguna medida de tendencia central.
2. No aporta información de la variabilidad de los datos en
el centro de la distribución.
3. Se ve muy influenciada por valores extremos de la
distribución.
10. Varianza
Varianza: Se define como el cociente de la suma de las
desviaciones cuadráticas de los valores de la variable con
respecto a la media aritmética entre el total de casos.
( )
n
xx
Varianza
n
i
i∑=
−
= 1
2
La definición anterior corresponde a la varianza muestral
sesgada y se denota como S2
, donde n representa al tamaño de
la muestra.
La varianza poblacional es denotada por: σ2
.
11. Varianza sesgada e insesgada.
La varianza muestral sesgada se obtiene dividiendo la suma
de las desviaciones cuadráticas de los valores con respecto a la
media entre el tamaño de la muestra (n). Esta es denotada por
S2
.
( )
n
xx
S
n
i
i∑=
−
= 1
2
2
La varianza muestral insesgada se obtiene dividiendo la suma
de las desviaciones cuadráticas de los valores con respecto a la
media entre el tamaño de la muestra menos uno (n-1). Esta es
denotada por Ŝ2
.
( )
1
ˆ 1
2
2
−
−
=
∑=
n
xx
S
n
i
i
12. Desviación típica
Desviación típica: se define como la raíz cuadrada de la
varianza.
VarianzatípicaDesviación =
Notación:
S: denota la desviación típica muestral (de los datos de una
muestra)
σ: denota la desviación típica poblacional (de los datos de la
población)
13. Importancia de la desviación típica.
•Es la medida de dispersión más usada para describir un
conjunto de datos.
•Su cálculo toma en cuenta a todos los datos.
•Aporta información de la variabilidad de los datos con respecto
a la media aritmética.
•Es de gran utilidad en la inferencia estadística debido a sus
propiedades algebraicas.
14. Criterios para interpretar la desviación típica.
Asumiendo que la distribución de los datos es simétrica y
unimodal, se puede afirmar que:
•El 68,26% de los datos se encuentran en el intervalo con
límites inferior y superior igual a , respectivamente.
•El 95,45% de los datos se encuentran en el intervalo con
límites inferior y superior igual a , respectivamente
•El 99,73% de los datos se encuentran en el intervalo con
límites inferior y superior igual a , respectivamente
SxSx +− y
SxSx 2y2 +−
SxSx 3y3 +−
xSx − Sx +
68,26%
95,45%
Sx 2+Sx 2−
16. Coeficiente de variación (C.V)
Coeficiente de variación: Se denota como C.V. y se define
como el resultado de dividir la desviación típica por la media
aritmética.
Este estadístico debe usarse si la variable está medida en la escala
de razón.
Ejemplo 5: Suponga que la distribución de los pesos de un grupo
de mujeres tiene una media igual a 65 kgrs. y una desviación
típica igual a 2 kgrs. El coeficiente de variación para este
conjunto de datos es igual a:
031,0..
031,0
kgrs.65
kgrs.2
..
=
===
VC
x
S
VC
17. Criterios para comparar la variabilidad de los datos de dos o
más distribuciones
Si la media aritmética de las distribuciones es la misma o parecida
(1) y, además, las variables están expresadas en la misma unidad
de medida (2), entonces se comparan los valores de la varianza o
la desviación típica de las distribuciones.
En caso de no cumplirse alguna de las condiciones anteriores se
calcula y compara el valor del coeficiente de variación de cada
una de las distribuciones.
En cualquier caso, aquella distribución que presente el valor más
pequeño, al calcular la medida de dispersión adecuada, será la
más homogénea, es decir, la que presente menos variabilidad
entre los datos.
18. Ejemplo 3: Suponga que la nota promedio obtenida en
matemáticas por los alumnos de la sección A es igual a 14
puntos y la desviación típica es de 1,5 puntos. Suponga que la
nota media de este grupo en Inglés es 13,8 puntos con una
desviación típica igual a 1 punto. ¿En cuál asignatura la media
aritmética representa mejor al conjunto de notas?
Respuesta:
La media aritmética representa mejor al conjunto más
homogéneo, aquel cuyos datos están menos dispersos con
respecto a la media.
En el caso propuesto, la variable involucrada es la misma
(notas) y la media aritmética de los conjuntos es muy parecida
(13,8 ptos ≈14 ptos). Se compara la desviación típica de ambos
conjuntos y se concluye que la distribución de las notas de
Inglés es la más homogénea.