2. Medidas de dispersión
Son estadígrafos de dispersión que permiten evaluar el grado de homogeneidad, dispersión
o variabilidad de un conjunto de datos.
Muestran la variabilidad de una distribución, indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy alejadas de la media.
•Proporciona información adicional que permite juzgar la confiabilidad de la medida de
tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es
menos representativa de los datos.
•Coexisten problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
•Comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersión de valores con respecto al centro de distribución o esto presenta riesgos
inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que
tengan las dispersiones más grandes.
•Dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que
la dispersión ocurre frecuentemente y su grado de variabilidad.
Utilidad: Cuanto mayor sea ese valor, mayor será la variabilidad,
cuanto menor sea, más homogénea será a la media. Así se sabe si
todos los casos son parecidos o varían mucho entre ellos.
3. 0
5
10
15
Tipos:
Amplitud o Rango
Desviación Estándar
Varianza
Coeficiente de variabilidad
Rango (R)
Es la diferencia en el valor mínimo y el valor máximo en un grupo de números aleatorios.
Requisitos
Ordenar los números según su tamaño
Restamos el valor mínimo del valor máximo
Ejemplo: para una muestra (20, 45, 50, 55, 100) el dato menor es 20 y el dato mayor es 100.
Sus valores se encuentran en un rango = 100 – 20 = 80
Medio Rango (Rx)
Es la medida que un conjunto de valores numéricos se encuentra en la mitad del camino
entre el dato de menor valor y el dato de mayor valor.
Ejemplo: Para un muestra de valores (2, 5, 7, 8, 9), el dato de menor valor es el 2 y el dato
de mayor de valor es el 9.
El Rx = 2 + 9 = 11
Rx = 11 / 2 = 5.5
Utilidad: mide la amplitud de los valores de la
muestra y se calcula por diferencia entre el
valor más elevado y el valor más bajo.
4. Se calcula como raíz cuadrada de la varianza.
0
2
4
0 2 4
Desviación
Es la diferencia en el valor absoluto entre cada valor de la
variable estadística y la media aritmética.
Debido a que la desviación se expresa en términos absoluto,
se toma el valor en números naturales, es decir, sin tomar
en cuenta que sean negativos.
Se debe expresar todos los números como positivos.
Desviación típica (σ)
Es la raíz cuadrada de la varianza. Una ventaja obvia de la desviación típica sobre la
varianza es que la desviación típica viene dada en las mismas unidades de medida que
los datos originales (en la varianza las unidades están al cuadrado).
PROPIEDADES DE LA DESVIACIÓN TÍPICA
La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la desviación típica no varía.
Si todos los valores de la variable se multiplican por un número la desviación típica
queda multiplicada por dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
desviaciones típicas se puede calcular la desviación típica total.
Ejemplo: Tenemos como Varianza = 24,96
entonces la desviación típica seria igual a: σ = = 4,996
5. Varianza (σ)
Es la medida aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
Existen dos tipos de varianza.
Varianza poblacional.
Varianza muestral.
VARIANZA POBLACIONAL: Varianza de toda la población.
Es el valor medio de las desviaciones con respecto a la media, elevadas al cuadrado.
Su fórmula es:
•El proceso para calcular la varianza poblacional es el siguiente:
•Calcular la media aritmética.
•Comprobar ٤ (X-u) = 0, por cada número se resta la media poblacional y se realiza la
sumatoria.
•Calcular (X-u) 2
•Obtener varianza.
Utilidad: Mide la distancia
existente entre los valores de la
serie y la media
0 2 4 6
6. VARIANZA MUESTRAL: varianza de una muestra de la población.
Su fórmula es:
La varianza muestral es el valor medio de las desviaciones con respecto a la media,
elevadas al cuadrado.
El proceso para calcularla es el siguiente:
Calcular X 2
Calcular ٤ X y ٤ X 2
Reemplazar en la fórmula.
Para calcularla se tiene que calcular la desviación entre cada valor y la media.
Elevamos esos valores al cuadrado.
Luego lo dividimos entre (n).
La varianza es siempre positiva.
Si a los datos de la distribución les sumamos una cantidad constante la varianza no se
modifica.
7. Si a los datos de la distribución los multiplicamos por una constante, la varianza queda
multiplicada por el cuadrado de esa constante.
Propiedad distributiva: , siempre y cuando
las variables y sean independientes
Ejemplo: un grupo de estudiantes saco las siguientes notas:
04, 10, 16, 09, 11, 16, 18, 2, 05, 14, 16
La media es 12,64
Varianza:
8. Coeficiente de variabilidad
Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se
compara la desviación estándar con el respectivo valor del promedio de los datos.
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas
distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en mayor
medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el
C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente
implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad aplicada, como
teoría de renovación y teoría de colas. En estos campos la distribución exponencial es a
menudo más importante que la distribución normal. La desviación típica de una distribución
exponencial es igual a su media, por lo que su coeficiente de variación es 1.
Sirve para calcular el cociente
entre la desviación típica y la
media.
9. CV=
Grado de variabilidad de los datos Coeficiente de variabilidad
Variabilidad baja Menos de 10%
Variabilidad moderada De 10% a 30%
Variabilidad alta Más de 30%
Media = 25,97 CV=
Desviación típica= 13,13 CV= 0.50558337x100 = 50,56%