1. 4.1 VARIANZA Y DESVIACIÓN TÍPICA O ESTÁNDAR
La suma de las desviaciones de los datos con respecto a la media aritmética es un
indicador excelente de la variabilidad, la cual se representa por la expresión:
Xi X
Supongamos los siguientes datos:
X i = 3, 1, 4, 2, 0
Xi 10
Xi = 2
n 5
Las desviaciones con respecto a la media serian:
1 3 2 1
2 1 2 1
3 4 2 2
4 2 2 0
5 0 2 2
i 1 1 2 0 2 0
Este valor cero era inaceptable porque sugiere ausencia de la variabilidad. Para evitar
valores negativos los estadísticos elevaron al cuadrado todas las desviaciones y
dividieron este resultado entre N. Surgió entonces la siguiente formula de la variancia o
varianza:
4.1.1 Para datos no agrupados:
2
2
Xi
Variancia poblaciona l
N
[Escribir texto]
2. 2
Xi X
S2 Variancia muestral
n 1
En donde:
2
= Varianza poblacional
X i = Cada uno de los datos observados
= Media poblacional
N= Tamaño de la población
S 2 = Varianza Muestral
X = Media Muestral
n= Tamaño Muestral
Debido a que no se podía hacer comparaciones entre la media y la varianza por estar al
cuadrado 2 , surgió la formula de la desviación estándar:
S S2
Ejemplo 1. Calcular la variancia y la desviación estándar de los siguientes datos:
3, 1, 4, 2, 0: X = 2
Solución
Xi Y - X
i
( Yi - X ) 2
3 1 1
1 -1 1
4 2 4
[Escribir texto]
3. 2 0 0
0 -2 4
2
10 Xi X
2
2
Xi X
S
n 1
10
S2 2,5 S2 2,5 1,5811
4
4.1.2 Las formulas para el cálculo de la varianza y la desviación típica para datos
agrupados son los siguientes:
2 Varianza y desviación estándar
X X n
S2 i i;
n 1
Muestral.
2
X X n
S i i
n 1
Varianza y desviación estándar
Poblacional
2 2
X n X n
2 i i ; i i
N N
En donde:
S 2 = Variancia Muestral
= Sumatoria desde i = 1 hasta m = Numero de intervalos.
[Escribir texto]
4. Xi = Marcas de clase
n = Frecuencias absolutas
i
2
= Varianza poblacional
= Desviación típica poblacional
X = Media Muestral
= Media Poblacional
Observación 1. Para datos no agrupados X , Simboliza los valores de la variable. Para
datos agrupados X i indica la marca de clase.
Ejemplo 2. Calcular la varianza y la desviación estándar de los siguientes datos
agrupados.
Calificaciones Estudiantes
Li - Ls ni
40 – 49 5
50 – 59 2
60 – 69 12
70 – 79 14
80 – 89 9
90 – 99 6
3476
X 72,4167
48
[Escribir texto]
5. Solución
2
Y X n
La fórmula para la varianza es S 2 i i y para su cálculo adicionamos, a la
n 1
tabla anterior, las siguientes columnas:
2 2
Xi , Y X y Yi X n
i i
Calificaciones Estudiantes
2 2
Li Ls ni Y
i
Y
i
X Y
i
X f
i
40 – 49 5 44,5 779.3421 3896,7105
50 – 59 2 54,5 321,0081 642,0162
60 – 69 12 64,5 62,6741 752,0892
70 – 79 14 74,5 4,3401 60,7614
80 – 89 9 84,5 146,0061 1314,0553
90 – 99 6 94,5 487.6721 2926,0326
9591,666
2
El ultimo valor de la quinta columna es X
i
X n = 9591,6664 que es el
i
numerador de la fórmula de la varianza, entonces
2
X X n 9591,6664
S2 i i 204,078
n 1 48 1
[Escribir texto]
6. La desviación estándar es:
S S2 204,078
S 14,2856
4.1.3 Otra fórmula para la varianza y la desviación estándar
Es fácil de demostrar que la expresión
2
2 2 Xi
Xi X es igual a Xi
n
Por lo tanto,
2
2 Xi
2 Xi
2
Xi X n
S Para datos no agrupados
n 1 n 1
2
X n
X n 2 i i
i i
S2 n Para datos agrupados
n 1
2
2 Xi
Observación 2. La expresión Xi se denomina suma de cuadrados
n
[Escribir texto]