Este documento describe diferentes estadígrafos de dispersión como la varianza, desviación estándar, desviación media y coeficiente de variación. Explica cómo calcular estas medidas para datos agrupados y diferencia entre análisis de población y muestra. También incluye un ejemplo resuelto sobre el cálculo de estos estadígrafos para datos de duración de diferentes conservantes.
Por que consumimos como consumimos los colombianos derco - mayo de 2016
Carlos
1. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
ÍNDICE.
ESTADÍGRAFOS DE DISPERSIÓN. ................................................................................................... 1
VARIANZA. ...................................................................................................................................... 1
DESVIACIÓN ESTÁNDAR Ó TÍPICA............................................................................................... 2
DESVIACIÓN MEDIA....................................................................................................................... 2
COEFICIENTE DE VARIACIÓN Ó COEFICIENTE DE VARIACIÓN DE PEARSON ........................ 4
VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA MUESTRA Y UNA POBLACIÓN........................... 4
ANÁLISIS DE LA VARIANZA............................................................................................................... 4
TÉRMINOS:......................................................................................................................................... 5
VARIANZA Y DESVIACIÓN PARA DATOS AGRUPADOS. ................................................................ 5
BIBLIOGRAFÍA.................................................................................................................................... 6
EJERCICIO RESUELTO...................................................................................................................... 7
ESTADÍGRAFOS DE DISPERSIÓN.
Los estadígrafos de dispersión son aquellos que nos determinan ó indican como se comportan los
datos alrededor de un promedio.
Los estadígrafos de dispersión son:
VARIANZA.
La varianza es una de las medidas más utilizadas dentro de los estadígrafos de dispersión. La
varianza se define como el promedio de la diferencia de cada uno de los datos respecto a su media,
en otras palabras:
n
Xx
n
i
i∑=
−
= 1
2__
2
σ
Una de las características de la varianza, es que el resultado obtenido se encuentra en una unidad de
medida distinta a la de los datos tomados, por tanto puede no llegar a decirnos mucho sobre la
realidad de la distribución. De igual manera, por estar elevadas al cuadrado cada una de las
observaciones, el valor obtenido podrá llegar a ser más alto que las observaciones mismas.
Ejemplo:
Prueba Tiempo Media
−
__
Xxi
2__
− Xxi
Prueba 1 4,8 Min 5,2 Min (0,435) 0,189Min2
Prueba 2 4,9 Min 5,2 Min (0,335) 0,112Min2
Prueba 3 5,0 Min 5,2 Min (0,235) 0,055Min2
Prueba 4 5,0 Min 5,2 Min (0,235) 0,055Min2
Prueba 5 5,0 Min 5,2 Min (0,235) 0,055Min2
Prueba 6 5,1 Min 5,2 Min (0,135) 0,018Min2
2. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
Prueba Tiempo Media
−
__
Xxi
2__
− Xxi
Prueba 7 5,1 Min 5,2 Min (0,135) 0,018Min2
Prueba 8 5,1 Min 5,2 Min (0,135) 0,018Min2
Prueba 9 5,1 Min 5,2 Min (0,135) 0,018Min2
Prueba 10 5,2 Min 5,2 Min (0,035) 0,001Min2
Prueba 11 5,2 Min 5,2 Min (0,035) 0,001Min2
Prueba 12 5,2 Min 5,2 Min (0,035) 0,001Min2
Prueba 13 5,2 Min 5,2 Min (0,035) 0,001Min2
Prueba 14 5,2 Min 5,2 Min (0,035) 0,001Min2
Prueba 15 5,3 Min 5,2 Min 0,065 0,004Min2
Prueba 16 5,3 Min 5,2 Min 0,065 0,004Min2
Prueba 17 5,3 Min 5,2 Min 0,065 0,004Min2
Prueba 18 5,4 Min 5,2 Min 0,165 0,027Min2
Prueba 19 5,4 Min 5,2 Min 0,165 0,027Min2
Prueba 20 5,5 Min 5,2 Min 0,265 0,070Min2
Prueba 21 5,6 Min 5,2 Min 0,365 0,133Min2
Prueba 22 5,7 Min 5,2 Min 0,465 0,216Min2
Prueba 23 5,8 Min 5,2 Min 0,565 0,319Min2
∑ 1,352Min2
23
M352,1 2
2 in
=σ
0,0588Min2
DESVIACIÓN ESTÁNDAR Ó TÍPICA.
La desviación estándar la definimos simplemente como la raíz cuadrada de la varianza, de esta forma
tenemos:
n
Xx
n
i
i∑=
−
= 1
2__
σ Representativamente podemos utilizar el término 2
σ para la varianza y σ para la
desviación estándar.
Continuando con el ejemplo anterior tendríamos:
23
M352,1 2
2 in
=σ =0,0588Min2
para la varianza, y
sacando la raíz tendríamos 0,242Min
DESVIACIÓN MEDIA.
3. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
La desviación media tiene un poco menos de importancia que las varianza y la desviación estándar.
La desviación media se define como la media de las desviaciones respecto a la media aritmética,
tomadas en valor absoluto. Su ecuación es:
n
Xx
MD
i∑ −
=
___
.
Ejemplo:
Tomando los datos del ejemplo anterior:
Prueba Tiempo Media
−
__
Xxi
__
Xxi −
Prueba 1 4,8 Min 5,2 Min -0,4 0,4348
Prueba 2 4,9 Min 5,2 Min -0,3 0,3348
Prueba 3 5,0 Min 5,2 Min -0,2 0,2348
Prueba 4 5,0 Min 5,2 Min -0,2 0,2348
Prueba 5 5,0 Min 5,2 Min -0,2 0,2348
Prueba 6 5,1 Min 5,2 Min -0,1 0,1348
Prueba 7 5,1 Min 5,2 Min -0,1 0,1348
Prueba 8 5,1 Min 5,2 Min -0,1 0,1348
Prueba 9 5,1 Min 5,2 Min -0,1 0,1348
Prueba 10 5,2 Min 5,2 Min 0,0 0,0348
Prueba 11 5,2 Min 5,2 Min 0,0 0,0348
Prueba 12 5,2 Min 5,2 Min 0,0 0,0348
Prueba 13 5,2 Min 5,2 Min 0,0 0,0348
Prueba 14 5,2 Min 5,2 Min 0,0 0,0348
Prueba 15 5,3 Min 5,2 Min 0,1 0,0652
Prueba 16 5,3 Min 5,2 Min 0,1 0,0652
Prueba 17 5,3 Min 5,2 Min 0,1 0,0652
Prueba 18 5,4 Min 5,2 Min 0,2 0,1652
Prueba 19 5,4 Min 5,2 Min 0,2 0,1652
Prueba 20 5,5 Min 5,2 Min 0,3 0,2652
Prueba 21 5,6 Min 5,2 Min 0,4 0,3652
Prueba 22 5,7 Min 5,2 Min 0,5 0,4652
Prueba 23 5,8 Min 5,2 Min 0,6 0,5652
∑ 4,3739
n
Xx
MD
i∑ −
=
___
. =
0,1902
4. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
COEFICIENTE DE VARIACIÓN Ó COEFICIENTE DE VARIACIÓN DE PEARSON
Una de las desventajas del análisis de varianza es cuando las variables que se presentan están
expresadas en distintas medidas ó unidades, con lo cual nos interesaría determinar la variación
respecto a una base. De esta forma el coeficiente de variación podemos definirlo como:
%100___
x
X
S
Cv =
Continuando con el ejercicio anterior tendríamos:
%100
2,5
0,242°C
xCv = = 4,6 %
VARIANZA Y DESVIACIÓN ESTÁNDAR DE UNA MUESTRA Y UNA POBLACIÓN.
La varianza y desviación estándar que se ha presentando hasta el momento, están especificadas
para una población, sin embargo, rara vez podemos realizar un análisis poblacional de estos
estadígrafos, por ello es necesario que tengamos en cuenta el análisis para la muestra.
La formula la para el análisis de la varianza y la desviación estándar es:
1
1
2__
2
−
−
=
∑=
n
Xx
S
n
i
i
Para la varianza y
1
1
2__
−
−
=
∑=
n
Xx
S
n
i
i
para la desviación estándar
(n-1) nos da los grados de libertad. En toda operación estadística, los grados de libertad están
determinados por todas las observaciones menos todas las restricciones impuestas por estas
observaciones.
ANÁLISIS DE LA VARIANZA.
Como ya hemos mencionado, la varianza y la desviación estándar nos mide el promedio de la
diferencia elevada al cuadrado de cada dato respecto a la media. Por tanto debemos tener presente
lo siguiente:
Entre más alta sea la varianza y la desviación estándar, mayor es la desviación de los datos, de igual
manera entre menor sea la varianza y la desviación estándar, menor es la dispersión de los datos
frente a la media.
¿Qué pasa si la varianza ó la desviación estándar es igual a cero?
Solo cuando la diferencia entre cada dato y su promedio es cero, la varianza es cero, por tanto,
podemos decir que cada dato es igual al promedio.
Esto también puede ser aplicado al coeficiente de variación y desviación media.
5. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
TÉRMINOS:
Teniendo presente lo que hemos expuesto en relación a la diferencia entre la población y la muestra,
podemos resumir el uso de los términos según la siguiente tabla:
Promedio Varianza Desviación
Muestra
___
X
2
S S
Población µ 2
σ σ
VARIANZA Y DESVIACIÓN PARA DATOS AGRUPADOS.
Al igual que se ha especificado para en las clases anteriores, para el caso de los datos agrupados
tendremos:
n
nYy
n
i
ii∑=
−
= 1
2__
2
σ Para el caso de la varianza de la una población,
n
nYy
n
i
ii∑=
−
= 1
2__
σ Para el caso de la desviación estándar de la población.
Para el caso de la muestra debemos dividir por n-1, como lo expresamos anteriormente.
6. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
BIBLIOGRAFÍA
ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2001). ESTADÍSTICA PARA
ADMINIISTRACIÓN Y ECONOMÍA (7a ed., Vol. I). (V. GONZALEZ POZO, Trad.) Buenos Aires,
Argentina: Internacional Thomson Editores.
ANDERSON, D. R., SWEENEY, D. J., & WILLIAMS, T. A. (2008). ESTADÍSTICA PARA
ADMINISTRACIÓN Y ECONOMÍA (10a Edición ed.). (S. R. CERVANTES GONZÁLEZ, Ed.) México
D.F., México: CENGAGE Learning.
LIND, D. A., MARCHAL, W. G., & MASON, R. D. (2004). ESTADÍSTICA PARA ADMINISTRACIÓN Y
ECONOMÍA (11 ed.). (F. D. CASTRO PEREZ, M. CUPA LEÓN, Edits., & M. D. HANO ROA, Trad.)
Bogotá D.C., Colombia: ALFAOMEGA.
MENDENHALL, W. (1990). ESTADISTICA PARA ADMINISTRADORES (1era ed.). (N. GREPE P,
Ed., & D. VALCKX VERBEECK, Trad.) México D. F., México: Grupo Editorial Iberoamérica S.A. de
CV.
7. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
EJERCICIO RESUELTO.
1. Para pruebas de duración de un producto, se encontraron los siguientes datos.
Usted tiene que decidir cual del conservante va a
utilizar basándose en la varianza, desviación estándar y
desviación media. Grafique los datos obtenidos. Saque
conclusiones.
Desarrollo:
Los primero que debemos hacer es sacar el promedio
de cada una de las mediciones. Utilizando la formula:
n
x
n
i
i∑=
= 1
µ
De esta forma tenemos para cada uno de los datos:
Acido
sórbico
Sorbato
sódico
Sorbato
potásico
Promedio 5,6 5,8 5,7
Una vez que hemos hayado los promedios hayamos la
varianza para cada uno de los datos. Así:
De esta forma tenemos:
20
1,138Dias2 2
2
=σ =1,056875, que seria nuestra varianza.
Para el caso de la desviación estandar tendríamos:
1,02804426, que es simplemente la raíz cuadrada de la
varianza.
Continuando, para el Sorbato Sódico.
Acido sórbico Sorbato sódico Sorbato potásico
Dato1 5 6 5,5
Dato2 4,5 7 6
Dato3 5 6 6
Dato4 6 6 5,5
Dato5 5 6 5,5
Dato6 4 6 6,5
Dato7 4,5 6 7
Dato8 5 7 6,5
Dato9 6 7 6,8
Dato10 6 7 5,5
Dato11 7 5 5,8
Dato12 5 5 5,5
Dato13 6 5 5,4
Dato14 4 5 5
Dato15 5 5 4,8
Dato16 6 5 4,8
Dato17 7 6 4,7
Dato18 6 6 5,2
Dato19 8 5 5,3
Dato20 6,5 5 5,8
Acido sórbico
−
__
Xxi
2__
− Xxi
Dato1 5 -0,575 0,3306
Dato2 4,5 -1,075 1,1556
Dato3 5 -0,575 0,3306
Dato4 6 0,425 0,1806
Dato5 5 -0,575 0,3306
Dato6 4 -1,575 2,4806
Dato7 4,5 -1,075 1,1556
Dato8 5 -0,575 0,3306
Dato9 6 0,425 0,1806
Dato10 6 0,425 0,1806
Dato11 7 1,425 2,0306
Dato12 5 -0,575 0,3306
Dato13 6 0,425 0,1806
Dato14 4 -1,575 2,4806
Dato15 5 -0,575 0,3306
Dato16 6 0,425 0,1806
Dato17 7 1,425 2,0306
Dato18 6 0,425 0,1806
Dato19 8 2,425 5,8806
Dato20 6,5 0,925 0,8556
∑ 21,138
8. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
De esta forma tenemos:
20
1,2Dias1 2
2
=σ =0,56, que seria nuestra varianza.
Para el caso de la desviación estándar tendríamos:
0,74833148, que es simplemente la raíz cuadrada de la
varianza.
Continuando, para el Sorbato Sódico.
De esta forma tenemos:
20
,1495Dias8 2
2
=σ =0,407475, que seria nuestra varianza.
Para el caso de la desviación estándar tendríamos:
0,63833768, que es simplemente la raíz cuadrada de la
varianza.
Resumiendo tenemos:
Sorbato
sódico
−
__
Xxi
2__
− Xxi
Dato1 6 0,2 0,04
Dato2 7 1,2 1,44
Dato3 6 0,2 0,04
Dato4 6 0,2 0,04
Dato5 6 0,2 0,04
Dato6 6 0,2 0,04
Dato7 6 0,2 0,04
Dato8 7 1,2 1,44
Dato9 7 1,2 1,44
Dato10 7 1,2 1,44
Dato11 5 -0,8 0,64
Dato12 5 -0,8 0,64
Dato13 5 -0,8 0,64
Dato14 5 -0,8 0,64
Dato15 5 -0,8 0,64
Dato16 5 -0,8 0,64
Dato17 6 0,2 0,04
Dato18 6 0,2 0,04
Dato19 5 -0,8 0,64
Dato20 5 -0,8 0,64
∑ 11,2
Sorbato de
Potacio
−
__
Xxi
2__
− Xxi
Dato1 5,5 -0,155 0,024
Dato2 6 0,345 0,119
Dato3 6 0,345 0,119
Dato4 5,5 -0,155 0,024
Dato5 5,5 -0,155 0,024
Dato6 6,5 0,845 0,714
Dato7 7 1,345 1,809
Dato8 6,5 0,845 0,714
Dato9 6,8 1,145 1,311
Dato10 5,5 -0,155 0,024
Dato11 5,8 0,145 0,021
Dato12 5,5 -0,155 0,024
Dato13 5,4 -0,255 0,065
Dato14 5 -0,655 0,429
Dato15 4,8 -0,855 0,731
Dato16 4,8 -0,855 0,731
Dato17 4,7 -0,955 0,912
Dato18 5,2 -0,455 0,207
Dato19 5,3 -0,355 0,126
Dato20 5,8 0,145 0,021
∑ 8,1495
Acido sórbico Sorbato sódico Sorbato potásico
9. ESTADÍSTICA I
ESTADÍGRAFOS DE DISPERSIÓN
Iván Fernando Suarez Lozano
¿Cuál escogería?
Debo asumir que el mayor tiempo de
duración promedio debe ser el elegido,
sin embargo, es importante que
tengamos presente que los tiempos son
muy cercanos entre sí, por tanto
debemos dar prioridad a la desviación
de los datos, teniendo presente que
debemos dar prioridad a la menor
desviación puesto que nos da mayor
seguridad en relación a la duración de
los tiempos. Podemos asumir entonces
que la menor desviación nos dará una
mayor seguridad que los datos se
desviaran muy poco respecto a la media,
por tanto podría asumir que el sorbato
de Potasio seria el elegido.
Dato1 5 6 5,5
Dato2 4,5 7 6
Dato3 5 6 6
Dato4 6 6 5,5
Dato5 5 6 5,5
Dato6 4 6 6,5
Dato7 4,5 6 7
Dato8 5 7 6,5
Dato9 6 7 6,8
Dato10 6 7 5,5
Dato11 7 5 5,8
Dato12 5 5 5,5
Dato13 6 5 5,4
Dato14 4 5 5
Dato15 5 5 4,8
Dato16 6 5 4,8
Dato17 7 6 4,7
Dato18 6 6 5,2
Dato19 8 5 5,3
Dato20 6,5 5 5,8
Promedio 5,6 5,8 5,7
Varianza 1,057 0,560 0,407
Desviación estándar 1,028 0,748 0,638