Fowler, Will. - Santa Anna, héroe o villano [2018].pdf
Medidas de dispersión y forma en estadística
1. 1
. Estadística. UNITEC Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
Estadística
Tema 4: Medidas de Dispersión y Forma
2. 2
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Medidas de variabilidad o dispersión
La variabilidad o dispersión de un grupo de datos se refiere al arreglo de dichos datos
en referencia a las medidas de tendencia central estudiadas en temas previos.
Por ejemplo, definimos la media aritmética como el centro de masa de un grupo de
datos; sin embargo, estos datos pueden estar agrupados muy cerca de la media o
tener un campo amplio de valores a derecha e izquierda de esta.
Definimos medidas de dispersión a indicadores del comportamiento de los datos; es
decir, indicadores calculados sobre los datos que de acuerdo a sus valores numéricos
se interpretan en términos de agrupación de los mismos.
Los mas comunes son: el rango o amplitud, la desviación cuartílica, el rango percentil,
la desviación media, la varianza, la desviación típica y el coeficiente de variación.
3. 3
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Rango o Amplitud
El rango o amplitud de un conjunto de datos
es la diferencia entre el valor mas grande y
el valor mas pequeño del conjunto.
Menor
Valor
Mayor
Valor
Rango −
=
Por su simplicidad, el rango proporciona
una rápida indicación de la variabilidad
existente entre las observaciones; sin
embargo como medida de dispersión debe
usarse con precaución, sobretodo si el
conjunto de observaciones es grande.
4. 4
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Desviación Cuartílica
La desviación cuartílica (Q) es la distancia
media entre el primer y el tercer cuartil, o
entre los percentiles 25 y 75.
2
P
P
2
Q
Q
Q 25
75
1
3 −
=
−
=
Q es una medida de variabilidad útil y de
fácil computo. Para propósitos descriptivos
es definitivamente superior al rango.
25%
25%
25%
25%
5. 5
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Rango Percentil
El rango percentil (D) es la amplitud entre el
percentil 10 y el percentil 90, o entre los
deciles 1 y 9.
1
9
10
90 D
D
P
P
D −
=
−
=
D es una medida de variabilidad un poco
mas estable que el rango y un poco mas
fácil de calcular que otras medidas mas
usadas; sin embargo, a pesar de estas
ventajas, es una medida poco empleada.
10%
10%
90%
6. 6
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Desviación Media
La diferencia entre el valor de cada observación y la media aritmética se denomina
desviación. La suma de las desviaciones de todas las observaciones respecto a su
media es nula.
Llamamos desviación media a la sumatoria de los valores absolutos de las
desviaciones de las observaciones respecto a su media dividida entre el número de
observaciones.
∑
=
−
=
n
1
i
i |
x
x
|
n
1
DM
La desviación media nos indica la distancia promedio a la que se encuentran los
valores de las observaciones a derecha e izquierda de la media aritmética. Es una
medida de variabilidad mas sencilla de calcular que la desviación típica; aunque
menos usada que esta última.
7. 7
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Varianza
La varianza es la sumatoria de los cuadrados de las desviaciones de las observaciones
respecto a su media dividida entre el número de observaciones o entre el número de
observaciones menos una.
Cuando se calcula la varianza de toda una población o de una muestra con un número
muy grande de datos, se denomina la varianza con la letra griega sigma y se divide
entre el número total de observaciones. Cuando se trabaja con muestras pequeñas, la
varianza se denota con la letra s y se divide entre el número total de observaciones
menos una.
( )∑
∑ =
=
−
−
=
µ
−
=
σ
n
1
i
2
i
2
n
1
i
2
i
2
)
x
x
(
1
n
1
s
)
x
(
n
1
En la práctica, estas fórmulas se reducen a:
( )
1
n
x
n
1
)
x
(
s
n
x
n
1
)
x
(
2
n
1
i
i
n
1
i
2
i
2
2
n
1
i
i
n
1
i
2
i
2
−
−
=
−
=
σ
∑
∑
∑
∑ =
=
=
=
8. 8
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Desviación Típica
La desviación típica o desviación estandar es la raiz cuadrada positiva de la varianza.
Tiene la ventaja, con respecto a la varianza, de que viene expresada en las mismas
unidades de la variable estudiada. (la varianza se expresa en unidades cuadradas)
( )∑
∑ =
=
−
−
=
=
µ
−
=
σ
=
σ
n
1
i
2
i
2
n
1
i
2
i
2
)
x
x
(
1
n
1
s
s
)
x
(
n
1
O bien, como en el caso de la varianza:
( )
1
n
x
n
1
)
x
(
s
n
x
n
1
)
x
(
2
n
1
i
i
n
1
i
2
i
2
n
1
i
i
n
1
i
2
i
−
−
=
−
=
σ
∑
∑
∑
∑ =
=
=
=
9. 9
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Coeficiente de Variación
Es la razón entre la desviación típica y la media aritmética, expresada en
porcentaje.
Es una medida adimensional, cuyo valor nos permite conocer cuan agrupados
están los valores alrededor de la media aritmética; de acuerdo al porcentaje de la
media que representa la desviación típica.
100
*
x
s
CV =
El coeficiente de variación es útil cuando se compara la variabilidad de dos o mas
conjuntos de datos que difieren de manera considerable en la magnitud de las
observaciones.
10. 10
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Datos Agrupados
Las expresiones dadas para la desviación media y para la varianza se modifican,
para datos agrupados en tablas de frecuencia, de la siguiente manera:
( )
( )
[ ]
( )
[ ]
∑
∑
∑
=
=
=
−
−
=
−
−
=
−
=
n
1
i
i
2
i
n
1
i
i
2
i
2
n
1
i
i
i
f
*
)
x
x
(
1
n
1
s
f
*
)
x
x
(
1
n
1
s
f
*
|
x
x
|
n
1
DM
11. 11
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Forma de la gráfica
Después de trazar algunos polígonos de frecuencia, se ve que las curvas tienden a
adoptar formas que pueden clasificarse en varios tipos.
Esta clasificación toma en cuenta las medidas de tendencia central y la dispersión de
los datos; es decir, la forma de la gráfica depende del patrón de agrupación de los
datos.
Definimos medidas de dispersión a indicadores del patrón de agrupación de los datos;
es decir, indicadores calculados sobre los datos que de acuerdo a sus valores
numéricos se interpretan en términos de forma de las gráficas de distribución.
Los mas comunes son: la asimetría o sesgo y la curtosis o apuntamiento.
12. 12
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Asimetría o Sesgo
„ Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de
su mitad derecha.
„ En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también
coincide
„ La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la
distribución.
13. 13
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Asimetría o Sesgo
„ La media tiende a desplazarse hacia las valores extremos (colas).
„ Las discrepancias entre las medidas de centralización son indicación de asimetría.
14. 14
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Coeficiente de Asimetría
Es una medida adimensional que, de acuerdo a su signo, nos indica el grado de
asimetría que posee una distribución. Si es negativo indica asimetría a la izquierda,
si es positivo nos indica asimetría a la derecha y si es nulo nos indica que la
distribución es simétrica.
El cálculo de este indicador es relativamente complejo, por lo que en la mayoría de
los casos se prefiere observar la gráfica y realizar apreciaciones visuales acerca
del sesgo o usar alguno de los otros dos indicadores que, aunque algo menos
confiables que este, son mas sencillos de calcular.
15. 15
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Indice Basado en los Tres Cuartiles
1
2
2
3 Q
Q
Q
Q −
=
−
1
2
2
3 Q
Q
Q
Q −
>
−
Si una distribución es simétrica, es claro que deben haber tantas observaciones entre
la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana,
como entre la mediana y la que deja por debajo de sí un cuarto de todas las
observaciones. De forma abreviada esto es,
Distribución asimétrica positiva (figura)
1
2
2
3 Q
Q
Q
Q −
<
−
Distribución asimétrica negativa
( ) ( )
( )
1
Q
Q
Q
Q
Q
Q
A
1
Asimetría
de
Indice
1
3
1
2
2
3
s ≤
−
−
−
−
=
≤
−
16. 16
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Coeficientes de Sesgo de Pearson
Basándonos en que si una distribución de frecuencias es simétrica y unimodal,
entonces la media, la mediana y la moda coinciden, podemos definir otras medidas de
asimetría, como son:
( )
s
Md
x
3
A
s
Mo
x
A
2
1
−
=
−
=
Los indices anteriores se conocen como primer y segundo coeficientes de sesgo de
Pearson, respectivamente.
El signo de cualquiera de los dos indicadores que usemos nos permiten concluir
acerca de la asimetría; es decir, si el indicador es negativo la distribución tienen
asimetría negativa y si es positivo, pues la asimetría es positiva.
17. 17
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Apuntamiento o Curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución
con respecto a la distribución normal o gaussiana. Es adimensional.
Platicúrtica: curtosis < 0
Mesocúrtica: curtosis = 0
Leptocúrtica: curtosis > 0
En la práctica se usa un indice mas fácil
de calcular llamado coeficiente percentil
de curtosis. Para la distribución normal
este coeficiente vale 0,263
( )
10
90
1
3
P
P
Q
Q
2
1
D
Q
−
−
=
=
κ
18. 18
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Apuntamiento o Curtosis
Leptocúrti
ca
138
108
102
97
92
87
82
77
72
67
62
57
52
47
42
37
32
27
16
3
F
re
cu
e
n
ci
a
400
300
200
100
0
Platicúrtica
84
81
78
75
72
69
66
63
60
57
54
51
48
45
Frecuencia
160
140
120
100
80
60
40
Mesocúrtica
99
93
89
85
81
77
73
69
65
61
57
53
49
45
41
37
32
27
Frecuencia
300
200
100
0
Los gráficos siguientes poseen la misma media y desviación típica, pero con diferente
grado de apuntamiento.
19. 19
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Ejemplo con datos no agrupados
De acuerdo con la revista Informes al Consumidor en su número de febrero de 1980, las
cuotas anuales de 40 compañías para un seguro de $ 25000 para hombres de 35
años de edad son la siguientes: (en $) (Canavos, 1988. p 5)
Hallar el rango, la desviación cuartílica, el rango percentil, la desviación media, la
varianza, la desviación típica, el coeficiente de variación, la asimetría y la curtosis.
112
110
110
109
107
107
107
106
103
97
92
86
103
98
93
87
101
95
91
85
105
105
104
103
101
100
100
99
99
95
95
95
95
94
91
90
89
89
87
82
20. 20
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo del Rango y la Desviación Cuartílica
Para calcular la desviación cuartílica necesitamos hallar el primer y el tercer cuartil.
112
110
110
109
107
107
107
106
103
97
92
86
103
98
93
87
101
95
91
85
105
105
104
103
101
100
100
99
99
95
95
95
95
94
91
90
89
89
87
82
30
82
112
Menor
Valor
Mayor
Valor
Rango =
−
=
−
=
5
,
6
2
5
,
91
5
,
104
2
Q
Q
Q
5
,
104
2
105
104
Q
5
,
91
2
92
91
Q 1
3
3
1 =
−
=
−
=
=
+
=
=
+
=
( ) ( ) 30
40
4
3
10
40
4
1
=
∧
=
Primero multiplicamos el total de datos
por las fracciones correspondiente al
primer y al tercer cuartil.
Dado que los resultados son enteros,
promediamos el dato 10 con el dato 11,
obteniendo el primer cuartil, y el dato 30
con el 31, obteniendo el tercer cuartil.
21. 21
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo del Rango Percentil
Para calcular el rango percentil necesitamos hallar los percentiles 10 y 90.
112
110
110
109
107
107
107
106
103
97
92
86
103
98
93
87
101
95
91
85
105
105
104
103
101
100
100
99
99
95
95
95
95
94
91
90
89
89
87
82
21
87
108
P
P
D
108
2
109
107
P
87
2
87
87
P 10
90
90
10 =
−
=
−
=
=
+
=
=
+
=
( ) ( ) 36
40
100
90
4
40
100
10
=
∧
=
Primero multiplicamos el total de datos
por las fracciones correspondiente a los
percentiles 10 y 90.
Dado que los resultados son enteros,
promediamos el dato 4 con el dato 5,
obteniendo el percentil 10, y el dato 36
con el 37, obteniendo el percentil 90.
22. 22
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Media Aritmética y la Desviación Media
925
,
97
40
3917
40
112
110
...
86
85
82
n
x
x
n
1
i
i
=
=
+
+
+
+
+
=
=
∑
=
[ ]
[ ] 629
,
6
075
,
14
...
925
,
12
925
,
15
40
1
x
x
n
1
DM
925
,
97
112
...
925
,
97
85
925
,
97
82
40
1
x
x
n
1
DM
n
1
i
i
n
1
i
i
=
+
+
+
=
−
=
⇒
−
+
+
−
+
−
=
−
=
∑
∑
=
=
La media aritmética es la suma de las observaciones dividida entre el total de estas.
La desviación media es la suma de los valores absolutos de las desviaciones de las
observaciones con respecto a la media dividido entre el total de observaciones.
23. 23
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Varianza, la Desviación Típica y el Coeficiente de Variación
( )
( ) ( ) ( ) ( )
[ ]
( )
( ) [ ] 712
,
61
1056
,
198
...
0556
,
167
6056
,
253
39
1
x
x
1
n
1
s
925
,
97
112
...
925
,
97
85
925
,
97
82
1
40
1
x
x
1
n
1
s
n
1
i
2
i
2
2
2
2
n
1
i
2
i
2
=
+
+
+
=
−
−
=
⇒
−
+
+
−
+
−
−
=
−
−
=
∑
∑
=
=
( )
( ) 856
,
7
712
,
61
x
x
1
n
1
s
n
1
i
2
i =
=
−
−
= ∑
=
La varianza es la suma de los cuadrados de las desviaciones de las observaciones
con respecto a la media dividido entre el total de observaciones menos uno.
La desviación típica es la raiz cuadrada positiva de la varianza.
El coeficiente de variación es la razón entre la desviación típica y la media aritmética,
expresada en porcentaje.
%
002
,
8
100
*
925
,
97
856
,
7
100
*
x
s
CV =
=
=
24. 24
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Asimetría
( )( )
( )
( )( )( )
( ) ( )
[ ]
( )( )
( )
( )( )( )
[ ] 098
,
0
337
,
2788
...
67
,
4038
856
,
7
38
39
40
x
x
s
2
n
1
n
n
A
925
,
97
112
...
925
,
97
82
856
,
7
2
40
1
40
40
x
x
s
2
n
1
n
n
A
3
n
1
i
3
i
3
3
3
3
n
1
i
3
i
3
−
=
+
+
−
=
−
−
−
=
⇒
−
+
+
−
−
−
=
−
−
−
=
∑
∑
=
=
( ) ( )
( )
( ) ( )
( )
077
,
0
5
,
91
5
,
104
5
,
91
5
,
98
5
,
98
5
,
104
Q
Q
Q
Q
Q
Q
A
1
3
1
2
2
3
s −
=
−
−
−
−
=
−
−
−
−
=
Calculemos, en primer lugar, el coeficiente de asimetría.
Esto indica que la distribución es ligeramente asimétrica a la izquierda. Veamos que nos
dice el indice basado en los tres cuartiles. Anteriormente calculamos los cuartiles 1 y 3 y
de clases previas conocemos la mediana que es el cuartil 2.
Aunque este valor es un poco mas bajo que el anterior, la conclusión a la que nos lleva
es similar con respecto a la asimetría negativa de la distribución de los datos.
25. 25
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Asimetría
( ) ( ) 219
,
0
856
,
7
5
,
98
925
,
97
3
s
Md
x
3
A
376
,
0
856
,
7
95
925
,
97
s
Mo
x
A
2
1
−
=
−
=
−
=
=
−
=
−
=
Calculemos ahora los coeficientes de sesgo de Pearson. En clases previas
calculamos la mediana y la moda de este grupo de datos.
Los resultados son contradictorios; aunque ambos indican una distribución casi
simétrica. El primer coeficiente de Pearson nos indica que la distribución es
asimétrica positiva; mientras que el segundo coeficiente de Pearson nos indica lo
contrario. Sabemos que la mediana esta mas cerca de la media que la moda en una
distribución con baja asimetría por lo tanto deberiamos confiar mas en el segundo
coeficiente; además los resultados previos se acercan mas a este.
26. 26
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Curtosis
( )
( )( )( )
( ) ( )( )
( )( )
( )
( )( )( )( )
[ ] ( )( )
( )( )
937
,
2
37
38
39
39
3
84
,
39245
...
81
,
64315
856
,
7
37
38
39
41
40
Cu
3
n
2
n
1
n
1
n
3
x
x
s
3
n
2
n
1
n
1
n
n
Cu
4
n
1
i
4
i
4
−
=
−
+
+
=
⇒
−
−
−
−
−
−
−
−
−
+
= ∑
=
( ) ( )
309
,
0
87
108
5
,
91
5
,
104
2
1
P
P
Q
Q
2
1
D
Q
10
90
1
3
=
−
−
=
−
−
=
=
κ
Primero calculemos el coeficiente de curtosis.
Esto indica que la gráfica de la distribución es platicúrtica; es decir, sin picos
pronunciados. Es una curva muy suave con apariencia de loma. Veamos el
coeficiente percentil de curtosis:
Este valor nos indica que la curva es casi mesocúrtica (recordar que una curtosis de
cero es un coeficiente percentil de curtosis igual a 0,263). ¿Podemos confiar en el?
27. 27
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Ejemplo con datos agrupados
Para el ejemplo de los salarios semanales de los 65 empleados de la empresa P&R hallar el rango,
la desviación cuartílica, el rango percentil, la desviación media, la varianza, la desviación típica
y el coeficiente de variación, agrupándolos en una tabla de distribución de frecuencias.
Construya el polígono de frecuencias y estudie la asimetría y la curtosis.
319.5
295
283
276.75
263
314.1
294.25
282
275
262
308
293
281.5
272.5
261
306.35
292
281.35
272.25
260.25
305
288
281
272
260
304
287
279
271
258
302.75
286.5
279
271
256
299.5
286.3
279
270.8
255.5
299
286
278
267
253
296.25
286
278
266.75
253
296
285
277.55
265
252.5
296
284
277
263.5
251
295
283.25
277
263
250
28. 28
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo del rango y construcción de la tabla
.
10
Ic
un
y
clases
7
con
tabla
una
construir
podemos
,
Asi
70
5
,
69
250
5
,
319
menor
valor
mayor
valor
Rango
=
≅
=
−
=
−
=
En cada clase vamos a considerar incluidos los límites inferiores; y por ende,
excluidos los límites superiores.
630
65
2
315
310 - 320
1525
63
5
305
300 – 310
2650
18
10
265
260 – 270
4400
34
16
275
270 – 280
3990
48
14
285
280 – 290
2950
58
10
295
290 – 300
250 – 260
Ic
2040
8
8
255
xi*fi
Fi
fi
xi
29. 29
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Desviación Cuartílica
65
2
315
310 - 320
63
5
305
300 – 310
18
10
265
260 – 270
34
16
275
270 – 280
48
14
285
280 – 290
58
10
295
290 – 300
250 – 260
Ic
8
8
255
Fi
fi
xi
Para calcular la desviación cuartílica necesitamos hallar el primer y el tercer cuartil.
( ) ( ) 75
,
48
65
4
3
25
,
16
65
4
1
=
∧
=
Primero multiplicamos el total de datos por las
fracciones correspondientes al primer y al tercer cuartil.
Dado que los resultados no son enteros, aproximamos
al dato inmediato superior. El primer cuartil
corresponde al dato 17 (segunda clase), y el tercer
cuartil corresponde al dato 49 (quinta clase).
( )
( )
( ) 75
,
290
10
10
48
4
3
*
65
290
Q
25
,
268
10
10
8
4
65
260
Q 3
1 =
−
+
=
=
−
+
=
25
,
11
2
25
,
268
75
,
290
2
Q
Q
Q 1
3
=
−
=
−
=
30. 30
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo del Rango Percentil
65
2
315
310 - 320
63
5
305
300 – 310
18
10
265
260 – 270
34
16
275
270 – 280
48
14
285
280 – 290
58
10
295
290 – 300
250 – 260
Ic
8
8
255
Fi
fi
xi
Para calcular el rango percentil necesitamos hallar los percentiles 10 y 90.
( ) ( ) 5
,
58
65
100
90
5
,
6
65
100
10
=
∧
=
Primero multiplicamos el total de datos por las
fracciones correspondientes a los percentiles 10 y 90.
Dado que los resultados no son enteros, aproximamos
al dato inmediato superior. El percentil 10 corresponde
al dato 7 (primera clase), y el percentil 90 corresponde
al dato 59 (sexta clase).
( )( ) ( ) ( )( ) ( ) 301
10
5
58
65
9
,
0
300
P
125
,
258
10
8
0
65
1
,
0
250
P 90
10 =
−
+
=
=
−
+
=
875
,
42
125
,
258
301
P
P
D 10
90 =
−
=
−
=
31. 31
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Media Aritmética y la Desviación Media
( ) ( ) ( )
[ ]
( ) [ ] 989
,
12
46
,
70
...
16
,
198
65
1
f
*
x
x
n
1
DM
2
77
,
279
315
...
8
77
,
279
255
65
1
f
*
x
x
n
1
DM
n
1
i
i
i
n
1
i
i
i
=
+
+
=
−
=
⇒
−
+
+
−
=
−
=
∑
∑
=
=
La media aritmética es la suma de los productos de los centro de clase por la
frecuencia absoluta de clase, dividida entre la frecuencia acumulada de la última clase.
La desviación media es la suma de los productos de los valores absolutos de las
desviaciones de los centros de clase con respecto a la media por las frecuencias
absolutas de clase, dividida entre la frecuencia acumulada de la última clase.
( ) ( ) ( ) 77
,
279
65
630
...
2650
2040
n
f
x
x
n
1
i
i
i
=
+
+
+
=
=
∑
=
32. 32
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Varianza, la Desviación Típica y el Coeficiente de Variación
( )
( )
[ ] ( ) ( ) ( ) ( )
[ ]
( )
( )
[ ] [ ] 21
,
247
3058
,
2482
...
4232
,
4908
64
1
f
*
x
x
1
n
1
s
2
77
,
279
315
...
8
77
,
279
255
1
65
1
f
*
x
x
1
n
1
s
n
1
i
i
2
i
2
2
2
n
1
i
i
2
i
2
=
+
+
=
−
−
=
⇒
−
+
+
−
−
=
−
−
=
∑
∑
=
=
( )
( )
[ ] 72
,
15
21
,
247
f
*
x
x
1
n
1
s
n
1
i
i
2
i =
=
−
−
= ∑
=
La varianza es la suma de los productos de los cuadrados de las desviaciones de los centros de
clase con respecto a la media por la frecuencia absoluta de clase, dividida entre la frecuencia
acumulada de la última clase menos uno.
La desviación típica es la raiz cuadrada positiva de la varianza.
El coeficiente de variación es la razón entre la desviación típica y la media aritmética,
expresada en porcentaje.
%
62
,
5
100
*
77
,
279
72
,
15
100
*
x
s
CV =
=
=
33. 33
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Polígono de Frecuencias: Asimetría y Curtosis
0
2
4
6
8
10
12
14
16
18
255 265 275 285 295 305 315
Salario Semanal ($)
Frecuencia
Absoluta
Media
(279,77)
Moda
(277,50)
Mediana
(279,06)
ASIMETRÍA:
Ligera asimetría
hacia la derecha.
CURTOSIS:
Ligeramente Leptocúrtica.
Un pico algo pronunciado.
34. 34
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Asimetría
( )( )
( )
[ ] ( )( )( )
( ) ( ) ( ) ( )
[ ]
( )( )
( )
[ ] ( )( )( )
[ ] 205
,
0
633
,
87451
...
643
,
121581
72
,
15
63
64
65
f
*
x
x
s
2
n
1
n
n
A
2
77
,
279
315
...
8
77
,
279
255
72
,
15
2
65
1
65
65
f
*
x
x
s
2
n
1
n
n
A
3
n
1
i
i
3
i
3
3
3
3
n
1
i
i
3
i
3
=
+
+
−
=
−
−
−
=
⇒
−
+
+
−
−
−
=
−
−
−
=
∑
∑
=
=
( ) ( )
( )
( ) ( )
( )
039
,
0
25
,
268
75
,
290
25
,
268
06
,
279
06
,
279
75
,
290
Q
Q
Q
Q
Q
Q
A
1
3
1
2
2
3
s =
−
−
−
−
=
−
−
−
−
=
Calculemos, en primer lugar, el coeficiente de asimetría.
Esto indica que la distribución es ligeramente asimétrica a la derecha. Veamos que nos
dice el indice basado en los tres cuartiles. Anteriormente calculamos los cuartiles 1 y 3 y
de clases previas conocemos la mediana que es el cuartil 2.
Aunque este valor es mas bajo que el anterior, la conclusión a la que nos lleva es
similar con respecto a la asimetría positiva de la distribución de los datos. En ambos
casos coincidimos con nuestra apreciación visual.
35. 35
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Asimetría
( ) ( ) 135
,
0
72
,
15
06
,
279
77
,
279
3
s
Md
x
3
A
144
,
0
72
,
15
5
,
277
77
,
279
s
Mo
x
A
2
1
=
−
=
−
=
=
−
=
−
=
Calculemos ahora los coeficientes de sesgo de Pearson. En clases previas
calculamos la mediana y la moda de este grupo de datos.
Los resultados coinciden con las apreciaciones previas, ambos indican una
distribución ligeramente asimétrica a la derecha.
Todos los coeficientes de asimetría que hemos usado han ratificado nuestra
apreciación gráfica. En nuestro curso usaremos principalmente la gráfica para definir
la asimetría y la curtosis de la distribución de las observaciones.
36. 36
Tema 4: Medidas de Dispersión y Forma Prof. L. Lugo
. Estadística. UNITEC
Cálculo de la Curtosis
( )
( )( )( )
( )
[ ] ( )( )
( )( )
( )
( )( )( )( )
[ ] ( )( )
( )( )
12
,
11
62
63
64
64
3
08
,
6161842
...
3
,
24092618
72
,
15
62
63
64
66
65
Cu
3
n
2
n
1
n
1
n
3
f
*
x
x
s
3
n
2
n
1
n
1
n
n
Cu
4
n
1
i
i
4
i
4
=
−
+
+
=
⇒
−
−
−
−
−
−
−
−
−
+
= ∑
=
( ) ( )
262
,
0
125
,
258
301
25
,
268
75
,
290
2
1
P
P
Q
Q
2
1
D
Q
10
90
1
3
=
−
−
=
−
−
=
=
κ
Primero calculemos el coeficiente de curtosis.
Esto indica que la gráfica de la distribución es ligeramente leptocúrtica; es decir, con
un pico algo pronunciado. Esto coincide con nuestra apreciación en la gráfIca.
Veamos el coeficiente percentil de curtosis:
Este valor nos indica que la curva es casi mesocúrtica (recordar que una curtosis de
cero es un coeficiente percentil de curtosis igual a 0,263). De nuevo observamos la
poca confiabilidad de este indicador.