El documento habla sobre medidas estadísticas de dispersión, asimetría y apuntamiento. Explica diferentes medidas de dispersión como el rango, desviación cuartil, desviación media, varianza y desviación estándar. También cubre medidas de dispersión relativas como el coeficiente de variación. Finalmente, describe cómo calcular la asimetría y curtosis para determinar si una distribución es simétrica, asimétrica, leptocúrtica o platicúrtica.
1. TEMA 2
Estadísticos resumidos
Medidas de asimetría y apuntamiento
Clase 6
Dispersión, asimetría y apuntamiento
UNIVERSIDAD DE CARABOBO
Facultad de Ciencias Económicas y sociales
Campus La Morita
Prof. Samuel Cárdenas Izaguirre
E-I, Sec_1 Sem-2022-2
Martes 28 06 2022
2. Estadísticos resumidos: Medidas de dispersión.
Según Levin (1994), la dispersión es el grado esparcimiento o variabilidad de un conjunto de datos. Se calcula
la dispersión para conocer el patrón de comportamiento de los datos.
1. MEDIDAS DE DISPERSIÓN.
Recorrido
Desviación cuartil
Absolutas Desviación media
Medidas de Desviación estándar
Dispersión Varianza
Coeficiente de variación
Relativas Coef. De variación intercuartil
Las medidas de dispersión absolutas, se expresan en las mismas unidades de las variables, por
ejemplo: Kg., Bs, Mt, etc. Las medidas de dispersión relativas se expresan en números abstractos,
carentes de unidades, Ej %, tanto por uno, etc.
3. La dispersión se calcula por dos razones:
1. Para juzgar la confiabilidad de la medida de tendencia central.
Si los datos están ampliamente dispersos como en la curva A, entonces la localización
central será menos representativa que en la curva C donde los datos están mas
concentrados alrededor de la media.
2. Se usa para comparar la dispersión de varias muestras.
En estos casos, seguramente se escogerá la distribución que tenga menor dispersión de
los valores con respecto a la medida central. Las dispersiones mayores implican riesgos.
C
A
4. Medidas de dispersión Absolutas.
Rango o recorrido
Se la denota por R, y se la define como la diferencia entre los valores extremos de una distribución.
R = rango
R = Xmax – Xmin
Ejemplo: Producción de varios cereales, expresados en Millones de Kg (México, 2002)
R = 62,0 – 40,5
= 21,5 Millones de Kg.
El recorrido tiene poco interés porque solo suministra información sobre los extremos de la distribución. Se
aplica para muestras pequeñas (12 a 16 datos) y cuando no se observan valores extremos en la serie.
Serie
ordenada
40,5
(Sémola)
47,3
(Sorgo)
48,0
(Cebada)
52,0
(Maíz/A)
53,0
(Maíz/B)
61,2
(Arroz)
62,0
(Trigo)
Q1 Q2 (Me) Q3
5. 2. Desviación cuartil
También se conoce como semirrecorrido intercuartílico. Se denota por DQ y se calcula
como la semidiferencia entre los cuartiles extremos.
Del ejemplo anterior:
Q1 = 47,3 DQ = Q₃ – Q₁
Q3 = 61,2 DQ = (61,2 - 47,3)/2 = 6,95 Millones de Kg
El DQ = 6,95 Kg., refleja únicamente la dispersión de la parte central de la distribución y no
en relación a alguna medida de tendencia central. El DQ, se expresa con las propias unidades de la
variable. Su empleo está justificado en distribuciones muy asimétricas o cuando no se requiere
información sobre los primeros y últimos valores de la serie.
6. 1. Desviación media y Desviación mediana.
Según Levin (1988), es el promedio de los desvíos entre las observaciones y la media (o mediana). Zaera (1985),
define la desviación media, como la media aritmética de los valores absolutos de las desviaciones de los datos
respecto a la media en unos casos o a la mediana en otros casos.kg
DMedia = (i –)/n Dmediana = (i – Me)/n
DMedia = 5,7714 Millones de kg Dmediana = 5,7714 Millones de kg
Calculo de Desviación media
𝐷𝑚 =
𝑋𝑖−𝑋
𝑛
𝐷𝑚 =
40,5 − 52 + 47,3 − 52 + 48, −52 + 52 − 52 + (53 − 52) + (61,2 − 52) + (62 − 52)
7
Dm = 40,4 / 7 Dmedia = 5,7714 Millones de Kg
Serie
ordenada:
40,5 47,3 48,0 52,0 53,0 61,2 62,0
Q1 Q2 Q3
7. Varianza.
Se denota por S2, y se la calcula como la media aritmética ponderada de los cuadrados de las desviaciones
de cada observación a su media. Mason (1992), la define como el promedio de las desviaciones al cuadrado con
respecto a la media. Se distingue entre la media muestral y poblacional, según se divida entre n o n-1.
𝜎2
=
Σ 𝑋𝑖−𝑋
2
𝑛
(si n≥ 30) 𝑆2
=
Σ 𝑋𝑖−𝑋
2
𝑛−1
(si n ˂ 30)
Desviación típica.
Se la denota por σ (poblacional) o S (muestral) y se la calcula como la raíz cuadra de la varianza.
σ = 𝜎2 D. típica poblacional S = 𝑆2 ) D. típica muestral
La desviación típica es la medida de dispersión más utilizada. Representa la dispersión de los datos en sus
propias unidades. Indica la mayor o menor concentración de las observaciones alrededor de la media.
8. Medidas de dispersión relativa.
1. Coeficiente de variación.
Según Zaera (1985), el coeficiente de variación se expresa en porcentaje y se define como el
porcentaje (o tamaño) de la media que representa la desviación estándar. Por otra parte, Berenson
(1992), indica que el CV, mide la dispersión de los datos con respecto a la media.
𝐶𝑉 =
𝑆
𝑋
x 100 o CV =
σ
𝑋
x 100
𝐶𝑉 =
2,563
52
x 100 =4,928 %
El coeficiente de variación es importante porque nos permite hacer comparaciones entre varias
distribuciones a fin de convertir cada una de estas medidas en una expresión relativa, es decir un
porcentaje. Generalmente se usa el CV, cuando se quiere comparar las dispersiones de 2 o mas grupos
que tienen unidades diferentes o cuando las observaciones están en las mismas unidades pero las medias
son diferentes. Ejemplo:
Dispersión de los sueldos del grupo de obreros y del grupo de los empleados de una empresa.
Distribución de los ingresos mensuales y gastos familiares. Es evidente, que en términos absolutos, no
tiene el mismo valor 1 Bs. de la serie de ingresos que de la serie de gastos.
9. 1. Asimetría.
Es una medida de distribución que indica como se distribuyen los datos, por debajo y por encima de la media.
En este sentido, se distinguen las distribuciones como simétricas y asimétricas.
Una distribución es simétrica, cuando no tiene sesgo, esto es las frecuencias se reparten por igual
(simétricamente), alrededor de la media. Ejemplo
D. simétrica D. asimétrica
En este ejemplo, se observa que hay 6 observaciones por debajo de la media( 𝑋 = 16) y 6 observaciones por encima
de la media.
Una distribución es asimétrica, cuando las frecuencias no se reparten simétricamente alrededor de la media.
Ejemplo:
X fi Fi
12 2 2
14 4 6
16 6 12
18 4 16
20 2 18
X fi Fi
12 2 2
14 4 6
16 6 12
18 4 16
24 4 20
D. Simétricas tienen
igual numero de
observaciones por
encima y por debajo de
la media. (media = 16).
Media=mediana=moda
D. Asimétricas; las
observaciones se
distribuyen de forma
desigual alrededor de la
media. Media = 17,2;
Me = 16,5
10. Cálculo de la asimetría por Pearson
Karl Pearson. Calculó la asimetría, relacionando la media, mediana y desviación típica de
una distribución a través del coeficiente de asimetría que lleva su nombre, al cual lo denotó por
VK:
𝑉𝐾 =
3( 𝑋−𝑀𝑒)
𝑆
Donde:
Si VK = 0, Dist. es simétrica
Si VK 0, Dist. es asimétrica
Si VK 0, Dist. es asimétrica +
Cálculo de la asimetría por Percentiles
Hay otro coeficiente de asimetría, obtenido por medio de los percentiles que permite saber
cuan asimétrica son las distribuciones. Este coeficiente se denota por As.
As =
𝑷𝟗𝟎 −𝟐𝑷𝟓𝟎+ 𝑷𝟏𝟎
𝑷𝟗𝟎 − 𝑷𝟏𝟎
Leyenda
Si As 0,1 Distribución es ligeramente asimétrica
Si 0,1 ˂ As ˂ 0,3 Distribución es moderadamente asimétrica
Si As≥ 0,3 Distribución es marcadamente asimétrica
11. Medidas del apuntamiento
La curtosis mide el grado de agudeza o apuntamiento de la distribución. A veces aunque las
distribuciones son simétricas es decir tienen la misma media, la curva es picuda o sobresaliente, llamada
leptocúrtica; en otras ocasiones, es aplanada, en cuyo caso es platicúrtica. Esto es, algunas distribuciones
tienen grados variables de curtosis. Según Mason (1992), la curtosis se mide con el siguiente coeficiente:
K =
1
𝑛
𝑋𝑖 − 𝑋
𝑆
⁴ ∗ 𝑓𝑖 ̶ 3
Leyenda
Si K ˃ 0 Distribución es leptocúrtica
Si K = 0 Distribución es mesocúrtica
Si K ˂ 0 Distribución es platicúrtica
12. Ejemplo
1. Calcule la asimetría por Pearson
2. Calcule la asimetría usando la formula de los percentiles
3. Compruebe si la distribución es leptocúrtica
Media = 17,2
Desv. típica = 3,91
Mediana = 16,33
P10 = 13
P90 = 24
VK = 3( 17,2 – 16,33)/ 3,91 = 0,67 (Leptocúrtica)
K = -077
Li - Ls X fi Fi %ai ((xi - )4 *fi)/S
11 - 13 12 2 2 10 6,25
13 - 15 14 4 6 30 1,79
15 - 17 16 6 12 60 0,05
17 - 19 18 4 16 80 0,01
19 - 29 24 4 20 100 36,59
Suma 44,69
𝑃% = 𝐿𝑝 +
%∗𝑛
100
−𝐹𝑝
𝑓𝑝
i K =
1
𝑛
𝑋𝑖 − 𝑋
𝑆
⁴ ∗ 𝑓𝑖 - 3
13. …Pues el Señor es quien da la sabiduría, y de
su boca sale la discreción y la ciencia.
Biblia de Torres Amat, Proverbios 2:6
Acuérdate de tu creador en los días de tu juventud,
antes que vengan los días malos, y lleguen los años de
los cuales digas: No tengo en ellos contentamiento.
Eclesiastés 12.1