1. Otras medidas de dispersión
cuartiles, quintiles y percentiles
y diagrama de caja o Boxplot.
Docente: MSc. Verónica Elizabeth Gaitán Muñoz
2. • Calcular e interpretar las medidas de tendencia central y de
dispersión.
Propósito
3. Medidas de tendencia central
ESTADÍSTICA DESCRIPTIVA
Nos informan de los valores centrales hacia los que se dirige
la distribución: media, mediana y moda
Medidas de posición
Nos localizan un dato determinado dentro de la serie,
informándonos acerca de la propia distribución: mediana y
percentiles
Medidas de dispersión
Nos informan de los valores centrales hacia los que se dirige
la distribución: rango, desviación media, desviación típica,
varianza y coeficiente de variación de Pearson
4. …Los percentiles son estadísticos de posición que
dividen el número de observaciones de la distribución en
partes porcentuales acumulativas…
Son llamados también de orden por que requieren un
ordenamiento ascendente
5. Son medidas útiles para comparar valores de diferentes
conjuntos de datos o dentro del mismo conjunto de
datos.
En estas medidas se incluyen a los cuartiles (Q) y
percentiles (p) que dividen al conjunto de datos que han
sido ordenados en proporciones diferentes.
Medidas de posición relativa
6. Es un valor en el recorrido de la variable en el que se acumula una
porción p de datos con medida máxima el valor de la cuantila, o
sea un porcentaje (px100) de datos, toma medidas menores o
iguales a Xp y el resto toma medidas mayores o iguales a Xp.
A las cuantilas se les denomina de manera particular según la
porción acumulada a la izquierda del punto.
- Decil: di
- Cuartil: qi
- Percentil: pi
- Mediana: Me=X0,50
Cuantiles o cuantila (Xp)
7. Cuartil (qi)
q1=X0,25 q2=X0,50
; ; q3= X0,75
donde
Son puntos que dividen al conjunto de datos en 4 partes
cada uno acumula el 25% de datos, por ejemplo:
De los siguientes 60 datos:
X0,25
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
X0,50
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
X0,75
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
8. Cuartil (qi)
Interpretación: Indica que el 25% de las personas tienen hasta 24
años de edad, y que a lo más el 75% posee a lo más hasta 38
años, es decir el 50% tienen entre 24 y 38 años.
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
q1=X0,15 ; ;
q2=X0,30 q3= X0,45 n=60
9. p1=X0,01 ; p2=X0,02 … p99= X0,99
donde
Son puntos que dividen al conjunto de datos en 100 partes
cada uno acumula el 1% de datos, por ejemplo:
De los siguientes datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
X0,11
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
X0,32
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,45
Percentil (pi)
10. p11=X0,11 = 21
p32=X0,32 = 32
p45= X0,45 = 38
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
65% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
X0,11
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
X0,32
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,45
Percentil
(pi)
11. Percentil (pi) p11=X0,11 = 21
p32=X0,32 = 32
p45= X0,45 = 38
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
45% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
X0,11
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
X0,32
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,45
12. Percentil
(pi)
“Px=y” significa que hay un “x” % de individuos
con menor o igual valor que “y”
“P80=30cm” significa que hay un “80” % de
individuos con menor o igual valor que “30”; o el
20% tienen más que 30cm
13. Cálculo de las cuantilas
𝑋𝑝 = 𝑋(𝑟)
Donde:
r = n x p
• Si r no es entero redondear al
entero superior
a. Para datos no agrupados
Luego de ordenas los datos ascendentemente se determina la
cuantila p como el lugar que ocupa el lugar «r»
Sea la variable edad:
Varones:
𝑋0,50 = 31 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 30)
𝑋0,25 = 24 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 15)
𝑋0,75 = 38 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 45)
14. Cálculo de las cuantilas
Fj ≥ n* p
F j-1 ≤ n*p
Consideramos las fi y las Fi
La cuantila será al percentil
deseado si:
b. Para datos agrupados por conteo individual
Ejemplo
De la siguiente tabla determine
los percentiles 10, 25, , 50, 75, 90
y 05
Categorías f
0
1
2
3
4
5
6
4
8
11
15
10
13
3
15. Cálculo de las cuantilas
b. Para datos agrupados por conteo individual
De la siguiente tabla determine los
percentiles 10, 25, 50, 75 y 95
Categorías f
0
1
2
3
4
5
6
4
8
11
15
10
13
3
P10 = 1
P25 = 2
P75 = 4
P95 = 5
pues
pues
pues
pues
n*p = 64 x 0,10 = 6,4
n*p = 64 x 0,25 = 16
n*p = 64 x 0,75 = 48
n*p = 64 x 0,95 = 60,8
16. Cálculo de las cuantilas
• Se determina el intervalo que
contiene a la cuantila Xp
como el intervalo j:
Consideramos las fi y las Fi
c. Para datos agrupados en intervalos
Usamos la siguiente fórmula:
𝑝
𝑋 = 𝐿𝑗
𝑖
(𝑛 . 𝑝 − 𝐹𝑗 −1)
+ 𝑐
𝑓𝑗
𝐹𝑗−1
Frecuencia absoluta acumulada anterior a
la clase cuantila j
𝐿𝑗𝑖
Frontera de la clase intervalo j (el punto
medio entre los extremos consecutivos
para intervalos discretos) o límite inferior
para intervalos continuos
17. Cálculo de las cuantilas
• Del siguiente cuadro
obtengamos los percentiles,
25, 50 y 75
c. Para datos agrupados en intervalos
Ejemplo
Edad fi
20-29
30-39
40-49
50-59
60-69
70-79
5
6
10
5
2
1
18. Cálculo de las cuantilas
c. Para datos agrupados en intervalos
Edad fi
20-29
30-39
40-49
50-59
60-69
70-79
5
6
10
5
2
1
25
𝑋 = 29,5 + 10
(29 ∗0,25 −5)
6
= 33,5 años
𝑋50 = 39,5 + 10
10
(29 ∗0,50 −11)
= 43 años
75
𝑋 = 49,5 + 10
(29 ∗0,75 −21)
2
= 53,25 años
19. Análisis exploratorio de datos
Es el proceso de usar herramientas estadísticas (sean gráficas,
medidas de tendencia central y de dispersión) con la finalidad de
observar la disposición y otras características de uno o varios
conjuntos de datos
20. Gráfico de caja y bigotes (box plot)
Son útiles para expresar la tendencia central de los datos, su
dispersión, simetría y presencia de valores extremos
Para su construcción se requieren los valores mínimos y máximos,
mediana, cuartil 1 y 3.
Permite la identificación e incorporación de valores atípicos
Q1 Q2 Q3
Vm VM
21. Valores atípicos
Son datos que son distantes o numéricamente extremos del resto de los datos
Podrían distorsionar nuestras observaciones si no son tomados en cuenta
como tal.
Si en un análisis de los valores de creatinina de 15 pacientes, la mayoría de
ellos posee entre 0,8mg/dl y 1,05 mg/dl excepto uno de ellos que posee
1,45mg/dl; tal vez su mediana es 0,97…pero su media será 1,28mg/dl
A valores extremos la mediana representa mejor la distribución de los datos
22. Tipos de valores atípicos
Al conocer los valores de Q1, Q3 y los rangos intercuartílicos se
pueden hallar los siguientes valores atípicos:
Valores atípicos leves Valores atípicos extremos
Min = 𝑄1 − 1,5 𝑥 𝑅𝐼𝐶
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶
Max =
Min = 𝑄1 − 3 𝑥 𝑅𝐼𝐶
𝑄3 + 3 𝑥 𝑅𝐼𝐶
Max =
23. Rango intercuartílico
Es la diferencia entre el cuartil tres (Q3) y el cuartil
uno (Q1), se representa por:
RIC= Q3 – Q1
Desviación intercuartil
Es una medida que acompaña a la mediana en la
descripción de datos:
𝑸𝟑 − 𝑸𝟐
2
24. Generando el gráfico de caja y bigote
Variable
𝑄3
𝑀𝑒
𝑄1
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶
𝑄3 + 3 𝑥 𝑅𝐼𝐶
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶
25. El percentil 90 de la talla de los recién nacidos de una determinada
población es 53cm. Esto quiere decir que:
1. El 90% de los recién nacidos miden más de 53cm.
2. El 10% de los recién nacidos miden más de 53 cm
3. El 90% de los recién nacidos miden 53cm
4. El 10% de los recién nacidos miden 5cm o más
5. El 90% de los recién nacidos miden 53cm o más
MIR 97
26. Ejemplo
• De la siguiente tabla sobre los pesos (en kg) de caprinos
mejorados, represente la información en un diagrama de caja
y bigotes
Tallo Hoja
13
14
15
16
17
18
0, 1, 1, 2, 3, 5, 6, 8
1, 1, 1, 2, 2, 4, 6 ,7, 7, 9
0, 1, 2, 2, 3, 4, 5, 5, 6, 7, 7, 8, 9
2, 4, 4, 5, 6, 7, 8
0, 1, 2, 3, 3, 5
0, 2, 3