Este documento presenta información sobre medidas de posición relativa como deciles, percentiles y cuartiles. Explica cómo calcular e interpretar el gráfico de caja y bigotes. Incluye definiciones de cuartiles, percentiles y cómo calcularlos para datos agrupados y no agrupados. También cubre valores atípicos y su identificación usando el rango intercuartílico.
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
Veter 5ta medidas posición relativa
1. Dr. Mayhuasca Salgado Ronald
Docente
Medidas de
posición relativa
ESTADÍSTICA
2016-I
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA
VETERINARIA
2. • Conocer y determinar las medidas de posición relativas como
las cuantilas: deciles, percentiles y cuartiles, de un conjunto
de datos dispersos o agrupados.
• Elaborar e interpretar el gráfico de caja y bigote de un conjunto
de datos
Propósito
3. Medidas de tendencia central
ESTADÍSTICA DESCRIPTIVA
Nos informan de los valores centrales hacia los que se dirige
la distribución: media, mediana y moda
Medidas de posición
Nos localizan un dato determinado dentro de la serie,
informándonos acerca de la propia distribución: mediana y
percentiles
Medidas de dispersión
Nos informan de los valores centrales hacia los que se dirige
la distribución: rango, desviación media, desviación típica,
varianza y coeficiente de variación de Pearson
MaldonadoM.MedicinaPreventiva.Bioestadísticayepidemiologia.España:Curso
intensivoMIRAsturias;2011
5. Estadística Descriptiva
• Organización de datos
• Representación de datos: Tablas y Gráficos
• Medidas de resumen
• Medición de datos numéricos
1. Medidas de tendencia central
2. Medidas de dispersión
3. Medidas de posición relativa
4. Medidas de forma
• Medición de datos nominales
1. Proporción
2. Razón
3. Medición epidemiológica
6. Son medidas útiles para comparar valores de diferentes
conjuntos de datos o dentro del mismo conjunto de
datos.
En estas medidas se incluyen a los cuartiles (Q) y
percentiles (p) que dividen al conjunto de datos que han
sido ordenados en proporciones diferentes.
Medidas de posición relativa
7. Es un valor en el recorrido de la variable en el que se acumula una
porción p de datos con medida máxima el valor de la cuantila, o
sea un porcentaje (px100) de datos, toma medidas menores o
iguales a Xp y el resto toma medidas mayores o iguales a Xp.
A las cuantilas se les denomina de manera particular según la
porción acumulada a la izquierda del punto.
- Decil: di
- Cuartil: qi
- Percentil: pi
- Mediana: Me=X0,50
Cuantiles o cuantila (Xp)
8. Cuartil (qi)
q1=X0,25 ; q2=X0,50 ; q3= X0,75
Son puntos que dividen al conjunto de datos en 4 partes donde
cada uno acumula el 25% de datos, por ejemplo:
De los siguientes 60 datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,25
X0,50
X0,75
9. Cuartil (qi)
Interpretación: Indica que el 25% de las personas tienen hasta 24
años de edad, y que a lo más el 75% posee a lo más hasta 38
años, es decir el 50% tienen entre 24 y 38 años.
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
q1=X0,15 ; q2=X0,30 ; q3= X0,45 n=60
10. p1=X0,01 ; p2=X0,02 … p99= X0,99
Son puntos que dividen al conjunto de datos en 100 partes donde
cada uno acumula el 1% de datos, por ejemplo:
De los siguientes datos:
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
Percentil (pi)
11. Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
65% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
p11=X0,11 = 21
p32=X0,32 = 32
p45= X0,45 = 38
Percentil (pi)
12. Percentil (pi)
Indica que 11% de las personas tiene un máximo de 21 años y que
el 32% de individuos poseen hasta 32años, también diremos que el
45% de individuos tiene más de 38 años y que el 34% de personas
poseen entre 21 y 38 años :
16, 16, 17, 18, 18, 19, 20, 20, 21, 21, 21,22, 22, 23, 24, 24, 24, 24, 26, 26
26, 26, 27, 28, 28, 29, 30, 30, 31, 31, 31,32, 32, 33, 34, 34, 34, 34, 36, 36
36, 36, 37, 38, 38, 39, 40, 40, 41, 41, 41,42, 42, 43, 44, 44, 44, 44, 46, 46
X0,11
X0,32
X0,45
p11=X0,11 = 21
p32=X0,32 = 32
p45= X0,45 = 38
13. Percentil (pi)
“Px=y” significa que hay un “x” % de individuos
con menor o igual valor que “y”
“P80=30cm” significa que hay un “80” % de
individuos con menor o igual valor que “30”; o el
20% tienen más que 30cm
14. Cálculo de las cuantilas
𝑋 𝑝 = 𝑋(𝑟)
• Si r no es entero redondear al
entero superior
Donde:
r = n x p
Luego de ordenas los datos ascendentemente se determina la
cuantila p como el lugar que ocupa el lugar «r»
a. Para datos no agrupados
Sea la variable edad:
Varones:
𝑋0,50 = 31 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 30)
𝑋0,25 = 24 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 15)
𝑋0,75 = 38 𝑎ñ𝑜𝑠 (𝑛 𝑥 𝑝 = 45)
15. Cálculo de las cuantilas
La cuantila será al percentil
deseado si:
Fj ≥ n* p
F j-1 ≤ n*p
Consideramos las fi y las Fi
b. Para datos agrupados por conteo individual
Ejemplo
De la siguiente tabla determine
los percentiles 10, 25, , 50, 75, 90
y 05
Categorías f
0
1
2
3
4
5
6
4
8
11
15
10
13
3
16. Cálculo de las cuantilas
b. Para datos agrupados por conteo individual
De la siguiente tabla determine los
percentiles 10, 25, 50, 75 y 95
Categorías f
0
1
2
3
4
5
6
4
8
11
15
10
13
3
P10 = 1 pues n*p = 64 x 0,10 = 6,4
P25 = 2 pues n*p = 64 x 0,25 = 16
P75 = 4 pues n*p = 64 x 0,75 = 48
P95 = 5 pues n*p = 64 x 0,95 = 60,8
17. Cálculo de las cuantilas
• Se determina el intervalo que
contiene a la cuantila Xp
como el intervalo j:
Consideramos las fi y las Fi
c. Para datos agrupados en intervalos
Usamos la siguiente fórmula:
𝑋 𝑝 = 𝐿𝑗𝑖 + 𝑐
(𝑛 . 𝑝 − 𝐹𝑗−1)
𝑓𝑗
𝐹𝑗−1
Frecuencia absoluta acumulada anterior a
la clase cuantila j
𝐿𝑗𝑖
Frontera de la clase intervalo j (el punto
medio entre los extremos consecutivos
para intervalos discretos) o límite inferior
para intervalos continuos
18. Cálculo de las cuantilas
• Del siguiente cuadro
obtengamos los percentiles,
25, 50 y 75
Ejemplo
c. Para datos agrupados en intervalos
Edad fi
20-29
30-39
40-49
50-59
60-69
70-79
5
6
10
5
2
1
19. Cálculo de las cuantilas
c. Para datos agrupados en intervalos
Edad fi
20-29
30-39
40-49
50-59
60-69
70-79
5
6
10
5
2
1
𝑋25 = 29,5 + 10
(29 ∗0,25 −5)
6
= 33,5 años
𝑋50 = 39,5 + 10
(29 ∗0,50 −11)
10
= 43 años
𝑋75 = 49,5 + 10
(29 ∗0,75 −21)
2
= 53,25 años
20. Análisis exploratorio de datos
Es el proceso de usar herramientas estadísticas (sean gráficas,
medidas de tendencia central y de dispersión) con la finalidad de
observar la disposición y otras características de uno o varios
conjuntos de datos
21. Gráfico de caja y bigotes (box plot)
Son útiles para expresar la tendencia central de los datos, su
dispersión, simetría y presencia de valores extremos
Para su construcción se requieren los valores mínimos y máximos,
mediana, cuartil 1 y 3.
Permite la identificación e incorporación de valores atípicos
Q1 Q2 Q3Vm VM
22. Valores atípicos
Son datos que son distantes o numéricamente extremos del resto de los datos
Podrían distorsionar nuestras observaciones si no son tomados en cuenta
como tal.
Si en un análisis de los valores de creatinina de 15 pacientes, la mayoría de
ellos posee entre 0,8mg/dl y 1,05 mg/dl excepto uno de ellos que posee
1,45mg/dl; tal vez su mediana es 0,97…pero su media será 1,28mg/dl
A valores extremos la mediana representa mejor la distribución de los datos
23. Tipos de valores atípicos
Al conocer los valores de Q1, Q3 y los rangos intercuartílicos se
pueden hallar los siguientes valores atípicos:
Valores atípicos leves Valores atípicos extremos
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶Max =
𝑄1 − 3 𝑥 𝑅𝐼𝐶Min =
𝑄3 + 3 𝑥 𝑅𝐼𝐶Max =
24. Rango intercuartílico
Es la diferencia entre el cuartil tres (Q3) y el cuartil
uno (Q1), se representa por:
RIC= Q3 – Q1
Desviación intercuartil
Es una medida que acompaña a la mediana en la
descripción de datos:
𝑸 𝟑 − 𝑸 𝟐
2
25. Generando el gráfico de caja y bigote
𝑄1 − 1,5 𝑥 𝑅𝐼𝐶
𝑀𝑒
𝑄3
Variable
𝑄1
𝑄3 + 1,5 𝑥 𝑅𝐼𝐶
𝑄3 + 3 𝑥 𝑅𝐼𝐶
26. El percentil 90 de la talla de los recién nacidos de una determinada
población es 53cm. Esto quiere decir que:
1. El 90% de los recién nacidos miden más de 53cm.
2. El 10% de los recién nacidos miden más de 53 cm
3. El 90% de los recién nacidos miden 53cm
4. El 10% de los recién nacidos miden 5cm o más
5. El 90% de los recién nacidos miden 53cm o más
MIR 97
27. Ejemplo
• De la siguiente tabla sobre los pesos (en kg) de caprinos
mejorados, represente la información en un diagrama de caja
y bigotes
Tallo Hoja
13
14
15
16
17
18
0, 1, 1, 2, 3, 5, 6, 8
1, 1, 1, 2, 2, 4, 6 ,7, 7, 9
0, 1, 2, 2, 3, 4, 5, 5, 6, 7, 7, 8, 9
2, 4, 4, 5, 6, 7, 8
0, 1, 2, 3, 3, 5
0, 2, 3
28. Conclusiones
• Los cuartiles, mediana y percentiles son las cuantilas de mayor uso para
la determinación de la posición y simetría de un conjunto de datos
• Los datos extremos pueden ser representados en la gráfica de caja y
bigotes