1. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
Para las variables numéricas, se necesita un análisis más especı́fico
del que se puede obtener a partir del análisis gráfico visto en las
clases anteriores.
A continuación se presentan algunas medidas numéricas
descriptivas que reforzarán un poco el conocimiento del
comportamiento de los datos por analizar.
Curso nivelatorio 3 / 81
2. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
Las medidas numéricas descriptivas se pueden clasificar en:
1). Medidas de tendencia central: Este tipo de medidas permi-
ten identificar un valor central hacia el que se agrupan los datos.
2). Medidas de posición no central: Este tipo de medidas per-
miten conocer otros puntos caracterı́sticos de la distribución de
los datos que no son los valores centrales. Entre las medidas
de posición no central más importantes están los cuartiles y los
percentiles que son casos puntuales de los cuantiles.
Curso nivelatorio 4 / 81
3. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
3). Medidas de dispersión o variación: Este tipo de medidas
permiten medir la cantidad de disgregación o de dispersión de
los datos. Dentro de este grupo se tienen medidas que calcu-
lan el grado de dispersión respecto a una medida de tendencia
central (como la varianza muestral y la desviación) y otras que
no tienen dicho referente (como el rango y el rango intercuartil)
4). Medidas de forma: Este tipo de medidas permiten identificar
el patrón caracterı́stico de la distribución de los datos (desde el
menor hasta el mayor).
5). Covarianza y Correlación: Este tipo de medidas ayudan a de-
terminar el grado de asociación lineal entre dos variables alea-
torias.
Curso nivelatorio 5 / 81
4. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de tendencia central
Las medidas de tendencia central se desarrollaron con el fin de poder
identificar el valor central sobre el que tiende a agruparse el conjunto
de datos analizado.
Cuando se habla de promedio, de valor medio o del valor más común
o frecuente, se refiere de manera informal a la media, mediana y la
moda, tres medidas de tendencia central muy empleadas.
Curso nivelatorio 6 / 81
5. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética
La media aritmética o promedio es una de las medidas de tendencia
central más empleadas, en la que todos los valores de una muestra
o una población tienen la misma importancia (aportan una misma
cantidad de información).
La media aritmética o promedio sirve como punto de equilibrio en
un conjunto de datos.
Curso nivelatorio 7 / 81
6. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Sea X una variable aleatoria. Para esta variable, el promedio pobla-
cional se denota con el sı́mbolo µ y el promedio muestral con el
sı́mbolo X̄.
Considere el censo de todos los elementos de una población X1, X2,
· · · , XN - donde N es el número de elementos de la población -.
Para esta población, la media aritmética está dada por la siguiente
expresión:
µ =
N
X
i=1
Xi
N
Curso nivelatorio 8 / 81
7. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Considere una muestra aleatoria de n valores o datos muestrales
(X1, X2, · · · , Xn). Para esta muestra, la fórmula de la media aritméti-
ca muestral está dada por:
X̄ =
n
X
i=1
Xi
n
Curso nivelatorio 9 / 81
8. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Desventaja
La media es una medida de tendencia central que se ve muy afec-
tada por cualquier valor que difiera mucho del conjunto de datos en
general (puntos atı́picos o valores extremos). Cuando se presenten
dichos puntos o valores extremos y el tamaño muestral (o poblacio-
nal) sea pequeño se debe evitar el uso de la media aritmética como
medida de tendencia central.
Curso nivelatorio 10 / 81
9. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Curso nivelatorio 11 / 81
10. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Conclusión
Aunque en ningún dı́a de la muestra el estudiante se demoró 39.6
minutos en llegar a la universidad, asignar 40 minutos a su arreglo
personal y su transporte serı́a un buen criterio para planear el inicio
del dı́a.
Curso nivelatorio 12 / 81
11. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 102 39 44 40 31 44 35
Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos
en lugar de 52.
Curso nivelatorio 13 / 81
12. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Conclusiones
Note que un valor extremo elevó la media en más del 10 %,
paso de 39.6 a 44.6 minutos.
En contraste con la media obtenida en el ejemplo 1, el nuevo
valor del promedio es mayor que 9 de los 10 datos de tiem-
po llegada, es decir, el punto extremo provocó que la media
aritmética sea una mala medida de tendencia central.
Curso nivelatorio 14 / 81
13. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 3
En un estudio realizado se desea determinar el diámetro promedio
de ciertas piezas fabricadas en un proceso de manufactura, los re-
sultados son los siguientes:
Pieza 1 2 3 4 5 6 7 8
Diámetro (mm) 7 8 14 12 10 21 6 18
Curso nivelatorio 15 / 81
14. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana o valor mediano
La mediana es el valor medio de un conjunto de datos en orden cre-
ciente (del menor al mayor) y representa el valor que divide en dos
partes iguales dicho conjunto ordenado.
A diferencia del promedio aritmético, la mediana no se ve afecta-
da por los valores extremos, de manera que puede utilizarse cuando
están presentes.
Curso nivelatorio 16 / 81
15. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Sea X una variable aleatoria cualquiera. Para esta variable, la me-
diana poblacional se denota con el sı́mbolo e
µ y la mediana muestral
con el sı́mbolo e
X.
Considere el censo ordenado de todos los elementos de una pobla-
ción (X(1), X(2), · · · , X(N)) donde N es el número de elementos de
la población. La mediana poblacional está dada por alguna de las
siguientes reglas:
Curso nivelatorio 17 / 81
16. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 1
Si se tiene una población con número impar de datos (N impar),
la mediana será el valor de la observación X(N+1
2 ) del conjunto de
datos ordenado.
e
µ = X(N+1
2 )
Curso nivelatorio 18 / 81
17. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 2
Si se tiene una población con un número par de datos (N par), la
mediana será el promedio de los valores X(N
2 ) y X(N+2
2 ) del conjunto
de datos ordenado, es decir:
e
µ =
X(N
2 ) + X(N+2
2 )
2
Curso nivelatorio 19 / 81
18. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Considere que se tiene una muestra aleatoria ordenada de n datos
(X(1), X(2), · · · , X(n)). En este caso la mediana muestral está dada
por por alguna de las siguientes reglas:
Curso nivelatorio 20 / 81
19. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 1
Si se tiene una muestra con número impar de datos (n impar), la
mediana será el valor de la observación X(n+1
2 ) de la muestra orde-
nada.
e
X = X(n+1
2 )
Curso nivelatorio 21 / 81
20. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 2
Si se tiene una muestra con un número par de datos (n par), la
mediana será el promedio de los valores X(n
2 ) y X(n+2
2 ) de la muestra
ordenada, es decir:
e
X =
X(n
2 ) + X(n+2
2 )
2
Curso nivelatorio 22 / 81
21. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
52.
Curso nivelatorio 23 / 81
22. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 102 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
102.
Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos
en lugar de 52.
Curso nivelatorio 24 / 81
23. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 3
En un estudio realizado se desea determinar la mediana del diáme-
tro de ciertas piezas fabricadas en un proceso de manufactura, los
resultados son los siguientes:
Pieza 1 2 3 4 5 6 7 8
Diámetro (mm) 7 8 14 12 10 21 6 18
Curso nivelatorio 25 / 81
24. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Conclusión
Se puede concluir que el 50 % de las piezas presentaron un diámetro
inferior a 11 mm y el 50 % restante presentaron un diámetro superior
a 11 mm.
Curso nivelatorio 26 / 81
25. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 4
Con el fin de realizar un gran estudio psiquiátrico sobre los motivos
por los que una persona vive en la indigencia, se registra el número
de individuos con las caracterı́stica de interés en 13 ciudades de
Colombia obteniendo los siguientes resultados:
1651, 1760, 2238, 2363, 1530, 2255, 1622, 1593, 1627, 1739,
1537, 2307, 2042
Estimar la mediana de este conjunto de datos.
Curso nivelatorio 27 / 81
26. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
La moda se define como el valor que aparece con mayor frecuencia en
una población o en una muestra aleatoria (conjunto de datos). Es-
ta medida de localización no se ve afectada por los valores extremos.
Nota
Con frecuencia se presenta el caso donde en un conjunto de da-
tos (muestral o poblacional) no existe moda, o bien existen varias
modas.
Curso nivelatorio 28 / 81
27. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
Para identificar la Moda en un conjunto de datos se realiza el si-
guiente procedimiento:
1 Ordene los datos de menor a mayor.
2 Identifique el (los) valor(es) que más se repiten.
Curso nivelatorio 29 / 81
28. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Curso nivelatorio 30 / 81
29. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 1
Ordenando los datos del menor al mayor
Tiempo 29 31 35 39 39 40 43 44 44 52
Se puede observar que en este conjunto de datos existen 2 modas:
39 y 44 minutos.
Curso nivelatorio 31 / 81
30. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el número de defectuo-
sos en una lı́nea de producción en 14 dı́as. Los resultados son los
siguientes:
Dı́a 1 2 3 4 5 6 7
Defectuosos 2 1 0 3 4 6 6
Dı́a 8 9 10 11 12 13 14
Defectuosos 2 2 3 3 0 3 0
Curso nivelatorio 32 / 81
31. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 2
Ordenando los datos del menor al mayor
Defectuosos 0 0 0 1 2 2 3
Defectuosos 3 3 3 4 6 6
Se puede observar que en este conjunto de datos existe una moda:
3 defectuosos.
Curso nivelatorio 33 / 81
32. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Variables cuantitativas
Una tabla de frecuencias para datos agrupados tiene la siguiente es-
tructura:
Intervalo Mc Frec. Frec. Frec. Abs. Frec. Rel.
Abs. fi Rel. hi ( %) Acum. Fi Acum. Hi ( %)
[a, b) a+b
2 f1 h1 F1 H1
[b, c) b+c
2 f2 h2 F2 H2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
[g, h] g+h
2 fm hm Fm Hm
Curso nivelatorio 34 / 81
33. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Sea X una variable aleatoria; Mci las marcas de clase y fi las fre-
cuencias absolutas de cada uno de los K agrupamientos o categorı́as
convenientemente establecidas para los N valores observados en la
población. El promedio poblacional para datos agrupados, denotado
µ, se define por medio de la siguiente ecuación:
µ =
K
X
i=1
fi Mci
N
Curso nivelatorio 35 / 81
34. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Sea X una variable aleatoria; Mci las marcas de clase y fi las fre-
cuencias absolutas de cada uno de los K agrupamientos o categorı́as
convenientemente establecidas para los n valores observados en la
muestra aleatoria de la población. El promedio muestral para datos
agrupados, denotado X̄, se define por medio de la siguiente ecuación:
X̄ =
K
X
i=1
fi Mci
n
Curso nivelatorio 36 / 81
35. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
Para los datos agrupados la expresión para calcular la mediana po-
blacional es la siguiente
µ̃ = Li + A
N
2 Fi 1
fmed
!
Donde,
Li = Lı́mite inferior de la clase medial (clase que contiene a la
mediana)
A = Amplitud del intervalo que contiene a la mediana
Fi 1 = Frecuencia absoluta acumulada anterior a la frecuencia
absoluta acumulada de la clase medial
fmed = Frecuencia absoluta de la la clase medial
N = Total poblacional
Curso nivelatorio 37 / 81
36. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
La clase medial o intervalo que contiene a la mediana es aquella
clase en donde esté acumulado el 50 % de los datos.
La amplitud del intervalo que contiene a la mediana se obtiene
al restarle al lı́mite superior del mismo su lı́mite inferior.
Curso nivelatorio 38 / 81
37. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
Para los datos agrupados se tiene una extensión de la definición de
valor mediano muestral, veamos la ecuación:
X̃ = Li + A
✓ n
2 Fi 1
fmed
◆
Donde Li , A, Fi 1, fmed tienen la misma definición presentada an-
teriormente y n es el tamaño de la muestra aleatoria.
Curso nivelatorio 39 / 81
38. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos agrupados
La moda para datos no agrupados, tanto para el caso poblacional
como para el caso muestral, está dado por la siguiente expresión:
Mo = mo = Li + A
✓
fi fi 1
(fi fi 1) + (fi fi+1)
◆
Donde,
Li = Lı́mite inferior de la clase modal
A = Amplitud de la clase modal
fi = Frecuencia absoluta de la clase modal
fi 1 = Frecuencia absoluta anterior a la de la clase modal
fi+1 = Frecuencia absoluta siguiente a la de la clase modal
La clase modal corresponde a la clase o intervalo de mayor frecuencia
absoluta.
Curso nivelatorio 40 / 81
39. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media, mediana y moda para datos agrupados
EJEMPLO 1
Cálculo de la media, mediana y moda para el ejemplo de las notas
obtenidas por 40 estudiantes del curso de Medición I:
Clases Mc fi hi ( %) Fi Hi ( %)
[1.60 , 2.04) 1.82 2 5 2 5
[2.04 , 2.48) 2.26 1 2.5 3 7.5
[2.48 , 2.92) 2.70 4 10 7 17.5
[2.92 , 3.36) 3.14 12 30 19 47.5
[3.36 , 3.80) 3.58 9 22.5 28 70
[3.80 , 4.24) 4.02 7 17.5 35 87.5
[4.24 , 4.7] 4.46 5 12.5 40 100
Curso nivelatorio 41 / 81
40. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media, mediana y moda para datos agrupados
EJEMPLO 2
Cálculo de la media, mediana y moda para el ejemplo de la variable
Ventas medida en cierta empresa:
Clases Mc fi hi Fi Hi
[0, 500) 250 726 0.425 726 0.425
[500 , 1000) 750 587 0.343 1313 0.768
[1000 , 1500) 1250 292 0.171 1605 0.939
[1500 , 2000) 1750 74 0.043 1679 0.982
[2000 , 2500) 2250 24 0.014 1703 0.996
[2500 , 3000] 2750 7 0.004 1710 1.000
Curso nivelatorio 42 / 81
41. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Las medidas de posición no central se diseñaron con el fin de cono-
cer otros puntos caracterı́sticos de la distribución de los datos que
no son los valores centrales.
Entre las medidas de posición no central más importantes están los
cuantiles.
Curso nivelatorio 43 / 81
42. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
El término cuantil fue usado por primera vez por Kendall en 1940.
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor
de la variable X (usualmente denotado Xp) que marca un corte
de modo que una proporción p de valores de la población o de la
muestra es menor o igual que Xp.
Curso nivelatorio 44 / 81
43. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Por ejemplo, el cuantil de orden 0.36 es un valor que dejarı́a un 36 %
de valores por debajo y un 64 % por encima del valor X0.36.
Los cuantiles suelen usarse por grupos que dividen la distribución
de los datos en partes iguales; entendidas estas como intervalos que
comprenden la misma proporción de valores.
Curso nivelatorio 45 / 81
44. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Los más usados son:
Los Cuartiles, que dividen la distribución de los datos en cuatro
partes (corresponden a los cuantiles 0.25, 0.50 y 0.75).
Los Quintiles, que dividen la distribución de los datos en cinco
partes (corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80).
Los Deciles, que dividen la distribución de los datos en diez
partes iguales.
Los Percentiles, que dividen la distribución de los datos en cien
partes iguales (se denotan como P25, P75, P90, etc.).
Curso nivelatorio 46 / 81
45. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Cuartiles
Los cuartiles son medidas numéricas las cuales permiten dividir un
conjunto de datos en 4 partes iguales.
El primer cuartil Q1 separa el 25 % de los datos (abarcando los
más pequeños), del 75 % restante (equivale al P25).
El segundo cuartil Q2 separa el 50 % de los datos más pequeños
del 50 % restante. Este valor corresponde al valor mediano de
los datos, es decir, Q2 = e
X (equivale al P50).
El tercer cuartil Q3 separa el 75 % de los datos más pequeños,
del 25 % de valores más grandes (equivale al P75).
Curso nivelatorio 47 / 81
46. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles poblacionales
Cuartiles poblacionales
Considere el censo ordenado del menor al mayor valor de todos los
elementos de una población (X(1), X(2), · · · , X(N)) donde N es el
número de elementos de la población.
Curso nivelatorio 48 / 81
47. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles poblacionales
El primer cuartil poblacional está dado por la observación en la po-
sición N+1
4 del conjunto de datos ordenado, es decir:
Q1 = X(N+1
4 )
El tercer cuartil poblacional está dado por la observación 3(N+1)
4 del
conjunto de datos ordenado, es decir:
Q3 = X⇣
3(N+1)
4
⌘
Curso nivelatorio 49 / 81
48. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Cuartiles Muestrales
Considere una muestra aleatoria ordenada del menor al mayor valor
de una población (X(1), X(2), · · · , X(n)) donde n es el número de
elementos de la muestra.
Curso nivelatorio 50 / 81
49. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
El primer cuartil muestral está dado por la observación en la posición
n+1
4 del conjunto de datos ordenado, es decir:
Q1 = X(n+1
4 )
El tercer cuartil muestral está dado por la observación 3(n+1)
4 del
conjunto de datos ordenado, es decir:
Q3 = X⇣
3(n+1)
4
⌘
Curso nivelatorio 51 / 81
50. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Para calcular los cuartiles, se utilizan las siguientes reglas:
Regla 1
Si el resultado posicional es un número entero, entonces el cuartil
es igual al valor clasificado de esa posición.
Ejemplo: Sea n = 11.
Q1 = X(n+1
4 ) = X(11+1
4 ) = X(3)
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(11+1)
4
⌘ = X(9)
Curso nivelatorio 52 / 81
51. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Regla 2
Si el resultado es una fracción de mitad (2.5, 3.5, 4.5), entonces
el cuartil es igual al promedio de los valores clasificados correspon-
dientes.
Ejemplo: Sea n = 9.
Q1 = X(n+1
4 ) = X(9+1
4 ) = X(2.5) =
X(2) + X(3)
2
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(9+1)
4
⌘ = X(7.5) =
X(7) + X(8)
2
Curso nivelatorio 53 / 81
52. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Regla 3
Si el resultado obtenido no es un entero, ni una fracción de mitad, se
redondea al entero más cercano y se selecciona ese valor clasificado.
Ejemplo: Sea n = 10.
Q1 = X(n+1
4 ) = X(10+1
4 ) = X(2.75) = X(3)
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(10+1)
4
⌘ = X(8.25) = X(8)
Curso nivelatorio 54 / 81
53. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
EJEMPLO
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
52.
Curso nivelatorio 55 / 81
54. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
CONCLUSIÓN - Ejemplo 1
El primer cuartil señala que en el 25 % de las ocasiones el tiem-
po que utiliza estudiante del TdeA en llegar a la universidad
es inferior a 35 minutos y el 75 % de las veces es mayor a 35
minutos.
El tercer cuartil señala que en el 75 % de las ocasiones el tiempo
que utiliza estudiante del TdeA en llegar a la universidades
inferior a 44 minutos y el 25 % de las veces es mayor a 44
minutos.
Curso nivelatorio 56 / 81
55. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
EJEMPLO 2
Sea X la variable aleatoria que representa el costo de un tratamien-
to odontológico de los pacientes de una clı́nica privada de la ciudad
de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los
resultados son los siguientes (en miles de pesos):
105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218,
238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212
Los valores muestrales ordenados son:
96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184,
184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265
Curso nivelatorio 57 / 81
56. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
CONCLUSIÓN - Ejemplo 2
El primer cuartil señala que el 25 % de los pacientes entrevista-
dos paga menos de $121000 en su tratamiento odontológico y
el 75 % restante paga más de esa cantidad.
El tercer cuartil señala que el 75 % de los pacientes entrevista-
dos paga menos de $213000 en su tratamiento odontológico y
el 25 % restante paga más de esa cantidad.
Curso nivelatorio 58 / 81
57. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Percentiles
El i-ésimo percentil de una distribución (con 1 % < i < 100 %), es
el valor de la variable X (usualmente denotado Pi ) que marca un
corte de modo que una proporción i de valores del conjunto de datos
es menor o igual que Pi . De la definición previa, se puede concluir
que el total de los datos es divido en 100 partes iguales.
Curso nivelatorio 59 / 81
58. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Percentiles
Veamos algunos ejemplos de la definición presentada:
El décimo percentil (P10) separa el 10 % de los datos (abarcan-
do los más pequeños) del 90 % de valores más grandes.
El percentil 35 (P35) separa el 35 % de los datos más pequeños
del 65 % de valores más grandes.
El percentil 95 (P95) separa el 95 % de los datos más pequeños
del 5 % de valores más grandes.
Curso nivelatorio 60 / 81
59. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
Para estimar los percentiles de un conjunto de datos se siguen los
siguientes pasos:
1. Identificar la posición donde estarı́a el percentil de interés.
El i-ésimo percentil estarı́a en la posición:
Posi =
i ⇤ n
100
El resultado del cálculo de Posi es un número real con parte entera
E y parte decimal D.
2. Emplear alguna de las siguientes reglas para identificar adecua-
damente el percentil de interés:
Curso nivelatorio 61 / 81
60. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
Regla 1
Si el resultado posicional es un número entero (D = 0), entonces
el percentil es igual al siguiente promedio de valores clasificados
(ordenados). El i-ésimo percentil se obtiene por medio de la siguiente
expresión
Pi =
X(E) + X(E+1)
2
Regla 2
Si el resultado posicional no es un número entero (D 6= 0). El i-ésimo
percentil corresponde al siguiente valor ordenado:
Pi = X(E+1)
Curso nivelatorio 62 / 81
61. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo en minutos que
se demora un estudiante en almorzar. Está variación de tiempos se
da de acuerdo a las obligaciones que tiene en cada dı́a.
Dı́as Lunes Martes Miércoles Jueves Viernes Sábado
Tiempo 27 19 25 27 30 22
Dı́as Lunes Martes Miércoles Jueves Viernes Sábado
Tiempo 27 18 23 21 20 24
Se calcularán e interpretarán los percentiles 10 y 60 del conjunto de
datos en cuestión.
Curso nivelatorio 63 / 81
62. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
CONCLUSIÓN - Ejemplo 1
El décimo percentil señala que en el 10 % de los dı́as el estu-
diante se demora menos de 19 minutos en almorzar y el 90 %
restante demora más de ese tiempo.
El percentil sesenta señala que en el 60 % de los dı́as el estu-
diante se demora menos de 25 minutos almorzando y el 40 %
restante demora más de este tiempo.
Curso nivelatorio 64 / 81
63. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
EJEMPLO 2
Sea X la variable aleatoria que representa el costo de un tratamien-
to odontológico de los pacientes de una clı́nica privada de la ciudad
de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los
resultados son los siguientes (en miles de pesos):
105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218,
238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212
Los valores muestrales ordenados son:
96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184,
184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265
Se calcularán e interpretarán los percentiles 17 y 71 del conjunto de
datos en cuestión. Curso nivelatorio 65 / 81
64. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
CONCLUSIÓN - Ejemplo 2
El percentil 17 señala que en el 17 % de los pacientes entrevis-
tados paga menos de $117000 en su tratamiento odontológico
y el 83 % restante paga más de dicha cantidad.
El percentil 71 señala que en el 71 % de los pacientes entrevis-
tados paga menos de $204000 en su tratamiento odontológico
y el 29 % restante paga más de dicha cantidad.
Curso nivelatorio 66 / 81
65. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medida de dispersión
Ejemplo: considere las notas de una prueba de tres grupos de
alumnos:
Grupo 1: 3;4;5;6;7.
Grupo 2: 1;3;5;7;9.
Grupo 2: 5;5;5;5;5.
Note que
x 1 = x 2 = x 3 = 5.
Md1 = Md2 = Md3 = 5.
Curso nivelatorio 67 / 81
66. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Distribución de las notas
Curso nivelatorio 68 / 81
67. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión:
Finalidad: encontrar un valor que resuma la variabilidad de un
conjunto de datos.
Curso nivelatorio 69 / 81
68. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión:
Finalidad: encontrar un valor que resuma la variabilidad de un
conjunto de datos.
Curso nivelatorio 69 / 81
69. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
70. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
71. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
72. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Rango intercuartil)
El intervalo intercuartil está definido por
d = Q3 Q1
.
Por ejemplo, considere los siguientes datos
1, 9; 2, 0; 2, 1; 2, 5; 3, 0; 3, 1; 3, 3; 3, 7; 6, 1; 7, 7
. Para ellos previamente probamos que
Q1 = 2, 05.
Q3 = 4, 9 y el rango intercuartil es
d = Q3 Q1 = 4, 9 2, 05 = 2, 85.
Curso nivelatorio 71 / 81
73. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Desvio medio)
se observan los valores x1, x2, . . . , xn para una variable aleatoria X
cuantitativa. El desvio medio (DM) es definido por
DM =
|x1 x| + |x2 x| + · · · + |xn x|
n
=
n
P
i=1
|xi x|
n
.
Para el ejemplo de las notas previamente mencionado, tenemos que
Curso nivelatorio 72 / 81
75. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Varianza Muestral)
Dadas las observaciones x1, x2, . . . , xn observaciones de una
variable aleatoria X cuantitativa entonces la varianza muestral
(más utilizada) es definida por
s 2
=
(x1 x)2 + · · · + (xn x)2
n 1
=
n
P
i=1
(xi x)2
n 1
.
Definición (Desviación estándar muestral)
La desviación estándar muestral es definida por
s =
p
s 2.
Curso nivelatorio 74 / 81
76. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Varianza muestral (versión 2))
La siguiente definición también es utilizada para la varianza
muestral
b 2
=
(x1 x)2 + · · · + (xn x)2
n
=
n
P
i=1
(xi x)2
n
En este caso, la desviación estándar muestral queda dada por
b =
p
b 2.
Curso nivelatorio 75 / 81
77. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Para el ejemplo de las notas para los tres grupos diferentes
tenemos que:
Curso nivelatorio 76 / 81
78. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Para el ejemplo de las notas para los tres grupos diferentes
tenemos que:
Curso nivelatorio 76 / 81
79. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Fórmula alternativa para s 2)
Una fórmula alternativa para el cálculo de la varianza es dada por
s 2
=
n
P
i=1
x 2
i n ⇥ x 2
n 1
Por ejemplo, para el ejemplo de las notas y en el grupo 1 tenemos
que
n
X
i=1
x2
i = 32
+ 42
+ 52
+ 62
+ 72
= 135.
Además de eso, tenemos que x = 5. Por lo tanto,
s2
=
135 5 ⇥ (5)2
4
=
10
4
= 2, 5.
Curso nivelatorio 77 / 81
80. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Ejemplo: suponga que n = 9 economistas Colombianos, se-
leccionados aleatoriamente, fueron consultados al respecto del
crecimiento en ( %) previsto para el PIB colombiano en 2021.
Los datos colectados fueron los siguientes
Datos: 2,50;2,60;2,66;2,70;2,78;2,80;2,84;2,90;3,00.
Con base en esa muestra, responda lo siguiente
Cuál es la desviación estándar?
Cuál es el rango intercuartil?
Curso nivelatorio 78 / 81
81. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Coeficiente de variación)
El coeficiente de variación es una medida de dispersión relativa que
elimina el efecto de la magnitud de los datos y expresa la variabili-
dad en relación a la media. El coeficiente de variación muestral es
definido por
CV =
s
x
⇥ 100 %
Curso nivelatorio 79 / 81
82. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Ejemplo: la siguiente tabla presenta la media, la desviación
estándar y el coeficiente de variación de las alturas en centı́me-
tros de una muestra de recien nacidos y de una muestra de
adolescentes.
Grupo Media D. E. CV
Recien nacidos 50 6 12 %
Adolescentes 160 16 10 %
Conclusión: En relación a las medias, las alturas de los ado-
lescentes y de los recien nacidos presentan variabilidades muy
parecidas.
Curso nivelatorio 80 / 81
83. Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Varianza aproximada para datos agrupados
En el caso de datos agrupados podemos obtener una varianza
aproximada (ponderada)
s⇤2
=
f1 (Mc1 x̄⇤)2
+ · · · + fK (McK
x̄⇤)2
n
s⇤2
= h1 (Mc1 x̄⇤
)2
+ · · · + hK (McK
x̄⇤
)2
s⇤2
=
K
X
i=1
hi (Mci x̄⇤
)2
Desviación estándar aproximada
s⇤
=
p
s⇤2.
Curso nivelatorio 81 / 81