SlideShare una empresa de Scribd logo
1 de 83
Descargar para leer sin conexión
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
Para las variables numéricas, se necesita un análisis más especı́fico
del que se puede obtener a partir del análisis gráfico visto en las
clases anteriores.
A continuación se presentan algunas medidas numéricas
descriptivas que reforzarán un poco el conocimiento del
comportamiento de los datos por analizar.
Curso nivelatorio 3 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
Las medidas numéricas descriptivas se pueden clasificar en:
1). Medidas de tendencia central: Este tipo de medidas permi-
ten identificar un valor central hacia el que se agrupan los datos.
2). Medidas de posición no central: Este tipo de medidas per-
miten conocer otros puntos caracterı́sticos de la distribución de
los datos que no son los valores centrales. Entre las medidas
de posición no central más importantes están los cuartiles y los
percentiles que son casos puntuales de los cuantiles.
Curso nivelatorio 4 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas numéricas descriptivas
3). Medidas de dispersión o variación: Este tipo de medidas
permiten medir la cantidad de disgregación o de dispersión de
los datos. Dentro de este grupo se tienen medidas que calcu-
lan el grado de dispersión respecto a una medida de tendencia
central (como la varianza muestral y la desviación) y otras que
no tienen dicho referente (como el rango y el rango intercuartil)
4). Medidas de forma: Este tipo de medidas permiten identificar
el patrón caracterı́stico de la distribución de los datos (desde el
menor hasta el mayor).
5). Covarianza y Correlación: Este tipo de medidas ayudan a de-
terminar el grado de asociación lineal entre dos variables alea-
torias.
Curso nivelatorio 5 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de tendencia central
Las medidas de tendencia central se desarrollaron con el fin de poder
identificar el valor central sobre el que tiende a agruparse el conjunto
de datos analizado.
Cuando se habla de promedio, de valor medio o del valor más común
o frecuente, se refiere de manera informal a la media, mediana y la
moda, tres medidas de tendencia central muy empleadas.
Curso nivelatorio 6 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética
La media aritmética o promedio es una de las medidas de tendencia
central más empleadas, en la que todos los valores de una muestra
o una población tienen la misma importancia (aportan una misma
cantidad de información).
La media aritmética o promedio sirve como punto de equilibrio en
un conjunto de datos.
Curso nivelatorio 7 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Sea X una variable aleatoria. Para esta variable, el promedio pobla-
cional se denota con el sı́mbolo µ y el promedio muestral con el
sı́mbolo X̄.
Considere el censo de todos los elementos de una población X1, X2,
· · · , XN - donde N es el número de elementos de la población -.
Para esta población, la media aritmética está dada por la siguiente
expresión:
µ =
N
X
i=1
Xi
N
Curso nivelatorio 8 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Considere una muestra aleatoria de n valores o datos muestrales
(X1, X2, · · · , Xn). Para esta muestra, la fórmula de la media aritméti-
ca muestral está dada por:
X̄ =
n
X
i=1
Xi
n
Curso nivelatorio 9 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Desventaja
La media es una medida de tendencia central que se ve muy afec-
tada por cualquier valor que difiera mucho del conjunto de datos en
general (puntos atı́picos o valores extremos). Cuando se presenten
dichos puntos o valores extremos y el tamaño muestral (o poblacio-
nal) sea pequeño se debe evitar el uso de la media aritmética como
medida de tendencia central.
Curso nivelatorio 10 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Curso nivelatorio 11 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Conclusión
Aunque en ningún dı́a de la muestra el estudiante se demoró 39.6
minutos en llegar a la universidad, asignar 40 minutos a su arreglo
personal y su transporte serı́a un buen criterio para planear el inicio
del dı́a.
Curso nivelatorio 12 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 102 39 44 40 31 44 35
Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos
en lugar de 52.
Curso nivelatorio 13 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
Conclusiones
Note que un valor extremo elevó la media en más del 10 %,
paso de 39.6 a 44.6 minutos.
En contraste con la media obtenida en el ejemplo 1, el nuevo
valor del promedio es mayor que 9 de los 10 datos de tiem-
po llegada, es decir, el punto extremo provocó que la media
aritmética sea una mala medida de tendencia central.
Curso nivelatorio 14 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media aritmética para datos no agrupados
EJEMPLO 3
En un estudio realizado se desea determinar el diámetro promedio
de ciertas piezas fabricadas en un proceso de manufactura, los re-
sultados son los siguientes:
Pieza 1 2 3 4 5 6 7 8
Diámetro (mm) 7 8 14 12 10 21 6 18
Curso nivelatorio 15 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana o valor mediano
La mediana es el valor medio de un conjunto de datos en orden cre-
ciente (del menor al mayor) y representa el valor que divide en dos
partes iguales dicho conjunto ordenado.
A diferencia del promedio aritmético, la mediana no se ve afecta-
da por los valores extremos, de manera que puede utilizarse cuando
están presentes.
Curso nivelatorio 16 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Sea X una variable aleatoria cualquiera. Para esta variable, la me-
diana poblacional se denota con el sı́mbolo e
µ y la mediana muestral
con el sı́mbolo e
X.
Considere el censo ordenado de todos los elementos de una pobla-
ción (X(1), X(2), · · · , X(N)) donde N es el número de elementos de
la población. La mediana poblacional está dada por alguna de las
siguientes reglas:
Curso nivelatorio 17 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 1
Si se tiene una población con número impar de datos (N impar),
la mediana será el valor de la observación X(N+1
2 ) del conjunto de
datos ordenado.
e
µ = X(N+1
2 )
Curso nivelatorio 18 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 2
Si se tiene una población con un número par de datos (N par), la
mediana será el promedio de los valores X(N
2 ) y X(N+2
2 ) del conjunto
de datos ordenado, es decir:
e
µ =
X(N
2 ) + X(N+2
2 )
2
Curso nivelatorio 19 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Considere que se tiene una muestra aleatoria ordenada de n datos
(X(1), X(2), · · · , X(n)). En este caso la mediana muestral está dada
por por alguna de las siguientes reglas:
Curso nivelatorio 20 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 1
Si se tiene una muestra con número impar de datos (n impar), la
mediana será el valor de la observación X(n+1
2 ) de la muestra orde-
nada.
e
X = X(n+1
2 )
Curso nivelatorio 21 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Regla 2
Si se tiene una muestra con un número par de datos (n par), la
mediana será el promedio de los valores X(n
2 ) y X(n+2
2 ) de la muestra
ordenada, es decir:
e
X =
X(n
2 ) + X(n+2
2 )
2
Curso nivelatorio 22 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
52.
Curso nivelatorio 23 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 102 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
102.
Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos
en lugar de 52.
Curso nivelatorio 24 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 3
En un estudio realizado se desea determinar la mediana del diáme-
tro de ciertas piezas fabricadas en un proceso de manufactura, los
resultados son los siguientes:
Pieza 1 2 3 4 5 6 7 8
Diámetro (mm) 7 8 14 12 10 21 6 18
Curso nivelatorio 25 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
Conclusión
Se puede concluir que el 50 % de las piezas presentaron un diámetro
inferior a 11 mm y el 50 % restante presentaron un diámetro superior
a 11 mm.
Curso nivelatorio 26 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos no agrupados
EJEMPLO 4
Con el fin de realizar un gran estudio psiquiátrico sobre los motivos
por los que una persona vive en la indigencia, se registra el número
de individuos con las caracterı́stica de interés en 13 ciudades de
Colombia obteniendo los siguientes resultados:
1651, 1760, 2238, 2363, 1530, 2255, 1622, 1593, 1627, 1739,
1537, 2307, 2042
Estimar la mediana de este conjunto de datos.
Curso nivelatorio 27 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
La moda se define como el valor que aparece con mayor frecuencia en
una población o en una muestra aleatoria (conjunto de datos). Es-
ta medida de localización no se ve afectada por los valores extremos.
Nota
Con frecuencia se presenta el caso donde en un conjunto de da-
tos (muestral o poblacional) no existe moda, o bien existen varias
modas.
Curso nivelatorio 28 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
Para identificar la Moda en un conjunto de datos se realiza el si-
guiente procedimiento:
1 Ordene los datos de menor a mayor.
2 Identifique el (los) valor(es) que más se repiten.
Curso nivelatorio 29 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Curso nivelatorio 30 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 1
Ordenando los datos del menor al mayor
Tiempo 29 31 35 39 39 40 43 44 44 52
Se puede observar que en este conjunto de datos existen 2 modas:
39 y 44 minutos.
Curso nivelatorio 31 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 2
Sea X la variable aleatoria que representa el número de defectuo-
sos en una lı́nea de producción en 14 dı́as. Los resultados son los
siguientes:
Dı́a 1 2 3 4 5 6 7
Defectuosos 2 1 0 3 4 6 6
Dı́a 8 9 10 11 12 13 14
Defectuosos 2 2 3 3 0 3 0
Curso nivelatorio 32 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos no agrupados
EJEMPLO 2
Ordenando los datos del menor al mayor
Defectuosos 0 0 0 1 2 2 3
Defectuosos 3 3 3 4 6 6
Se puede observar que en este conjunto de datos existe una moda:
3 defectuosos.
Curso nivelatorio 33 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Variables cuantitativas
Una tabla de frecuencias para datos agrupados tiene la siguiente es-
tructura:
Intervalo Mc Frec. Frec. Frec. Abs. Frec. Rel.
Abs. fi Rel. hi ( %) Acum. Fi Acum. Hi ( %)
[a, b) a+b
2 f1 h1 F1 H1
[b, c) b+c
2 f2 h2 F2 H2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
[g, h] g+h
2 fm hm Fm Hm
Curso nivelatorio 34 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Sea X una variable aleatoria; Mci las marcas de clase y fi las fre-
cuencias absolutas de cada uno de los K agrupamientos o categorı́as
convenientemente establecidas para los N valores observados en la
población. El promedio poblacional para datos agrupados, denotado
µ, se define por medio de la siguiente ecuación:
µ =
K
X
i=1
fi Mci
N
Curso nivelatorio 35 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media para datos agrupados
Sea X una variable aleatoria; Mci las marcas de clase y fi las fre-
cuencias absolutas de cada uno de los K agrupamientos o categorı́as
convenientemente establecidas para los n valores observados en la
muestra aleatoria de la población. El promedio muestral para datos
agrupados, denotado X̄, se define por medio de la siguiente ecuación:
X̄ =
K
X
i=1
fi Mci
n
Curso nivelatorio 36 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
Para los datos agrupados la expresión para calcular la mediana po-
blacional es la siguiente
µ̃ = Li + A
N
2 Fi 1
fmed
!
Donde,
Li = Lı́mite inferior de la clase medial (clase que contiene a la
mediana)
A = Amplitud del intervalo que contiene a la mediana
Fi 1 = Frecuencia absoluta acumulada anterior a la frecuencia
absoluta acumulada de la clase medial
fmed = Frecuencia absoluta de la la clase medial
N = Total poblacional
Curso nivelatorio 37 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
La clase medial o intervalo que contiene a la mediana es aquella
clase en donde esté acumulado el 50 % de los datos.
La amplitud del intervalo que contiene a la mediana se obtiene
al restarle al lı́mite superior del mismo su lı́mite inferior.
Curso nivelatorio 38 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Mediana para datos agrupados
Para los datos agrupados se tiene una extensión de la definición de
valor mediano muestral, veamos la ecuación:
X̃ = Li + A
✓ n
2 Fi 1
fmed
◆
Donde Li , A, Fi 1, fmed tienen la misma definición presentada an-
teriormente y n es el tamaño de la muestra aleatoria.
Curso nivelatorio 39 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Moda para datos agrupados
La moda para datos no agrupados, tanto para el caso poblacional
como para el caso muestral, está dado por la siguiente expresión:
Mo = mo = Li + A
✓
fi fi 1
(fi fi 1) + (fi fi+1)
◆
Donde,
Li = Lı́mite inferior de la clase modal
A = Amplitud de la clase modal
fi = Frecuencia absoluta de la clase modal
fi 1 = Frecuencia absoluta anterior a la de la clase modal
fi+1 = Frecuencia absoluta siguiente a la de la clase modal
La clase modal corresponde a la clase o intervalo de mayor frecuencia
absoluta.
Curso nivelatorio 40 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media, mediana y moda para datos agrupados
EJEMPLO 1
Cálculo de la media, mediana y moda para el ejemplo de las notas
obtenidas por 40 estudiantes del curso de Medición I:
Clases Mc fi hi ( %) Fi Hi ( %)
[1.60 , 2.04) 1.82 2 5 2 5
[2.04 , 2.48) 2.26 1 2.5 3 7.5
[2.48 , 2.92) 2.70 4 10 7 17.5
[2.92 , 3.36) 3.14 12 30 19 47.5
[3.36 , 3.80) 3.58 9 22.5 28 70
[3.80 , 4.24) 4.02 7 17.5 35 87.5
[4.24 , 4.7] 4.46 5 12.5 40 100
Curso nivelatorio 41 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Media, mediana y moda para datos agrupados
EJEMPLO 2
Cálculo de la media, mediana y moda para el ejemplo de la variable
Ventas medida en cierta empresa:
Clases Mc fi hi Fi Hi
[0, 500) 250 726 0.425 726 0.425
[500 , 1000) 750 587 0.343 1313 0.768
[1000 , 1500) 1250 292 0.171 1605 0.939
[1500 , 2000) 1750 74 0.043 1679 0.982
[2000 , 2500) 2250 24 0.014 1703 0.996
[2500 , 3000] 2750 7 0.004 1710 1.000
Curso nivelatorio 42 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Las medidas de posición no central se diseñaron con el fin de cono-
cer otros puntos caracterı́sticos de la distribución de los datos que
no son los valores centrales.
Entre las medidas de posición no central más importantes están los
cuantiles.
Curso nivelatorio 43 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
El término cuantil fue usado por primera vez por Kendall en 1940.
El cuantil de orden p de una distribución (con 0 < p < 1) es el valor
de la variable X (usualmente denotado Xp) que marca un corte
de modo que una proporción p de valores de la población o de la
muestra es menor o igual que Xp.
Curso nivelatorio 44 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Por ejemplo, el cuantil de orden 0.36 es un valor que dejarı́a un 36 %
de valores por debajo y un 64 % por encima del valor X0.36.
Los cuantiles suelen usarse por grupos que dividen la distribución
de los datos en partes iguales; entendidas estas como intervalos que
comprenden la misma proporción de valores.
Curso nivelatorio 45 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de posición no central
Los más usados son:
Los Cuartiles, que dividen la distribución de los datos en cuatro
partes (corresponden a los cuantiles 0.25, 0.50 y 0.75).
Los Quintiles, que dividen la distribución de los datos en cinco
partes (corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80).
Los Deciles, que dividen la distribución de los datos en diez
partes iguales.
Los Percentiles, que dividen la distribución de los datos en cien
partes iguales (se denotan como P25, P75, P90, etc.).
Curso nivelatorio 46 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Cuartiles
Los cuartiles son medidas numéricas las cuales permiten dividir un
conjunto de datos en 4 partes iguales.
El primer cuartil Q1 separa el 25 % de los datos (abarcando los
más pequeños), del 75 % restante (equivale al P25).
El segundo cuartil Q2 separa el 50 % de los datos más pequeños
del 50 % restante. Este valor corresponde al valor mediano de
los datos, es decir, Q2 = e
X (equivale al P50).
El tercer cuartil Q3 separa el 75 % de los datos más pequeños,
del 25 % de valores más grandes (equivale al P75).
Curso nivelatorio 47 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles poblacionales
Cuartiles poblacionales
Considere el censo ordenado del menor al mayor valor de todos los
elementos de una población (X(1), X(2), · · · , X(N)) donde N es el
número de elementos de la población.
Curso nivelatorio 48 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles poblacionales
El primer cuartil poblacional está dado por la observación en la po-
sición N+1
4 del conjunto de datos ordenado, es decir:
Q1 = X(N+1
4 )
El tercer cuartil poblacional está dado por la observación 3(N+1)
4 del
conjunto de datos ordenado, es decir:
Q3 = X⇣
3(N+1)
4
⌘
Curso nivelatorio 49 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Cuartiles Muestrales
Considere una muestra aleatoria ordenada del menor al mayor valor
de una población (X(1), X(2), · · · , X(n)) donde n es el número de
elementos de la muestra.
Curso nivelatorio 50 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
El primer cuartil muestral está dado por la observación en la posición
n+1
4 del conjunto de datos ordenado, es decir:
Q1 = X(n+1
4 )
El tercer cuartil muestral está dado por la observación 3(n+1)
4 del
conjunto de datos ordenado, es decir:
Q3 = X⇣
3(n+1)
4
⌘
Curso nivelatorio 51 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Para calcular los cuartiles, se utilizan las siguientes reglas:
Regla 1
Si el resultado posicional es un número entero, entonces el cuartil
es igual al valor clasificado de esa posición.
Ejemplo: Sea n = 11.
Q1 = X(n+1
4 ) = X(11+1
4 ) = X(3)
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(11+1)
4
⌘ = X(9)
Curso nivelatorio 52 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Regla 2
Si el resultado es una fracción de mitad (2.5, 3.5, 4.5), entonces
el cuartil es igual al promedio de los valores clasificados correspon-
dientes.
Ejemplo: Sea n = 9.
Q1 = X(n+1
4 ) = X(9+1
4 ) = X(2.5) =
X(2) + X(3)
2
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(9+1)
4
⌘ = X(7.5) =
X(7) + X(8)
2
Curso nivelatorio 53 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
Regla 3
Si el resultado obtenido no es un entero, ni una fracción de mitad, se
redondea al entero más cercano y se selecciona ese valor clasificado.
Ejemplo: Sea n = 10.
Q1 = X(n+1
4 ) = X(10+1
4 ) = X(2.75) = X(3)
Q3 = X⇣
3(n+1)
4
⌘ = X⇣
3(10+1)
4
⌘ = X(8.25) = X(8)
Curso nivelatorio 54 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
EJEMPLO
Sea X la variable aleatoria que representa el tiempo que se demora un
estudiante del TdeA en llegar a la universidad. El estudiante registró
el tiempo enunciado por diez dı́as (en minutos) y los resultados son
los siguientes:
Dı́a 1 2 3 4 5 6 7 8 9 10
Tiempo 39 29 43 52 39 44 40 31 44 35
Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) =
39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) =
52.
Curso nivelatorio 55 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
CONCLUSIÓN - Ejemplo 1
El primer cuartil señala que en el 25 % de las ocasiones el tiem-
po que utiliza estudiante del TdeA en llegar a la universidad
es inferior a 35 minutos y el 75 % de las veces es mayor a 35
minutos.
El tercer cuartil señala que en el 75 % de las ocasiones el tiempo
que utiliza estudiante del TdeA en llegar a la universidades
inferior a 44 minutos y el 25 % de las veces es mayor a 44
minutos.
Curso nivelatorio 56 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
EJEMPLO 2
Sea X la variable aleatoria que representa el costo de un tratamien-
to odontológico de los pacientes de una clı́nica privada de la ciudad
de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los
resultados son los siguientes (en miles de pesos):
105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218,
238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212
Los valores muestrales ordenados son:
96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184,
184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265
Curso nivelatorio 57 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los cuartiles muestrales
CONCLUSIÓN - Ejemplo 2
El primer cuartil señala que el 25 % de los pacientes entrevista-
dos paga menos de $121000 en su tratamiento odontológico y
el 75 % restante paga más de esa cantidad.
El tercer cuartil señala que el 75 % de los pacientes entrevista-
dos paga menos de $213000 en su tratamiento odontológico y
el 25 % restante paga más de esa cantidad.
Curso nivelatorio 58 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Percentiles
El i-ésimo percentil de una distribución (con 1 % < i < 100 %), es
el valor de la variable X (usualmente denotado Pi ) que marca un
corte de modo que una proporción i de valores del conjunto de datos
es menor o igual que Pi . De la definición previa, se puede concluir
que el total de los datos es divido en 100 partes iguales.
Curso nivelatorio 59 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Percentiles
Veamos algunos ejemplos de la definición presentada:
El décimo percentil (P10) separa el 10 % de los datos (abarcan-
do los más pequeños) del 90 % de valores más grandes.
El percentil 35 (P35) separa el 35 % de los datos más pequeños
del 65 % de valores más grandes.
El percentil 95 (P95) separa el 95 % de los datos más pequeños
del 5 % de valores más grandes.
Curso nivelatorio 60 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
Para estimar los percentiles de un conjunto de datos se siguen los
siguientes pasos:
1. Identificar la posición donde estarı́a el percentil de interés.
El i-ésimo percentil estarı́a en la posición:
Posi =
i ⇤ n
100
El resultado del cálculo de Posi es un número real con parte entera
E y parte decimal D.
2. Emplear alguna de las siguientes reglas para identificar adecua-
damente el percentil de interés:
Curso nivelatorio 61 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
Regla 1
Si el resultado posicional es un número entero (D = 0), entonces
el percentil es igual al siguiente promedio de valores clasificados
(ordenados). El i-ésimo percentil se obtiene por medio de la siguiente
expresión
Pi =
X(E) + X(E+1)
2
Regla 2
Si el resultado posicional no es un número entero (D 6= 0). El i-ésimo
percentil corresponde al siguiente valor ordenado:
Pi = X(E+1)
Curso nivelatorio 62 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
EJEMPLO 1
Sea X la variable aleatoria que representa el tiempo en minutos que
se demora un estudiante en almorzar. Está variación de tiempos se
da de acuerdo a las obligaciones que tiene en cada dı́a.
Dı́as Lunes Martes Miércoles Jueves Viernes Sábado
Tiempo 27 19 25 27 30 22
Dı́as Lunes Martes Miércoles Jueves Viernes Sábado
Tiempo 27 18 23 21 20 24
Se calcularán e interpretarán los percentiles 10 y 60 del conjunto de
datos en cuestión.
Curso nivelatorio 63 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
CONCLUSIÓN - Ejemplo 1
El décimo percentil señala que en el 10 % de los dı́as el estu-
diante se demora menos de 19 minutos en almorzar y el 90 %
restante demora más de ese tiempo.
El percentil sesenta señala que en el 60 % de los dı́as el estu-
diante se demora menos de 25 minutos almorzando y el 40 %
restante demora más de este tiempo.
Curso nivelatorio 64 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
EJEMPLO 2
Sea X la variable aleatoria que representa el costo de un tratamien-
to odontológico de los pacientes de una clı́nica privada de la ciudad
de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los
resultados son los siguientes (en miles de pesos):
105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218,
238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212
Los valores muestrales ordenados son:
96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184,
184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265
Se calcularán e interpretarán los percentiles 17 y 71 del conjunto de
datos en cuestión. Curso nivelatorio 65 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Estimación de los percentiles muestrales
CONCLUSIÓN - Ejemplo 2
El percentil 17 señala que en el 17 % de los pacientes entrevis-
tados paga menos de $117000 en su tratamiento odontológico
y el 83 % restante paga más de dicha cantidad.
El percentil 71 señala que en el 71 % de los pacientes entrevis-
tados paga menos de $204000 en su tratamiento odontológico
y el 29 % restante paga más de dicha cantidad.
Curso nivelatorio 66 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medida de dispersión
Ejemplo: considere las notas de una prueba de tres grupos de
alumnos:
Grupo 1: 3;4;5;6;7.
Grupo 2: 1;3;5;7;9.
Grupo 2: 5;5;5;5;5.
Note que
x 1 = x 2 = x 3 = 5.
Md1 = Md2 = Md3 = 5.
Curso nivelatorio 67 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Distribución de las notas
Curso nivelatorio 68 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión:
Finalidad: encontrar un valor que resuma la variabilidad de un
conjunto de datos.
Curso nivelatorio 69 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Medidas de dispersión:
Finalidad: encontrar un valor que resuma la variabilidad de un
conjunto de datos.
Curso nivelatorio 69 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Amplitud: la amplitud es definida por
A = máx mı́n
Por ejemplo, para los datos previamente descritos tenemos que
Grupo 1, A = 4.
Grupo 2, A = 8.
Grupo 3, A = 0.
Curso nivelatorio 70 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Rango intercuartil)
El intervalo intercuartil está definido por
d = Q3 Q1
.
Por ejemplo, considere los siguientes datos
1, 9; 2, 0; 2, 1; 2, 5; 3, 0; 3, 1; 3, 3; 3, 7; 6, 1; 7, 7
. Para ellos previamente probamos que
Q1 = 2, 05.
Q3 = 4, 9 y el rango intercuartil es
d = Q3 Q1 = 4, 9 2, 05 = 2, 85.
Curso nivelatorio 71 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Desvio medio)
se observan los valores x1, x2, . . . , xn para una variable aleatoria X
cuantitativa. El desvio medio (DM) es definido por
DM =
|x1 x| + |x2 x| + · · · + |xn x|
n
=
n
P
i=1
|xi x|
n
.
Para el ejemplo de las notas previamente mencionado, tenemos que
Curso nivelatorio 72 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Curso nivelatorio 73 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Varianza Muestral)
Dadas las observaciones x1, x2, . . . , xn observaciones de una
variable aleatoria X cuantitativa entonces la varianza muestral
(más utilizada) es definida por
s 2
=
(x1 x)2 + · · · + (xn x)2
n 1
=
n
P
i=1
(xi x)2
n 1
.
Definición (Desviación estándar muestral)
La desviación estándar muestral es definida por
s =
p
s 2.
Curso nivelatorio 74 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Varianza muestral (versión 2))
La siguiente definición también es utilizada para la varianza
muestral
b 2
=
(x1 x)2 + · · · + (xn x)2
n
=
n
P
i=1
(xi x)2
n
En este caso, la desviación estándar muestral queda dada por
b =
p
b 2.
Curso nivelatorio 75 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Para el ejemplo de las notas para los tres grupos diferentes
tenemos que:
Curso nivelatorio 76 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Para el ejemplo de las notas para los tres grupos diferentes
tenemos que:
Curso nivelatorio 76 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Fórmula alternativa para s 2)
Una fórmula alternativa para el cálculo de la varianza es dada por
s 2
=
n
P
i=1
x 2
i n ⇥ x 2
n 1
Por ejemplo, para el ejemplo de las notas y en el grupo 1 tenemos
que
n
X
i=1
x2
i = 32
+ 42
+ 52
+ 62
+ 72
= 135.
Además de eso, tenemos que x = 5. Por lo tanto,
s2
=
135 5 ⇥ (5)2
4
=
10
4
= 2, 5.
Curso nivelatorio 77 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Ejemplo: suponga que n = 9 economistas Colombianos, se-
leccionados aleatoriamente, fueron consultados al respecto del
crecimiento en ( %) previsto para el PIB colombiano en 2021.
Los datos colectados fueron los siguientes
Datos: 2,50;2,60;2,66;2,70;2,78;2,80;2,84;2,90;3,00.
Con base en esa muestra, responda lo siguiente
Cuál es la desviación estándar?
Cuál es el rango intercuartil?
Curso nivelatorio 78 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Medidas de dispersión
Definición (Coeficiente de variación)
El coeficiente de variación es una medida de dispersión relativa que
elimina el efecto de la magnitud de los datos y expresa la variabili-
dad en relación a la media. El coeficiente de variación muestral es
definido por
CV =
s
x
⇥ 100 %
Curso nivelatorio 79 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Ejemplo
Ejemplo: la siguiente tabla presenta la media, la desviación
estándar y el coeficiente de variación de las alturas en centı́me-
tros de una muestra de recien nacidos y de una muestra de
adolescentes.
Grupo Media D. E. CV
Recien nacidos 50 6 12 %
Adolescentes 160 16 10 %
Conclusión: En relación a las medias, las alturas de los ado-
lescentes y de los recien nacidos presentan variabilidades muy
parecidas.
Curso nivelatorio 80 / 81
Medidas numéricas descriptivas
Medidas de tendencia central
Medidas de posición no central
Medidas de dispersión
Varianza aproximada para datos agrupados
En el caso de datos agrupados podemos obtener una varianza
aproximada (ponderada)
s⇤2
=
f1 (Mc1 x̄⇤)2
+ · · · + fK (McK
x̄⇤)2
n
s⇤2
= h1 (Mc1 x̄⇤
)2
+ · · · + hK (McK
x̄⇤
)2
s⇤2
=
K
X
i=1
hi (Mci x̄⇤
)2
Desviación estándar aproximada
s⇤
=
p
s⇤2.
Curso nivelatorio 81 / 81

Más contenido relacionado

Similar a Estadística presentación medidas numéricas descriptivas

Medidas de tendencia central, posición y de
Medidas de tendencia central, posición y deMedidas de tendencia central, posición y de
Medidas de tendencia central, posición y deAndres Diaz
 
Medidas de Tendencia
Medidas de TendenciaMedidas de Tendencia
Medidas de TendenciaJhane Bahar
 
Trabajo de estadistica tercer corte primer 20%
Trabajo de estadistica tercer corte primer 20%Trabajo de estadistica tercer corte primer 20%
Trabajo de estadistica tercer corte primer 20%Angelo Verges Chourio
 
Estadistica Univariada
Estadistica UnivariadaEstadistica Univariada
Estadistica UnivariadaUnicauca
 
Estadistica Univariada
Estadistica UnivariadaEstadistica Univariada
Estadistica Univariadaguest3207525
 
Presentación1345 de kelly mejorada
Presentación1345 de kelly mejoradaPresentación1345 de kelly mejorada
Presentación1345 de kelly mejoradaKelly Moreno
 
Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456Kelly Moreno
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica DescriptivaDanielDierN
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca0603271735
 
Procesamiento. estadistica conceptos
Procesamiento. estadistica conceptosProcesamiento. estadistica conceptos
Procesamiento. estadistica conceptoslady
 
Procesamiento. estadistica
Procesamiento. estadisticaProcesamiento. estadistica
Procesamiento. estadisticalady
 
Presentación1
Presentación1Presentación1
Presentación1dauf_154
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia centralMariaVelsquezLpez
 

Similar a Estadística presentación medidas numéricas descriptivas (20)

Datos no Agrupados.pdf
Datos no Agrupados.pdfDatos no Agrupados.pdf
Datos no Agrupados.pdf
 
Medidas de tendencia central, posición y de
Medidas de tendencia central, posición y deMedidas de tendencia central, posición y de
Medidas de tendencia central, posición y de
 
Medidas de Tendencia
Medidas de TendenciaMedidas de Tendencia
Medidas de Tendencia
 
Trabajo de estadistica tercer corte primer 20%
Trabajo de estadistica tercer corte primer 20%Trabajo de estadistica tercer corte primer 20%
Trabajo de estadistica tercer corte primer 20%
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 
Estadistica Univariada
Estadistica UnivariadaEstadistica Univariada
Estadistica Univariada
 
Estadistica Univariada
Estadistica UnivariadaEstadistica Univariada
Estadistica Univariada
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Presentación1345 de kelly mejorada
Presentación1345 de kelly mejoradaPresentación1345 de kelly mejorada
Presentación1345 de kelly mejorada
 
Guia I estadistica
Guia I estadisticaGuia I estadistica
Guia I estadistica
 
Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456Power point presentacion, medidas tendenciales 456
Power point presentacion, medidas tendenciales 456
 
Esta Di Stica Descriptiva
Esta Di Stica DescriptivaEsta Di Stica Descriptiva
Esta Di Stica Descriptiva
 
presentacion de Matematica
presentacion de Matematicapresentacion de Matematica
presentacion de Matematica
 
Presentacion elena paca
Presentacion   elena pacaPresentacion   elena paca
Presentacion elena paca
 
Capitulo 1
Capitulo 1Capitulo 1
Capitulo 1
 
Medidas de Posición y Disersión
Medidas de Posición y DisersiónMedidas de Posición y Disersión
Medidas de Posición y Disersión
 
Procesamiento. estadistica conceptos
Procesamiento. estadistica conceptosProcesamiento. estadistica conceptos
Procesamiento. estadistica conceptos
 
Procesamiento. estadistica
Procesamiento. estadisticaProcesamiento. estadistica
Procesamiento. estadistica
 
Presentación1
Presentación1Presentación1
Presentación1
 
Medidas de tendencia central
Medidas de tendencia centralMedidas de tendencia central
Medidas de tendencia central
 

Último

DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADOJosé Luis Palma
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Flores Nacionales de América Latina - Botánica
Flores Nacionales de América Latina - BotánicaFlores Nacionales de América Latina - Botánica
Flores Nacionales de América Latina - BotánicaJuan Carlos Fonseca Mata
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadAlejandrino Halire Ccahuana
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteJuan Hernandez
 
Movimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en VenezuelaMovimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en Venezuelacocuyelquemao
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.DaluiMonasterio
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
Marketing y servicios 2ºBTP Cocina DGETP
Marketing y servicios 2ºBTP Cocina DGETPMarketing y servicios 2ºBTP Cocina DGETP
Marketing y servicios 2ºBTP Cocina DGETPANEP - DETP
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
CULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirCULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirPaddySydney1
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...JAVIER SOLIS NOYOLA
 

Último (20)

DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADODECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
DECÁGOLO DEL GENERAL ELOY ALFARO DELGADO
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Flores Nacionales de América Latina - Botánica
Flores Nacionales de América Latina - BotánicaFlores Nacionales de América Latina - Botánica
Flores Nacionales de América Latina - Botánica
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
Lecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdadLecciones 04 Esc. Sabática. Defendamos la verdad
Lecciones 04 Esc. Sabática. Defendamos la verdad
 
Unidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parteUnidad II Doctrina de la Iglesia 1 parte
Unidad II Doctrina de la Iglesia 1 parte
 
Unidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDIUnidad 3 | Teorías de la Comunicación | MCDI
Unidad 3 | Teorías de la Comunicación | MCDI
 
Movimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en VenezuelaMovimientos Precursores de La Independencia en Venezuela
Movimientos Precursores de La Independencia en Venezuela
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
Unidad 4 | Teorías de las Comunicación | MCDI
Unidad 4 | Teorías de las Comunicación | MCDIUnidad 4 | Teorías de las Comunicación | MCDI
Unidad 4 | Teorías de las Comunicación | MCDI
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
EXPECTATIVAS vs PERSPECTIVA en la vida.
EXPECTATIVAS vs PERSPECTIVA  en la vida.EXPECTATIVAS vs PERSPECTIVA  en la vida.
EXPECTATIVAS vs PERSPECTIVA en la vida.
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
Marketing y servicios 2ºBTP Cocina DGETP
Marketing y servicios 2ºBTP Cocina DGETPMarketing y servicios 2ºBTP Cocina DGETP
Marketing y servicios 2ºBTP Cocina DGETP
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
CULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartirCULTURA NAZCA, presentación en aula para compartir
CULTURA NAZCA, presentación en aula para compartir
 
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
LA ECUACIÓN DEL NÚMERO PI EN LOS JUEGOS OLÍMPICOS DE PARÍS. Por JAVIER SOLIS ...
 

Estadística presentación medidas numéricas descriptivas

  • 1. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas numéricas descriptivas Para las variables numéricas, se necesita un análisis más especı́fico del que se puede obtener a partir del análisis gráfico visto en las clases anteriores. A continuación se presentan algunas medidas numéricas descriptivas que reforzarán un poco el conocimiento del comportamiento de los datos por analizar. Curso nivelatorio 3 / 81
  • 2. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas numéricas descriptivas Las medidas numéricas descriptivas se pueden clasificar en: 1). Medidas de tendencia central: Este tipo de medidas permi- ten identificar un valor central hacia el que se agrupan los datos. 2). Medidas de posición no central: Este tipo de medidas per- miten conocer otros puntos caracterı́sticos de la distribución de los datos que no son los valores centrales. Entre las medidas de posición no central más importantes están los cuartiles y los percentiles que son casos puntuales de los cuantiles. Curso nivelatorio 4 / 81
  • 3. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas numéricas descriptivas 3). Medidas de dispersión o variación: Este tipo de medidas permiten medir la cantidad de disgregación o de dispersión de los datos. Dentro de este grupo se tienen medidas que calcu- lan el grado de dispersión respecto a una medida de tendencia central (como la varianza muestral y la desviación) y otras que no tienen dicho referente (como el rango y el rango intercuartil) 4). Medidas de forma: Este tipo de medidas permiten identificar el patrón caracterı́stico de la distribución de los datos (desde el menor hasta el mayor). 5). Covarianza y Correlación: Este tipo de medidas ayudan a de- terminar el grado de asociación lineal entre dos variables alea- torias. Curso nivelatorio 5 / 81
  • 4. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de tendencia central Las medidas de tendencia central se desarrollaron con el fin de poder identificar el valor central sobre el que tiende a agruparse el conjunto de datos analizado. Cuando se habla de promedio, de valor medio o del valor más común o frecuente, se refiere de manera informal a la media, mediana y la moda, tres medidas de tendencia central muy empleadas. Curso nivelatorio 6 / 81
  • 5. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética La media aritmética o promedio es una de las medidas de tendencia central más empleadas, en la que todos los valores de una muestra o una población tienen la misma importancia (aportan una misma cantidad de información). La media aritmética o promedio sirve como punto de equilibrio en un conjunto de datos. Curso nivelatorio 7 / 81
  • 6. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados Sea X una variable aleatoria. Para esta variable, el promedio pobla- cional se denota con el sı́mbolo µ y el promedio muestral con el sı́mbolo X̄. Considere el censo de todos los elementos de una población X1, X2, · · · , XN - donde N es el número de elementos de la población -. Para esta población, la media aritmética está dada por la siguiente expresión: µ = N X i=1 Xi N Curso nivelatorio 8 / 81
  • 7. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados Considere una muestra aleatoria de n valores o datos muestrales (X1, X2, · · · , Xn). Para esta muestra, la fórmula de la media aritméti- ca muestral está dada por: X̄ = n X i=1 Xi n Curso nivelatorio 9 / 81
  • 8. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados Desventaja La media es una medida de tendencia central que se ve muy afec- tada por cualquier valor que difiera mucho del conjunto de datos en general (puntos atı́picos o valores extremos). Cuando se presenten dichos puntos o valores extremos y el tamaño muestral (o poblacio- nal) sea pequeño se debe evitar el uso de la media aritmética como medida de tendencia central. Curso nivelatorio 10 / 81
  • 9. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados EJEMPLO 1 Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 52 39 44 40 31 44 35 Curso nivelatorio 11 / 81
  • 10. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados Conclusión Aunque en ningún dı́a de la muestra el estudiante se demoró 39.6 minutos en llegar a la universidad, asignar 40 minutos a su arreglo personal y su transporte serı́a un buen criterio para planear el inicio del dı́a. Curso nivelatorio 12 / 81
  • 11. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados EJEMPLO 2 Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 102 39 44 40 31 44 35 Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos en lugar de 52. Curso nivelatorio 13 / 81
  • 12. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados Conclusiones Note que un valor extremo elevó la media en más del 10 %, paso de 39.6 a 44.6 minutos. En contraste con la media obtenida en el ejemplo 1, el nuevo valor del promedio es mayor que 9 de los 10 datos de tiem- po llegada, es decir, el punto extremo provocó que la media aritmética sea una mala medida de tendencia central. Curso nivelatorio 14 / 81
  • 13. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media aritmética para datos no agrupados EJEMPLO 3 En un estudio realizado se desea determinar el diámetro promedio de ciertas piezas fabricadas en un proceso de manufactura, los re- sultados son los siguientes: Pieza 1 2 3 4 5 6 7 8 Diámetro (mm) 7 8 14 12 10 21 6 18 Curso nivelatorio 15 / 81
  • 14. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana o valor mediano La mediana es el valor medio de un conjunto de datos en orden cre- ciente (del menor al mayor) y representa el valor que divide en dos partes iguales dicho conjunto ordenado. A diferencia del promedio aritmético, la mediana no se ve afecta- da por los valores extremos, de manera que puede utilizarse cuando están presentes. Curso nivelatorio 16 / 81
  • 15. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Sea X una variable aleatoria cualquiera. Para esta variable, la me- diana poblacional se denota con el sı́mbolo e µ y la mediana muestral con el sı́mbolo e X. Considere el censo ordenado de todos los elementos de una pobla- ción (X(1), X(2), · · · , X(N)) donde N es el número de elementos de la población. La mediana poblacional está dada por alguna de las siguientes reglas: Curso nivelatorio 17 / 81
  • 16. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Regla 1 Si se tiene una población con número impar de datos (N impar), la mediana será el valor de la observación X(N+1 2 ) del conjunto de datos ordenado. e µ = X(N+1 2 ) Curso nivelatorio 18 / 81
  • 17. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Regla 2 Si se tiene una población con un número par de datos (N par), la mediana será el promedio de los valores X(N 2 ) y X(N+2 2 ) del conjunto de datos ordenado, es decir: e µ = X(N 2 ) + X(N+2 2 ) 2 Curso nivelatorio 19 / 81
  • 18. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Considere que se tiene una muestra aleatoria ordenada de n datos (X(1), X(2), · · · , X(n)). En este caso la mediana muestral está dada por por alguna de las siguientes reglas: Curso nivelatorio 20 / 81
  • 19. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Regla 1 Si se tiene una muestra con número impar de datos (n impar), la mediana será el valor de la observación X(n+1 2 ) de la muestra orde- nada. e X = X(n+1 2 ) Curso nivelatorio 21 / 81
  • 20. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Regla 2 Si se tiene una muestra con un número par de datos (n par), la mediana será el promedio de los valores X(n 2 ) y X(n+2 2 ) de la muestra ordenada, es decir: e X = X(n 2 ) + X(n+2 2 ) 2 Curso nivelatorio 22 / 81
  • 21. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados EJEMPLO 1 Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 52 39 44 40 31 44 35 Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) = 39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) = 52. Curso nivelatorio 23 / 81
  • 22. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados EJEMPLO 2 Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 102 39 44 40 31 44 35 Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) = 39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) = 102. Modificación: El tiempo de llegada del cuarto dı́a es de 102 minutos en lugar de 52. Curso nivelatorio 24 / 81
  • 23. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados EJEMPLO 3 En un estudio realizado se desea determinar la mediana del diáme- tro de ciertas piezas fabricadas en un proceso de manufactura, los resultados son los siguientes: Pieza 1 2 3 4 5 6 7 8 Diámetro (mm) 7 8 14 12 10 21 6 18 Curso nivelatorio 25 / 81
  • 24. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados Conclusión Se puede concluir que el 50 % de las piezas presentaron un diámetro inferior a 11 mm y el 50 % restante presentaron un diámetro superior a 11 mm. Curso nivelatorio 26 / 81
  • 25. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos no agrupados EJEMPLO 4 Con el fin de realizar un gran estudio psiquiátrico sobre los motivos por los que una persona vive en la indigencia, se registra el número de individuos con las caracterı́stica de interés en 13 ciudades de Colombia obteniendo los siguientes resultados: 1651, 1760, 2238, 2363, 1530, 2255, 1622, 1593, 1627, 1739, 1537, 2307, 2042 Estimar la mediana de este conjunto de datos. Curso nivelatorio 27 / 81
  • 26. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados La moda se define como el valor que aparece con mayor frecuencia en una población o en una muestra aleatoria (conjunto de datos). Es- ta medida de localización no se ve afectada por los valores extremos. Nota Con frecuencia se presenta el caso donde en un conjunto de da- tos (muestral o poblacional) no existe moda, o bien existen varias modas. Curso nivelatorio 28 / 81
  • 27. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados Para identificar la Moda en un conjunto de datos se realiza el si- guiente procedimiento: 1 Ordene los datos de menor a mayor. 2 Identifique el (los) valor(es) que más se repiten. Curso nivelatorio 29 / 81
  • 28. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados EJEMPLO 1 Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 52 39 44 40 31 44 35 Curso nivelatorio 30 / 81
  • 29. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados EJEMPLO 1 Ordenando los datos del menor al mayor Tiempo 29 31 35 39 39 40 43 44 44 52 Se puede observar que en este conjunto de datos existen 2 modas: 39 y 44 minutos. Curso nivelatorio 31 / 81
  • 30. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados EJEMPLO 2 Sea X la variable aleatoria que representa el número de defectuo- sos en una lı́nea de producción en 14 dı́as. Los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 Defectuosos 2 1 0 3 4 6 6 Dı́a 8 9 10 11 12 13 14 Defectuosos 2 2 3 3 0 3 0 Curso nivelatorio 32 / 81
  • 31. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos no agrupados EJEMPLO 2 Ordenando los datos del menor al mayor Defectuosos 0 0 0 1 2 2 3 Defectuosos 3 3 3 4 6 6 Se puede observar que en este conjunto de datos existe una moda: 3 defectuosos. Curso nivelatorio 33 / 81
  • 32. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media para datos agrupados Variables cuantitativas Una tabla de frecuencias para datos agrupados tiene la siguiente es- tructura: Intervalo Mc Frec. Frec. Frec. Abs. Frec. Rel. Abs. fi Rel. hi ( %) Acum. Fi Acum. Hi ( %) [a, b) a+b 2 f1 h1 F1 H1 [b, c) b+c 2 f2 h2 F2 H2 . . . . . . . . . . . . . . . . . . [g, h] g+h 2 fm hm Fm Hm Curso nivelatorio 34 / 81
  • 33. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media para datos agrupados Sea X una variable aleatoria; Mci las marcas de clase y fi las fre- cuencias absolutas de cada uno de los K agrupamientos o categorı́as convenientemente establecidas para los N valores observados en la población. El promedio poblacional para datos agrupados, denotado µ, se define por medio de la siguiente ecuación: µ = K X i=1 fi Mci N Curso nivelatorio 35 / 81
  • 34. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media para datos agrupados Sea X una variable aleatoria; Mci las marcas de clase y fi las fre- cuencias absolutas de cada uno de los K agrupamientos o categorı́as convenientemente establecidas para los n valores observados en la muestra aleatoria de la población. El promedio muestral para datos agrupados, denotado X̄, se define por medio de la siguiente ecuación: X̄ = K X i=1 fi Mci n Curso nivelatorio 36 / 81
  • 35. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos agrupados Para los datos agrupados la expresión para calcular la mediana po- blacional es la siguiente µ̃ = Li + A N 2 Fi 1 fmed ! Donde, Li = Lı́mite inferior de la clase medial (clase que contiene a la mediana) A = Amplitud del intervalo que contiene a la mediana Fi 1 = Frecuencia absoluta acumulada anterior a la frecuencia absoluta acumulada de la clase medial fmed = Frecuencia absoluta de la la clase medial N = Total poblacional Curso nivelatorio 37 / 81
  • 36. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos agrupados La clase medial o intervalo que contiene a la mediana es aquella clase en donde esté acumulado el 50 % de los datos. La amplitud del intervalo que contiene a la mediana se obtiene al restarle al lı́mite superior del mismo su lı́mite inferior. Curso nivelatorio 38 / 81
  • 37. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Mediana para datos agrupados Para los datos agrupados se tiene una extensión de la definición de valor mediano muestral, veamos la ecuación: X̃ = Li + A ✓ n 2 Fi 1 fmed ◆ Donde Li , A, Fi 1, fmed tienen la misma definición presentada an- teriormente y n es el tamaño de la muestra aleatoria. Curso nivelatorio 39 / 81
  • 38. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Moda para datos agrupados La moda para datos no agrupados, tanto para el caso poblacional como para el caso muestral, está dado por la siguiente expresión: Mo = mo = Li + A ✓ fi fi 1 (fi fi 1) + (fi fi+1) ◆ Donde, Li = Lı́mite inferior de la clase modal A = Amplitud de la clase modal fi = Frecuencia absoluta de la clase modal fi 1 = Frecuencia absoluta anterior a la de la clase modal fi+1 = Frecuencia absoluta siguiente a la de la clase modal La clase modal corresponde a la clase o intervalo de mayor frecuencia absoluta. Curso nivelatorio 40 / 81
  • 39. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media, mediana y moda para datos agrupados EJEMPLO 1 Cálculo de la media, mediana y moda para el ejemplo de las notas obtenidas por 40 estudiantes del curso de Medición I: Clases Mc fi hi ( %) Fi Hi ( %) [1.60 , 2.04) 1.82 2 5 2 5 [2.04 , 2.48) 2.26 1 2.5 3 7.5 [2.48 , 2.92) 2.70 4 10 7 17.5 [2.92 , 3.36) 3.14 12 30 19 47.5 [3.36 , 3.80) 3.58 9 22.5 28 70 [3.80 , 4.24) 4.02 7 17.5 35 87.5 [4.24 , 4.7] 4.46 5 12.5 40 100 Curso nivelatorio 41 / 81
  • 40. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Media, mediana y moda para datos agrupados EJEMPLO 2 Cálculo de la media, mediana y moda para el ejemplo de la variable Ventas medida en cierta empresa: Clases Mc fi hi Fi Hi [0, 500) 250 726 0.425 726 0.425 [500 , 1000) 750 587 0.343 1313 0.768 [1000 , 1500) 1250 292 0.171 1605 0.939 [1500 , 2000) 1750 74 0.043 1679 0.982 [2000 , 2500) 2250 24 0.014 1703 0.996 [2500 , 3000] 2750 7 0.004 1710 1.000 Curso nivelatorio 42 / 81
  • 41. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de posición no central Las medidas de posición no central se diseñaron con el fin de cono- cer otros puntos caracterı́sticos de la distribución de los datos que no son los valores centrales. Entre las medidas de posición no central más importantes están los cuantiles. Curso nivelatorio 43 / 81
  • 42. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de posición no central El término cuantil fue usado por primera vez por Kendall en 1940. El cuantil de orden p de una distribución (con 0 < p < 1) es el valor de la variable X (usualmente denotado Xp) que marca un corte de modo que una proporción p de valores de la población o de la muestra es menor o igual que Xp. Curso nivelatorio 44 / 81
  • 43. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de posición no central Por ejemplo, el cuantil de orden 0.36 es un valor que dejarı́a un 36 % de valores por debajo y un 64 % por encima del valor X0.36. Los cuantiles suelen usarse por grupos que dividen la distribución de los datos en partes iguales; entendidas estas como intervalos que comprenden la misma proporción de valores. Curso nivelatorio 45 / 81
  • 44. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de posición no central Los más usados son: Los Cuartiles, que dividen la distribución de los datos en cuatro partes (corresponden a los cuantiles 0.25, 0.50 y 0.75). Los Quintiles, que dividen la distribución de los datos en cinco partes (corresponden a los cuantiles 0.20, 0.40, 0.60 y 0.80). Los Deciles, que dividen la distribución de los datos en diez partes iguales. Los Percentiles, que dividen la distribución de los datos en cien partes iguales (se denotan como P25, P75, P90, etc.). Curso nivelatorio 46 / 81
  • 45. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Cuartiles Los cuartiles son medidas numéricas las cuales permiten dividir un conjunto de datos en 4 partes iguales. El primer cuartil Q1 separa el 25 % de los datos (abarcando los más pequeños), del 75 % restante (equivale al P25). El segundo cuartil Q2 separa el 50 % de los datos más pequeños del 50 % restante. Este valor corresponde al valor mediano de los datos, es decir, Q2 = e X (equivale al P50). El tercer cuartil Q3 separa el 75 % de los datos más pequeños, del 25 % de valores más grandes (equivale al P75). Curso nivelatorio 47 / 81
  • 46. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles poblacionales Cuartiles poblacionales Considere el censo ordenado del menor al mayor valor de todos los elementos de una población (X(1), X(2), · · · , X(N)) donde N es el número de elementos de la población. Curso nivelatorio 48 / 81
  • 47. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles poblacionales El primer cuartil poblacional está dado por la observación en la po- sición N+1 4 del conjunto de datos ordenado, es decir: Q1 = X(N+1 4 ) El tercer cuartil poblacional está dado por la observación 3(N+1) 4 del conjunto de datos ordenado, es decir: Q3 = X⇣ 3(N+1) 4 ⌘ Curso nivelatorio 49 / 81
  • 48. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales Cuartiles Muestrales Considere una muestra aleatoria ordenada del menor al mayor valor de una población (X(1), X(2), · · · , X(n)) donde n es el número de elementos de la muestra. Curso nivelatorio 50 / 81
  • 49. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales El primer cuartil muestral está dado por la observación en la posición n+1 4 del conjunto de datos ordenado, es decir: Q1 = X(n+1 4 ) El tercer cuartil muestral está dado por la observación 3(n+1) 4 del conjunto de datos ordenado, es decir: Q3 = X⇣ 3(n+1) 4 ⌘ Curso nivelatorio 51 / 81
  • 50. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales Para calcular los cuartiles, se utilizan las siguientes reglas: Regla 1 Si el resultado posicional es un número entero, entonces el cuartil es igual al valor clasificado de esa posición. Ejemplo: Sea n = 11. Q1 = X(n+1 4 ) = X(11+1 4 ) = X(3) Q3 = X⇣ 3(n+1) 4 ⌘ = X⇣ 3(11+1) 4 ⌘ = X(9) Curso nivelatorio 52 / 81
  • 51. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales Regla 2 Si el resultado es una fracción de mitad (2.5, 3.5, 4.5), entonces el cuartil es igual al promedio de los valores clasificados correspon- dientes. Ejemplo: Sea n = 9. Q1 = X(n+1 4 ) = X(9+1 4 ) = X(2.5) = X(2) + X(3) 2 Q3 = X⇣ 3(n+1) 4 ⌘ = X⇣ 3(9+1) 4 ⌘ = X(7.5) = X(7) + X(8) 2 Curso nivelatorio 53 / 81
  • 52. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales Regla 3 Si el resultado obtenido no es un entero, ni una fracción de mitad, se redondea al entero más cercano y se selecciona ese valor clasificado. Ejemplo: Sea n = 10. Q1 = X(n+1 4 ) = X(10+1 4 ) = X(2.75) = X(3) Q3 = X⇣ 3(n+1) 4 ⌘ = X⇣ 3(10+1) 4 ⌘ = X(8.25) = X(8) Curso nivelatorio 54 / 81
  • 53. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales EJEMPLO Sea X la variable aleatoria que representa el tiempo que se demora un estudiante del TdeA en llegar a la universidad. El estudiante registró el tiempo enunciado por diez dı́as (en minutos) y los resultados son los siguientes: Dı́a 1 2 3 4 5 6 7 8 9 10 Tiempo 39 29 43 52 39 44 40 31 44 35 Valores muestrales ordenados: X(1) = 29, X(2) = 31, X(3) = 35, X(4) = 39, X(5) = 39, X(6) = 40, X(7) = 43, X(8) = 44, X(9) = 44, X(10) = 52. Curso nivelatorio 55 / 81
  • 54. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales CONCLUSIÓN - Ejemplo 1 El primer cuartil señala que en el 25 % de las ocasiones el tiem- po que utiliza estudiante del TdeA en llegar a la universidad es inferior a 35 minutos y el 75 % de las veces es mayor a 35 minutos. El tercer cuartil señala que en el 75 % de las ocasiones el tiempo que utiliza estudiante del TdeA en llegar a la universidades inferior a 44 minutos y el 25 % de las veces es mayor a 44 minutos. Curso nivelatorio 56 / 81
  • 55. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales EJEMPLO 2 Sea X la variable aleatoria que representa el costo de un tratamien- to odontológico de los pacientes de una clı́nica privada de la ciudad de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los resultados son los siguientes (en miles de pesos): 105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218, 238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212 Los valores muestrales ordenados son: 96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184, 184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265 Curso nivelatorio 57 / 81
  • 56. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los cuartiles muestrales CONCLUSIÓN - Ejemplo 2 El primer cuartil señala que el 25 % de los pacientes entrevista- dos paga menos de $121000 en su tratamiento odontológico y el 75 % restante paga más de esa cantidad. El tercer cuartil señala que el 75 % de los pacientes entrevista- dos paga menos de $213000 en su tratamiento odontológico y el 25 % restante paga más de esa cantidad. Curso nivelatorio 58 / 81
  • 57. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Percentiles El i-ésimo percentil de una distribución (con 1 % < i < 100 %), es el valor de la variable X (usualmente denotado Pi ) que marca un corte de modo que una proporción i de valores del conjunto de datos es menor o igual que Pi . De la definición previa, se puede concluir que el total de los datos es divido en 100 partes iguales. Curso nivelatorio 59 / 81
  • 58. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Percentiles Veamos algunos ejemplos de la definición presentada: El décimo percentil (P10) separa el 10 % de los datos (abarcan- do los más pequeños) del 90 % de valores más grandes. El percentil 35 (P35) separa el 35 % de los datos más pequeños del 65 % de valores más grandes. El percentil 95 (P95) separa el 95 % de los datos más pequeños del 5 % de valores más grandes. Curso nivelatorio 60 / 81
  • 59. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales Para estimar los percentiles de un conjunto de datos se siguen los siguientes pasos: 1. Identificar la posición donde estarı́a el percentil de interés. El i-ésimo percentil estarı́a en la posición: Posi = i ⇤ n 100 El resultado del cálculo de Posi es un número real con parte entera E y parte decimal D. 2. Emplear alguna de las siguientes reglas para identificar adecua- damente el percentil de interés: Curso nivelatorio 61 / 81
  • 60. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales Regla 1 Si el resultado posicional es un número entero (D = 0), entonces el percentil es igual al siguiente promedio de valores clasificados (ordenados). El i-ésimo percentil se obtiene por medio de la siguiente expresión Pi = X(E) + X(E+1) 2 Regla 2 Si el resultado posicional no es un número entero (D 6= 0). El i-ésimo percentil corresponde al siguiente valor ordenado: Pi = X(E+1) Curso nivelatorio 62 / 81
  • 61. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales EJEMPLO 1 Sea X la variable aleatoria que representa el tiempo en minutos que se demora un estudiante en almorzar. Está variación de tiempos se da de acuerdo a las obligaciones que tiene en cada dı́a. Dı́as Lunes Martes Miércoles Jueves Viernes Sábado Tiempo 27 19 25 27 30 22 Dı́as Lunes Martes Miércoles Jueves Viernes Sábado Tiempo 27 18 23 21 20 24 Se calcularán e interpretarán los percentiles 10 y 60 del conjunto de datos en cuestión. Curso nivelatorio 63 / 81
  • 62. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales CONCLUSIÓN - Ejemplo 1 El décimo percentil señala que en el 10 % de los dı́as el estu- diante se demora menos de 19 minutos en almorzar y el 90 % restante demora más de ese tiempo. El percentil sesenta señala que en el 60 % de los dı́as el estu- diante se demora menos de 25 minutos almorzando y el 40 % restante demora más de este tiempo. Curso nivelatorio 64 / 81
  • 63. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales EJEMPLO 2 Sea X la variable aleatoria que representa el costo de un tratamien- to odontológico de los pacientes de una clı́nica privada de la ciudad de Medellı́n. Se escogió una muestra aleatoria de 25 personas y los resultados son los siguientes (en miles de pesos): 105, 170, 96, 214, 175, 184, 184, 187, 265, 117, 259, 184, 204, 218, 238, 118, 116, 181, 196, 179, 124, 111, 234, 145, 212 Los valores muestrales ordenados son: 96, 105, 111, 116, 117, 118, 124, 145, 170, 175, 179, 181, 184, 184, 184, 187, 196, 204, 212, 214, 218, 234, 238, 259, 265 Se calcularán e interpretarán los percentiles 17 y 71 del conjunto de datos en cuestión. Curso nivelatorio 65 / 81
  • 64. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Estimación de los percentiles muestrales CONCLUSIÓN - Ejemplo 2 El percentil 17 señala que en el 17 % de los pacientes entrevis- tados paga menos de $117000 en su tratamiento odontológico y el 83 % restante paga más de dicha cantidad. El percentil 71 señala que en el 71 % de los pacientes entrevis- tados paga menos de $204000 en su tratamiento odontológico y el 29 % restante paga más de dicha cantidad. Curso nivelatorio 66 / 81
  • 65. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medida de dispersión Ejemplo: considere las notas de una prueba de tres grupos de alumnos: Grupo 1: 3;4;5;6;7. Grupo 2: 1;3;5;7;9. Grupo 2: 5;5;5;5;5. Note que x 1 = x 2 = x 3 = 5. Md1 = Md2 = Md3 = 5. Curso nivelatorio 67 / 81
  • 66. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Distribución de las notas Curso nivelatorio 68 / 81
  • 67. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Medidas de dispersión: Finalidad: encontrar un valor que resuma la variabilidad de un conjunto de datos. Curso nivelatorio 69 / 81
  • 68. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Medidas de dispersión: Finalidad: encontrar un valor que resuma la variabilidad de un conjunto de datos. Curso nivelatorio 69 / 81
  • 69. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Amplitud: la amplitud es definida por A = máx mı́n Por ejemplo, para los datos previamente descritos tenemos que Grupo 1, A = 4. Grupo 2, A = 8. Grupo 3, A = 0. Curso nivelatorio 70 / 81
  • 70. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Amplitud: la amplitud es definida por A = máx mı́n Por ejemplo, para los datos previamente descritos tenemos que Grupo 1, A = 4. Grupo 2, A = 8. Grupo 3, A = 0. Curso nivelatorio 70 / 81
  • 71. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Amplitud: la amplitud es definida por A = máx mı́n Por ejemplo, para los datos previamente descritos tenemos que Grupo 1, A = 4. Grupo 2, A = 8. Grupo 3, A = 0. Curso nivelatorio 70 / 81
  • 72. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Rango intercuartil) El intervalo intercuartil está definido por d = Q3 Q1 . Por ejemplo, considere los siguientes datos 1, 9; 2, 0; 2, 1; 2, 5; 3, 0; 3, 1; 3, 3; 3, 7; 6, 1; 7, 7 . Para ellos previamente probamos que Q1 = 2, 05. Q3 = 4, 9 y el rango intercuartil es d = Q3 Q1 = 4, 9 2, 05 = 2, 85. Curso nivelatorio 71 / 81
  • 73. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Desvio medio) se observan los valores x1, x2, . . . , xn para una variable aleatoria X cuantitativa. El desvio medio (DM) es definido por DM = |x1 x| + |x2 x| + · · · + |xn x| n = n P i=1 |xi x| n . Para el ejemplo de las notas previamente mencionado, tenemos que Curso nivelatorio 72 / 81
  • 74. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Ejemplo Curso nivelatorio 73 / 81
  • 75. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Varianza Muestral) Dadas las observaciones x1, x2, . . . , xn observaciones de una variable aleatoria X cuantitativa entonces la varianza muestral (más utilizada) es definida por s 2 = (x1 x)2 + · · · + (xn x)2 n 1 = n P i=1 (xi x)2 n 1 . Definición (Desviación estándar muestral) La desviación estándar muestral es definida por s = p s 2. Curso nivelatorio 74 / 81
  • 76. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Varianza muestral (versión 2)) La siguiente definición también es utilizada para la varianza muestral b 2 = (x1 x)2 + · · · + (xn x)2 n = n P i=1 (xi x)2 n En este caso, la desviación estándar muestral queda dada por b = p b 2. Curso nivelatorio 75 / 81
  • 77. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Ejemplo Para el ejemplo de las notas para los tres grupos diferentes tenemos que: Curso nivelatorio 76 / 81
  • 78. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Ejemplo Para el ejemplo de las notas para los tres grupos diferentes tenemos que: Curso nivelatorio 76 / 81
  • 79. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Fórmula alternativa para s 2) Una fórmula alternativa para el cálculo de la varianza es dada por s 2 = n P i=1 x 2 i n ⇥ x 2 n 1 Por ejemplo, para el ejemplo de las notas y en el grupo 1 tenemos que n X i=1 x2 i = 32 + 42 + 52 + 62 + 72 = 135. Además de eso, tenemos que x = 5. Por lo tanto, s2 = 135 5 ⇥ (5)2 4 = 10 4 = 2, 5. Curso nivelatorio 77 / 81
  • 80. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Ejemplo Ejemplo: suponga que n = 9 economistas Colombianos, se- leccionados aleatoriamente, fueron consultados al respecto del crecimiento en ( %) previsto para el PIB colombiano en 2021. Los datos colectados fueron los siguientes Datos: 2,50;2,60;2,66;2,70;2,78;2,80;2,84;2,90;3,00. Con base en esa muestra, responda lo siguiente Cuál es la desviación estándar? Cuál es el rango intercuartil? Curso nivelatorio 78 / 81
  • 81. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Medidas de dispersión Definición (Coeficiente de variación) El coeficiente de variación es una medida de dispersión relativa que elimina el efecto de la magnitud de los datos y expresa la variabili- dad en relación a la media. El coeficiente de variación muestral es definido por CV = s x ⇥ 100 % Curso nivelatorio 79 / 81
  • 82. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Ejemplo Ejemplo: la siguiente tabla presenta la media, la desviación estándar y el coeficiente de variación de las alturas en centı́me- tros de una muestra de recien nacidos y de una muestra de adolescentes. Grupo Media D. E. CV Recien nacidos 50 6 12 % Adolescentes 160 16 10 % Conclusión: En relación a las medias, las alturas de los ado- lescentes y de los recien nacidos presentan variabilidades muy parecidas. Curso nivelatorio 80 / 81
  • 83. Medidas numéricas descriptivas Medidas de tendencia central Medidas de posición no central Medidas de dispersión Varianza aproximada para datos agrupados En el caso de datos agrupados podemos obtener una varianza aproximada (ponderada) s⇤2 = f1 (Mc1 x̄⇤)2 + · · · + fK (McK x̄⇤)2 n s⇤2 = h1 (Mc1 x̄⇤ )2 + · · · + hK (McK x̄⇤ )2 s⇤2 = K X i=1 hi (Mci x̄⇤ )2 Desviación estándar aproximada s⇤ = p s⇤2. Curso nivelatorio 81 / 81