Este documento presenta diferentes medidas numéricas para resumir conjuntos de datos, incluyendo medidas de ubicación como la media, mediana y moda, y medidas de dispersión como el rango, varianza y desviación estándar. Explica cómo calcular estas medidas tanto para datos puntuales como agrupados, y provee ejemplos numéricos para ilustrar los cálculos.
MAYO 1 PROYECTO día de la madre el amor más grande
MEDIDAS NUMÉRICAS
1. CAP 3.- MEDIDAS NUMÉRICAS
SI AGRUPADAS
•Medidas centrales: Media aritmética,
mediana, moda ,cuartil, decil, percentil.
•Medidas de dispersión: Rango, varianza y
desviación estándar.
• Coeficientes de Asimetría, de
Apuntamiento (Curtosis), de Variación
2. MEDIDAS DE UBICACIÓN
Se mostrará como calcular la media, mediana y moda a partir de
datos organizados en una distribución de frecuencias, sean
puntuales o en intervalos.
Media Aritmética de datos agrupados puntuales: Las
observaciones en cada clase se representan a través de su
frecuencia. Se calcula así:
X es la media muestral
x es la observación de cada clase muestral
f es la frecuencia de cada clase
n es el total de frecuencias de muestra
µ es la media poblacional
X es la observación de cada clase poblacional
N es total de frecuencias de población
n
x
f
x
*
N
X
f
*
3. MEDIDAS DE UBICACIÓN
Mediana de datos agrupados puntuales: Se ordenan los datos.
Si la cantidad de observaciones es impar, la ubicación del valor
de la mediana se calcula así:
n es el número de datos
Si la cantidad de observaciones es par, el valor de la mediana se
calcula promediando los dos valores intermedios, donde la
ubicación del 1er valor intermedio se obtiene así:
Moda de datos agrupados puntuales: Es el valor o valores con
la mayor frecuencia.
2
1
n
2
n
4. MEDIDAS DE UBICACIÓN
Ej: Tenemos el resumen de las notas conseguidas por un grupo
de diez estudiantes, en una lección sobre 3 puntos en la materia
Administración de Empresas.
Media aritmética
Mediana
n=10 10/2=5 5to y 6to
valores
(1.8+2.4)/2=2.1=Mediana
Moda= 2.4 dato que más
se repite
Se concluye que la nota media de ese grupo de estudiantes es
92
,
1
10
2
,
19
*
n
x
f
x
nota frec frec*nota
0.4 1 0.4
1.0 2 2.0
1.8 2 3.6
2.4 3 7.2
3.0 2 6.0
Total 10 19.2
5. MEDIDAS DE UBICACIÓN
Media Aritmética de datos agrupados en intervalos: Hay que
suponer que las observaciones en cada clase se representan a
través del punto medio de la clase, donde la media de datos
agrupados es una estimación de los valores reales respectivos.
Se calcula así:
X es la media muestral
M es el punto medio de cada clase
f es la frecuencia de cada clase
Σf*M es la suma de estos productos
n es el total de frecuencias de muestra
µ es la media poblacional
N es total de frecuencias de población
n
M
f
x
*
N
M
f
*
6. MEDIDAS DE UBICACIÓN
Ej: Determine el precio de venta medio aritmético de los 80 vehículos vendidos el
mes anterior en la empresa ABC, en base a estos datos:
Se concluye que el precio de venta medio de los vehículos es de aproximadamente
$23100.
1
,
23
$
80
1845
*
n
M
f
x
Precio de
venta (miles
dólares)
Frecuenci
a (f)
Punto
medio (M)
f*M
15 a 18 8 $16,5 $ 132,0
18 a 21 23 19,5 448,5
21 a 24 17 22,5 382,5
24 a 27 18 25,5 459,0
27 a 30 8 28,5 228,0
30 a 33 4 31,5 126,0
33 a 36 2 34,5 69,0
Total 80 $1845,0
7. MEDIDAS DE UBICACIÓN
Mediana de datos agrupados en intervalos: Es el punto
medio de intervalos de valores ordenados de menor a mayor.
Propiedades de la mediana:
1. No influyen en ella valores extremadamente grandes o
pequeños.
2. Es calculable para datos de nivel ordinal o más alto.
Li : Lim inferior de la clase de la mediana
A : ancho del intervalo
n/2 : total de datos dividido para dos
Fi-1 : Frecuencia acumulada de clase anterior a la de la
mediana
)
2
(
*
1
i
i
f
F
n
A
Li
Me
8. MEDIDAS DE UBICACIÓN
Moda de datos agrupados en intervalos: Es el valor de
observación que aparece con mayor frecuencia, es de
especial utilidad para resumir datos de nivel nominal.
Es posible determinar la moda para todos los niveles de
datos (nominal, ordinal, de intervalo y de razón).
Li : Lim inferior de la clase donde más se repiten datos
A : ancho del intervalo
fi : frecuencia de la clase donde más se repiten los datos
fi-1 : frecuencia de clase anterior donde más se repiten datos
fi+1: frecuencia de clase posterior donde más se repiten
datos
)
(
*
1
1
1
i
i
i
i
i
i
f
f
f
f
f
f
A
Li
Mo
9. LA MEDIANA Y LA MODA DE DATOS AGRUPADOS
Ej: Determine la mediana y la moda del precio de venta de los 80 vehículos
vendidos el mes anterior en la empresa ABC, en base a estos datos:
Clase de Mediana es n/2=80/2=40 (busco la frecuencia acumulada ≥ a 40)
Clase de Moda es aquella que contiene la mayor frecuencia.
Precio de
venta (miles
dólares)
Frecuenci
a (f)
Frecuencia
Acumulada
(F)
15 a 18 8 8
18 a 21 23 31
21 a 24 17 48
24 a 27 18 66
27 a 30 8 74
30 a 33 4 78
33 a 36 2 80
Total 80
)
2
(
*
1
i
i
f
F
n
A
Li
Me
588
.
22
)
17
31
2
80
(
*
3
21
Me
)
(
*
1
1
1
i
i
i
i
i
i
f
f
f
f
f
f
A
Li
Mo
143
.
20
)
17
23
8
23
8
23
(
*
3
18
Mo
10. OTRAS MEDIDAS DE UBICACIÓN
Cuartiles, deciles y percentiles de datos agrupados
puntualmente.
Cuartiles: Dividen a un conjunto de observaciones en 4 partes iguales
(Q1, Q2, Q3 y Q4).
La mediana Q2 es el valor intermedio de un conjunto de datos
ordenados de menor a mayor.
El 1er cuartil Q1 es el valor debajo del cual se presenta 25% de las
observaciones o, la mediana de la parte inferior de los datos.
El 3er cuartil Q3 es el valor debajo del cual se presenta 75% de las
observaciones o, la mediana de la parte superior de los datos
Deciles: Dividen a un conjunto de observaciones en 10 partes iguales.
Percentiles: Dividen a un conjunto de observaciones en 100 partes
iguales.
Ej: Hemos preguntado la edad a los estudiantes de una
institución educativa, obteniendo los siguientes datos.
Determine el cuartil, el decil y el percentil.
12. MEDIDAS DE UBICACIÓN
Cuartiles, deciles y percentiles de datos agrupados en
intervalos.
2do Cuartil
Ubic = 0,50*60=30 k/4*n
Q2= 45+5*(30- 22)/(45-
22)=46,74
7mo Decil
Ubic = 0,70*60=42 k/10*n
D7= 45+5*(42-22)/(45-
22)=49,35
95vo Percentil
Ubic =0,95*60=57 k/100*n
edad frec frec acum
30 - 34 3 3
35 - 39 7 10
40 - 44 12 22
45 - 49 23 45
50 - 54 14 59
55 - 59 1 60
Total 60
)
4
*
(
*
1
1
i
i
i
k
f
f
f
n
k
A
Li
C
)
10
*
(
*
1
1
i
i
i
k
f
f
f
n
k
A
Li
D
)
100
*
(
*
1
1
i
i
i
k
f
f
f
n
k
A
Li
P
ES FRECUENCIA A
13. MEDIDAS DE UBICACIÓN
Rango de datos agrupados puntuales: Representa la
diferencia entre los valores máximo y mínimo de un
conjunto de datos. El rango no toma en cuenta todos los
valores, sólo el máximo y el mínimo.
Rango=19-13=6
edad frec
13 3
14 14
15 23
16 10
17 5
18 4
19 1
Total 60
o
ValorMínim
o
ValorMáxim
Rango
14. MEDIDAS DE UBICACIÓN
Rango de datos agrupados en intervalos.
Rango=59-30=29
edad frec frec acum
30 - 34 3 3
35 - 39 7 10
40 - 44 12 22
45 - 49 23 45
50 - 54 14 59
55 - 59 1 60
Total 60
imerInterv
LimInf
moInterv
LimSupUlti
Rango Pr
15. MEDIDAS DE DISPERSIÓN
Varianza, Desviación estándar y Coeficiente de variación de
datos agrupados puntualmente. Ej: En base al número de
ausencias injustificadas de estudiantes en la materia Estadística
el semestre anterior, calcule la varianza, desviación estándar y
coeficiente de variación de la población.
49
.
1
40
78
.
59
)
( 2
2
N
X
f
Ause
X
Estud
f
f * X X ─ μ (X ─ μ)2
f(X ─
μ)2
0 9 0 ─ 1.43 2.03 18.28
1 16 16 ─ 0.43 0.18 2.89
2 8 16 + 0.58 0.33 2.65
3 4 12 + 1.58 2.48 9.92
4 2 8 + 2.58 6.63 13.26
5 1 5 + 3.58 12.78 12.78
40 57 59.78
43
.
1
40
57
N
fX
22
.
1
49
.
1
)
( 2
N
X
f
85
.
0
43
.
1
22
.
1
Cv
16. MEDIDAS DE DISPERSIÓN
Datos agrupados en intervalos. Población en ventas del 2020
0625
.
23
80
1845
N
fM
Precio Vta
(miles $)
Fre
c (f)
Pto medio
(M miles
$)
f*M
(M─µ)
(miles $)
(M─µ)2
(miles $)
f(M─µ)2
(miles $)
15 a 17.999 8 16.50 132.0 (16.5–23.06) 43.07 344.53
18 a 20.999 23 19.50 448.5 (19.5–23.06) 12.69 291.90
21 a 23.999 17 22.50 382.5 (22.5–23.06) 0.32 5.38
24 a 26.999 18 25.50 459.0 (25.5–23.06) 5.94 106.95
27 a 29.999 8 28.50 228.0 (28.5–23.06) 29.57 236.53
30 a 32.999 4 31.50 126.0 (31.5–23.06) 71.19 284.77
33 a 35.999 2 34.50 69.0 (34.5–23.06) 130.82 261.63
Total 80 1845.0 1531.69
38
.
4
80
59
.
1531
)
( 2
N
M
f
19
.
0
06
.
23
38
.
4
Cv
15
.
19
80
69
.
1531
)
( 2
2
N
X
f
17. MEDIDAS DE DISPERSIÓN
Varianza, Desviación estándar y Coeficiente de variación de
datos agrupados puntualmente de una muestra. Ej: En base
al número de ausencias injustificadas de diez estudiantes en la
materia Estadística el semestre anterior, calcule la varianza,
desviación estándar y coeficiente de variación de la muestra.
44
.
2
9
22
1
)
( 2
2
n
x
X
f
S
Ause
X
Estud
f
f * X X ─ ̅x (X ─ ̅x)2
f(X
─ ̅x)2
0 1 0 ─ 2 4 4
1 4 4 ─ 1 1 4
2 2 4 0 0 0
3 1 3 + 1 1 1
4 1 4 + 2 4 4
5 1 5 + 3 9 9
10 20 22
00
.
2
10
20
n
fX
x
56
.
1
44
.
2
1
)
( 2
n
x
X
f
S
78
.
0
00
.
2
56
.
1
x
S
Cv
18. MEDIDAS DE DISPERSIÓN
Datos agrupados en intervalos de una muestra. Ventas
Mayo/2020
96
.
22
13
5
.
298
n
fM
x
Precio Vta
(miles $)
Fre
c (f)
Pto medio
(M miles
$)
f*M
(M─̅x)
(miles $)
(M─̅x)2
(miles $)
f(M─̅x)2
(miles $)
15 a 17.999 3 16.50 49.5 (16.5–22.96) 41.75 125.25
18 a 20.999 3 19.50 58.5 (19.5–22.96) 11.98 35.95
21 a 23.999 2 22.50 45.0 (22.5–22.96) 0.21 0.43
24 a 26.999 2 25.50 51.0 (25.5–22.96) 6.44 12.89
27 a 29.999 1 28.50 28.5 (28.5–22.96) 30.67 30.67
30 a 32.999 1 31.50 31.5 (31.5–22.96) 72.91 72.91
33 a 35.999 1 34.50 34.5 (34.5–22.96) 133.14 133.14
Total 13 298.5 411.23
85
.
5
12
23
.
411
1
)
( 2
n
x
M
f
S 25
.
0
96
.
22
85
.
5
x
S
Cv
27
.
34
12
23
.
411
1
)
( 2
2
n
x
M
f
S
19. MEDIDAS DE FORMA
Coeficiente de Asimetría POBLACIONAL de datos
agrupados o de Sesgo calculado con Software: Permite
medir si la cola de la distribución está ladeada más hacia la
izquierda o hacia la derecha. Caso contrario la curva es
simétrica.
f es la frecuencia de cada intervalo
M es el punto medio de cada intervalo
µ es la media aritmética poblacional
Ơ es la desviación estándar de la población
N es el número de elementos de la población
Distribución simétrica : Si coeficiente de asimetría (CAs) es
cero
Distribución asimétrica a la izquierda: Si (CAs) es menor a
cero.
3
3
*
)
(
*
N
M
f
CAs
20. MEDIDAS DE FORMA
Coeficiente de Asimetría MUESTRAL de datos agrupados o
de Sesgo calculado con Software: En Excel se calcula el
valor del coeficiente de sesgo basado en las desviaciones de la
media elevadas al cubo, conocido como estandarización.
X es la media aritmética de la muestra
f es la frecuencia de cada intervalo
M es el punto medio de cada intervalo
S es la desviación estándar de la muestra
n es el número de elementos de la muestra
Distribución simétrica : Si coeficiente de asimetría (CAs) es
cero
Distribución asimétrica a la izquierda: Si (CAs) es menor a
cero.
Distribución asimétrica a la derecha: Si (CAs) es mayor a
3
3
*
)
(
*
S
n
x
M
f
CAs
21. MEDIDAS DE FORMA
Coeficiente de Apuntamiento poblacional de datos
agrupados: Determina el grado de concentración que
presentan los valores de una variable alrededor de la zona
central de distribución de frecuencias.
µ es la media aritmética poblacional
f es la frecuencia de cada intervalo
M es el punto medio de cada intervalo
ơ es la desviación estándar de la población
N es el número de elementos de la población
Si el coeficiente de apuntamiento es = 0 es curva mesocúrtica.
Si el coeficiente de apuntamiento es > 0 es curva leptocúrtica o
empinada (datos concentrados cerca de la media).
Si el coeficiente es < 0 es curva platicúrtica o achatada (datos
dispersos).
3
*
)
(
*
4
4
N
M
f
CAp
22. MEDIDAS DE FORMA
Coeficiente de Apuntamiento MUESTRAL de datos
agrupados: En Excel se calcula el valor del coeficiente de
apuntamiento basado en las desviaciones de la media elevadas
a la cuarta.
X es la media aritmética
f es la frecuencia de cada intervalo
M es el punto medio de cada intervalo
S es la desviación estándar de la muestra
n es el número de elementos de la muestra
Si el coeficiente de apuntamiento es = 0 es curva mesocúrtica.
Si el coeficiente de apuntamiento es > 0 es curva leptocúrtica
(datos concentrados cerca de la media).
Si el coeficiente es < 0 es curva platicúrtica (datos
concentrados por las colas)
3
*
)
(
*
4
4
S
n
x
M
f
CAp
23. OTRAS MEDIDAS DE DISPERSIÓN
Coeficiente de Asimetría o de Sesgo de Pearson para datos
agrupados: Fórmula sencilla para calcular el sesgo, ideada por Karl
Pearson, se basa en la media aritmética, la mediana y la desviación
estándar de datos agrupados. ( - 3 a + 3)
< 0 indica un sesgo negativo
= 0 no hay sesgo
> 0 indica un sesgo positivo
Poblacional.
µ es la media aritmética poblacional
Me es la mediana de la población
Ơ es la desviación estándar de la población
Muestral
X es la media aritmética muestral
Me es la mediana de la muestra
S es la desviación estándar de la muestra
)
(
3 Me
sk
S
Me
x
sk
)
(
3