1) Este documento describe diferentes medidas de tendencia central y posición que se pueden aplicar a conjuntos de datos, incluyendo la media, mediana, moda, cuartiles, quintiles, deciles y percentiles.
2) Estas medidas resumen los datos dividiendo el rango de valores en partes iguales o identificando puntos de equilibrio.
3) Se explican fórmulas y ejemplos para calcular cada medida cuando los datos están agrupados en tablas de frecuencias.
2. Medidas de Posición: son aquellos valores numéricos que nos permiten
o bien dar alguna medida de tendencia central, dividiendo el
recorrido de la variable en dos, o bien fragmentar la cantidad de
datos en partes iguales. Las más usuales son la media, la mediana, la
moda, los cuartiles, quintiles, deciles y percentiles.
.
Medidas de tendencia central
3. medias de los diferentes conjuntos. 3) Es posible hallar la media
de La idea de media o promedio (también llamada media
aritmética) formaliza el concepto intuitivo de punto de equilibrio
de las observaciones. Es decir, es el punto medio del recorrido de
la variable según la cantidad de valores obtenidos.
Ese valor tiene varias propiedades importantes. 1) Si se suma la
distancia de todos los valores respecto de la media, esa suma da
cero. 2) Si se toman una cantidad cualesquiera de conjuntos de
valores, cada uno con su respectiva media, la media del conjunto
general es igual a la suma de cada una de las un conjunto de
valores de una variable a partir de tomar la distancia de las
observaciones a un valor cualquiera (pertenezca o no al recorrido
de la variable) 4) si a un conjunto de observaciones de una
variable se le realiza una operación matemática usando un valor
constante, entonces la media del nuevo grupo de valores así
obtenidos es igual a la aplicación de la misma operación
matemática usando ese valor constante sobre la media original.
La Media
4. El cálculo de la Media
Dado un conjunto de observaciones
la media se representa mediante y se obtiene dividiendo la suma de todos los
datos por el número de ellos, es decir:
La interpretación de la media como centro (o punto de equilibrio) de los datos se
apoya en una propiedad que afirma que la suma de las desviaciones
de un conjunto de observaciones a su media es igual a cero; es decir, puede
probarse que
5. La media aritmética de un conjunto de datos es el cociente entre la suma
de todos los datos y el número de estos.
Ejemplo: las notas de Juan en escala universitaria
el año pasado fueron:
50, 60, 40, 70, 80, 40,
60
La nota media de Juan es:
Nota media = 57
7
400
7
60
40
80
70
40
60
50
que suman 400
Hay 7 datos
Media aritmética (I)
6. PROPIEDADES DE LA MEDIA
• Si a cada uno de los datos se aumenta o disminuye en una
constante K, la media aumenta o disminuye en K unidades.
• Si a cada uno de los datos se multiplica o se divide por una
constante K, la media se multiplica o divide por k unidades.
7. Cálculo de la media aritmética cuando los datos se repiten.
Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia
absoluta
Notas x
F. absoluta
3 5 15
5 8 40
6 10 60
7 2 14
Total 25 129
1
,
5
25
129
Media
Datos por frecuencias
Total de datos
1º. Se multiplican los datos por sus frecuencias absolutas respectivas, y
se suman.
2º. El resultado se divide por el total de datos.
Media aritmética (II)
8. Mediana
La mediana, es el dato que divide a los datos en dos partes iguales.
Debemos considerar cuando los datos son pares o impares.
en caso que N sea impar
En caso en que N es par,
promediamos el dato
obtenido y el siguiente.
9. La mediana de un conjunto de datos es un valor del mismo tal que el número de
datos menores que él es igual al número de datos mayores que él.
Los pesos, en kilogramos, de 7 jugadores de un
equipo de fútbol son:
Ejemplo:
72, 65, 71, 56, 59, 63, 72
1º. Ordenamos los datos: 56, 59, 63, 65, 71, 72, 72
2º. El dato que queda en el centro es
65.
La mediana vale 65.
Si el número de datos fuese par, la mediana es la
media aritmética de los dos valores centrales.
Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es:
64
2
65
63
Caso:
La mediana
10. Moda
La moda, es aquel dato, aquel valor de la
variable que más se repite; es decir, aquel
valor de la variable (que puede no ser un
único valor) con una frecuencia mayor.
11. La moda de un conjunto de datos es el dato que más se repite.
Una zapatería ha vendido en una semana los zapatos
que se reflejan en la tabla:
Ejemplo.
La moda es 41.
Nº de calzado 38 39 40 41 42 43 44 45
Nº de personas 16 21 30 35 29 18 10 7
El número de zapato más
vendido, el dato con mayor
frecuencia absoluta, es el 41.
Lo compran 35 personas
La moda
12. MEDIDAS DE POSICION
Cuartil, Quintiles, Deciles, Percentiles
Los cuartiles, deciles, percentiles son los números que
dividen un numero de datos en partes iguales.
Por esta razón los cuartiles (Q) dividen los datos en 4
partes iguales, los quintiles (quintil) dividen los datos en
5 partes iguales, los deciles (D) lo dividen en 10 partes
iguales y los percentiles (P) en 100.
En datos no agrupados para calcular cada uno de ellos
utilizados las siguientes expresiones.
𝑄𝑘 = 𝑛
𝑘
4
𝑞𝑢𝑖𝑛𝑡𝑖𝑙 = 𝑛
𝑘
5
𝐷𝑘 = 𝑛
𝑘
10
𝑃𝑘 = 𝑛
𝑘
100
14. 1. Diferenciar los diversos tipos de medidas de
resumen que se pueden aplicar a un conjunto de
datos agrupados.
2. Calcular e interpretar las principales medidas de
tendencia central para datos agrupados.
Al finalizar la Tema, el alumno será capaz de:
OBJETIVOS
16. LA MEDIA ARITMÉTICA
Cálculo a partir de datos agrupados.
El cálculo de la media aritmética, cuando los
datos disponibles se encuentran en tablas de
distribución de frecuencias, se realiza utilizando
la formula siguiente
donde: :media
:frecuencia absoluta de la clase i
:marca de la clase i
n
f
n
f
i
i
i
i
i
x
1
1
X
x
i
f
i
X
17. Ejemplo:
La distribución de frecuencias siguiente, representa los
puntajes obtenidos en una evaluación del desempeño,
aplicado al personal técnico de un Centro de Salud. El
puntaje máximo en la prueba es 50. Calcule e interprete en
media.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
18. Primero se calcularán las marcas de clase ( );
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase ( ) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)
4 + 8 + 15 + 23 + 10
i
X
i
x
x
x
x
clase
1575
60
26.25
19. Interpretación: Si se elige al azar a un trabajador técnico
de este hospital, se espera que tenga un puntaje de 26,25
en su evaluación de desempeño.
20. Para realizar cálculos de Mediana, Moda, se deben
considerar limites reales de los intervalos. Estos limites
están dados por el promedio entre el limite aparente
superior de un intervalo y el limite aparente inferior del
intervalo superior.
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
En este caso el limite real superior del
primer intervalo seria el promedio entre
16 y 17, lo que nos da un valor de 16,5.
El limite inferior se considera 11,5 ya que
en este intervalo van valores que
pueden partir desde 11,5 hasta el 16,5.
El limite real superior del segundo
intervalo es el promedio entre 21 y 22 ,
lo que da el valor de 21,5.
21. d) Cálculo de la Mediana a partir de datos agrupados.
donde:
:
mediana
: limite real (o frontera) inferior de la clase
mediana.(Intervalo donde la frecuencia
acumulada es mayor o igual que n/2)
: número total de datos.
: Frecuencia acumulada anterior al intervalo de la
mediana.
: frecuencia absoluta de la clase mediana
: amplitud de clase
c
Md
f
F
n
Md i
2
L
Md
i
L
n
F
Md
f
c
22. Ejemplo: La tabla siguiente muestra la experiencia
laboral (años) del personal de seguridad que labora en un
gran hospital. Calcule e interprete la mediana.
Experiencia Número de
laboral trabajadores
(años) de seguridad
0 - 3 4
4 - 7 12
Clase
Mediana
8 - 11 24
12 - 15 16
16 - 19 10
20 - 23 3
69
Lugar de la mediana:
4
24
)
16
(
2
69
5
,
7
d
M
4
24
16
5
,
34
5
,
7
Mediana = 10,5 años
5
,
34
2
69
2
n
23. Interpretación:
La mitad del personal de seguridad que
labora en este hospital tienen una experiencia
laboral igual o menor a 10 años 6 meses. La
otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y
6 meses.
24. Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la
mediana como en el caso de la media
aritmética.
Es fácil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero
la serie de datos.
25. LA MODA
Cálculo a partir de datos agrupados
donde:
: moda
: limite real (o frontera) inferior de la clase
modal (Intervalo que posee la mayor
frecuencia)
: frecuencia de la clase modal menos la
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
frecuencia de la clase siguiente
: amplitud de clase
c
i
2
1
1
L
o
M
o
M
i
L
1
2
c
26. Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
Ejemplo: La tabla siguiente muestra los errores de
facturación durante un mes, en una Clínica. Calcule e
interprete la moda.
Interpretación: Durante un mes, el número más frecuente
de errores de facturación en esta clínica es 6.
Errores de
facturación Días
0 - 3 6
4 - 7 12
Clase
Modal
8 - 11 8
12 - 15 3
16 - 19 1
Total 30
Clase moda : (4 - 7)
Mo = 5,9
6
1
4
2
4
4
6
6
5
.
3
Mo
27. Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o más
clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución amodal).
En otros casos la distribución tiene varias modas, lo
que dificulta su interpretación.
28. Medidas de Posición. Cuartiles, quintiles,
deciles, percentiles.
Recordemos que estas medidas de posición separan los datos en partes iguales,
Cuartil es la división de los en 4 partes iguales (1 cuartil es percentil 25%)
Quintil es la división de los datos en 5 partes iguales.(primer quintil es el percentil
20% y así sucesivamente)
Decil es la división de los datos en 10 partes iguales.
Percentil es la división de los datos en 100 partes iguales.
Para calcular las distintas medidas de posición se utiliza la expresión
𝑃𝑘 = 𝑎 + (𝑏 − 𝑎)(
𝑛∗
𝑘
100
−𝐹𝑎)
𝑓
)
[a,b[ : intervalo que tiene la frecuencia acumulada F, de al menos 𝑛
𝑘
100
datos.
𝐹𝑎 = 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎
𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 [𝑎, 𝑏]
𝑓𝑖 = 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙.
30. a) Determine media, mediana y moda de los datos del puntaje
de PSU obtenidos en una generación de un Colegio.
b) Determina el cuartil 3 de los datos e interprétalo.
c) Determina el decil 9 de los datos e interpreta su valor.
d) Determina el cuartil 2
31. Intervalo frecuencia
1,65-----1,69 6
1,70-----1,74 12
1,75-----1,79 33
1,80------1,84 22
1,85------1,89 8
1,90------1,94 2
a) Determine media, mediana y moda de los datos del puntaje de
PSU obtenidos en una generación de un Colegio.
b) Determina el cuartil 2 de los datos e interprétalo.
c) Determina el decil 8 de los datos e interpreta su valor.
32. Cantidad de abdominales Cantidad de estudiantes
[20, 28[ 3
[28, 36[ 9
[36, 44[ 15
[44, 52[ 18
[52, 60[ 8
[60, 68[ 5
a) ¿Cuantos abdominales como máximo logro hacer el 25% del total de los
estudiantes con rendimiento mas bajo?
b) ¿Cuantos abdominales como mínimo realizaron el 50% de los estudiantes
con mejor rendimiento?
c) ¿Cuantos abdominales como mínimo hicieron los estudiantes que se
encuentran en el 10% con mejor rendimiento?
33. Masa corporal f F
[50-60[ 18 18
[60,70[ 32 50
[70, 80[ 45 95
[80, 90[ 17 112
[90, 100[ 8 120
a) Calcular 𝑄3, 𝐷4 , 𝑃90.