Medidas de tendencia central: media, moda y mediana
1. Tema 3:
MEDIDAS DE TENDENCIA
CENTRAL
Enzo Aldo Bravo Burgos
ESTADISTICA BASICA
2. INTRODUCCIÓN
Los salarios de las superestrellas de los deportes
profesionales reciben mucha atención de los
medios de comunicación. Cada año que pasa un
contrato millonario se está convirtiendo en un
hecho común y corriente para este grupo de
élite. Aun así, son pocos los años que una de las
asociaciones deportivas no negocien con los
dueños de equipos nuevas condiciones salariales
y beneficios marginales para todos los jugadores
de un deporte en particular.
3. Según los dueños de equipos de básquet, el salario
promedio de un jugador es de
$ 275 000. Los representantes de los jugadores
alegan que el salario promedio está cerca de $310
000. Ambos grupos cuentan con los mismos datos.
¿Cómo pueden llegar a conclusiones tan dispares?
¿Quién dice la verdad?
Una manera de representar características de un
conjunto de datos en estadística es a través de tres
medidas numéricas: media, moda y mediana. Cada
una de ellas representa un tipo de promedio, el cual
indica la tendencia central del conjunto de datos. En
esta parte del curso veremos como calcularlos y que
información nos brindan.
4. MEDIA
La media es el promedio aritmético de
los valores de la variable. Obviamente,
al ser promedio, tiene sentido en
variables de tipo cuantitativo
5. Para datos no agrupados
En ocasiones puede conducirnos a
interpretaciones incorrectas. Simbólicamente la
media en el caso de una muestra se representa
por , y en el caso de población por .
Se calcula sumando todos los datos y
dividiendo dicha suma por el número de datos.
x
6. n
x.......xx
media n21
Sea x1, x2, .... ,xn los valores que toma una variable
cuantitativa X, entonces la media aritmética se
determina mediante:
7. Ejemplo: Si las notas en el curso de introducción a la
computación de 10 alumnos son : 14, 18, 12, 16, 14, 15, 16, 18, 10,
10, 12
Respuesta: La nota promedio es 14,5
10
12101816151416121814
x
5,14x
8. Media aritmética para datos
tabulados de variables discretas
Si los n valores de una variable estadística discreta X
se clasifican en k valores distintos x1, x2, x3, .........., xk
con frecuencias absolutas respectivas f1, f2, f3, ......, fk,
entonces su media aritmética es el número:
n
fx
fff
fxfxfx
x ii
k
kk
..........
.........
21
2211
9. Ejemplo: En un estudio de Años de escolarización de estudiantes de Derecho se obtuvo
la siguiente tabla de distribución:
Años Frecuencia
16 5
17 10
18 6
19 4
20 2
Total 27
Determina los años de escolarización promedio.
Solución:
246105
2)20(4)19(6)18(10)17(5)16(_
x
= 18,23 años
_
x
10. Media aritmética para datos tabulados
de variables continuas
Si los n valores de una variable estadística continua X
se clasifican en k intervalos con marcas de clases x1,
x2, x3, .........., xk con frecuencias absolutas respectivas
f1, f2, f3, ......, fk, entonces su media aritmética es el
número:
n
fx
fff
fxfxfx
x ii
k
kk
..........
.........
21
2211
11. Ejemplo: La siguiente tabla muestra la inversión anual de 40 empresas.
Intervalo
Marca de
clase
xi
Frecuencias
simples
Frecuencias
acumuladas
fi hi Fi Hi
4, 10
10, 16
16, 22
22, 28
28, 34
34, 40
40, 46
7
13
19
25
31
37
43
1
3
6
12
11
5
2
0,025
0,075
0,150
0,300
0,275
0,125
0,050
1
4
10
22
33
38
40
0.025
0.100
0.250
0.550
0.825
0.950
1.000
40 1,000
Título: “Inversión anual de empresas”
Unidades: miles de dólares.
12. Solución
La media aritmética es:
251112631
)2(43)5(37)11(31)12(25)6(19)3(13)1(7
x
8,26x
40
1072
x
La inversión promedio es de 26 800 dólares
13. Media aritmética ponderada
La media aritmética de los valores x1, x2, x3, .........., xk
ponderada por los pesos
w1, w2, w3, ........ wk es el número.
k21
kk2211
w..........ww
xw.........xwxw
x
14. Ejemplo: Si un alumno el semestre pasado obtuvo 11
en Física 2 y su peso es cinco, 13 en el curso Lengua
de peso cuatro y 16 en cálculo 2 de peso 3, ¿ cuál
su promedio ?
92,12x
345
)3(16)4(13)5(11
x
15. MODA
La moda es el dato que más se repite (el de más alta
frecuencia). Por ejemplo: ¿cuántas veces se repite la letra
“e” en la palabra “representatividad”? se repite 3 veces y te
fijarás que es la que más se repite, por lo tanto se dice
que la letra “e” es la moda de este conjunto de letras.
Podremos determinar la moda en muestras de variables
tanto cualitativas como cuantativas (datos agrupados o
no).
La moda es muy fácil de calcularla y útil, pro tiene sus
limitaciones, a veces no encontraremos moda (cuando
todos o más de dos tienen la misma frecuencia) o
muestras bimodales (con dos modas). Por lo tanto
veremos otras opciones.
16. Para datos no agrupados
La moda se define como el valor o clase que tiene
la mayor frecuencia, en un conjunto de
observaciones.
Cuando los datos obtenidos solamente pueden
clasificarse en categorías, se emplea la moda para
describirlo. Sin embargo el empleo de la moda no
está limitado al tipo de datos cualitativos o
descriptivos.
La moda resulta sumamente útil para expresar la
tendencia central de observaciones
correspondientes a características cualitativas tales
como color, estado civil, ocupación, lugar de
nacimiento, etc.
17. Para datos agrupados de Variable Discreta
Para calcular la moda de n datos tabulados de variable
discreta se determina cual es el valor de la variable que
presenta mayor frecuencia absoluta simple.
Md = Xi Tal que fi es la mayor
18. Ejemplo: En un estudio de Años de escolarización de estudiantes de
Derecho se obtuvo la siguiente tabla de distribución:
Años Frecuencia
16 5
17 10
18 6
19 4
20 2
Total 26
Determina los años de escolarización modal.
Solución:
Md = 17 años
Los años de escolarizacion mas frecuente es de 17 años
19. Para datos agrupados
Para calcular la moda de n datos tabulados por intervalos,
primero se determina el intervalo que contiene a la moda,
esto es, el intervalo que tiene la mayor frecuencia (intervalo
modal). Luego se utiliza la fórmula:
donde:
Li es el límite inferior del intervalo modal.
d1= fi - fi-1
d2= fi - fi+1
A= amplitud del intervalo modal
21
1
*
dd
d
ALM id
20. Ejemplo: La siguiente tabla muestra la inversión anual de 40 empresas.
Intervalo
Marca de
clase
xi
Frecuencias Frecuencias
acumuladas
fi hi Fi Hi
4, 10
10, 16
16, 22
22, 28
28, 34
34, 40
40, 46
7
13
19
25
31
37
43
1
3
6
12
11
5
2
0,025
0,075
0,150
0,300
0,275
0,125
0,050
1
4
10
22
33
38
40
0.025
0.100
0.250
0.550
0.825
0.950
1.000
40 1,000
Título: “Inversión anual de empresas”
Unidades: miles de dólares.
21. El intervalo donde se encuentra la mayor frecuencia
es el cuarto intervalo
Entonces: Li = 22
d1= fi - fi-1 = 12 – 6 = 6
d2= fi - fi+1 = 12 – 11= 1
A = 6
de donde: Md= 22 + 5,85 = 27,85
Esto significa la mayoría de las empresas invierten
27 850 dólares
16
6
*622dM
22. MEDIANA
La mediana de un conjunto de
observaciones se define como el valor que
queda en la parte central de un grupo de
observaciones arreglados en orden de
magnitud.
23. Para datos no agrupados
La mediana de un conjunto de datos es el
valor que se encuentra al medio de la
distribución ordenada (en forma ascendente
o descendente). Cuando se tiene mediana
uno sabe que es la misma cantidad de
datos que se encuentra por encima de
dicha mediana que por debajo.
24. Ejemplo1: sean las edades de 5 jovenes: 17, 16, 18, 17 y 19 años. Cual es
la edad mediana?
Solucion:
Ordenamos la serie: 16, 17, 17, 18, 19
Ubicamos el dato central: 16, 17, , 18, 19
Me = 17 años
El 50% de los jovenes tienen una edad maxima de 17 años
16
,
17
,
11
17
7,
18
,
19
25. Ejemplo2: sean los puntajes de 4 practicas del curso: 12, 16, 17, 14. Cual
es la edad mediana?
Solucion:
Ordenamos la serie: 12, 14, 16, 17
Ubicamos el dato central: 12, , , 17
Me = (14 + 16 )/2 = 15 puntos
El 50% de los practicas tienen un puntaje maximo de 15 puntos
16
,
17
,
11
14
7,
18
,
19
16
,
17
,
11
16
7,
18
,
19
26. Para datos agrupados de variable continua
Para calcular la mediana para datos agrupados
considerando las frecuencias absolutas, en
primer lugar se encuentra el intervalo donde se
encuentra la mediana, este se encontrará en el
primer intervalo cuya frecuencia absoluta
acumulada contiene a la mitad de la muestra.
Luego se utiliza la fórmula:
27.
i
1i
ie
f
F
2
n
LM *A
Li =Es el límite inferior del intervalo de la mediana
n = Número de datos observados
Fi-1= Frecuencia acumulada absoluta del intervalo
inmediatamente anterior al intervalo de la mediana
fi = Frecuencia absoluta del intervalo de la mediana
A = Amplitud del intervalo de la mediana
28. Ejemplo: La siguiente tabla muestra la inversión anual de 44 empresas.
Intervalo
Marca de
clase
xi
Frecuencias Frecuencias
acumuladas
fi hi Fi Hi
4, 10
10, 16
16, 22
22, 28
28, 34
34, 40
40, 46
7
13
19
25
31
37
43
1
3
6
12
11
5
2
0,025
0,075
0,150
0,300
0,275
0,125
0,050
1
4
10
22
33
38
40
0.025
0.100
0.250
0.550
0.825
0.950
1.000
40 1,000
Título: “Inversión anual de empresas”
Unidades: miles de dólares.
29. El intervalo donde se encuentra n/2 es el número cuatro, luego:
Li= 22; n = 40; Fi-1 =10; fi =12; A= 6
Por tanto
27
12
10
2
40
*622
Me
Me
El 50% de las empresas invierten menos de 27 000 dólares
i
1i
ie
f
F
2
n
LM *A