Este documento describe diferentes medidas de posición para resumir distribuciones de variables estadísticas, incluyendo la mediana, moda y cuantiles. Explica cómo calcular la mediana y moda tanto para datos simples como agrupados, y proporciona ejemplos numéricos. También discute las ventajas de usar la mediana y la moda.
2. Medidas de Posición, Dispersión y Forma
www.clasesuniversitarias.com
Cuando disponemos de una distribución de frecuencias asociada a cierta variable estadística, ésta puede
resumirse por unas medidas que dan una idea general de cómo es la distribución sin tener que tratar
todos los datos con frecuencias absolutas o relativas. Dichas medidas se pueden dividir en:
Medidas de posición; estas medidas dan una idea de en qué valores se distribuye la variable estadística:
medias aritmética, geométrica y armónica, mediana, moda y cuantiles.
Medidas de dispersión; estas medidas tratan de medir el grado de esparcimiento de la variable
estadística en torno a una medida de posición, indicándonos lo representativa que es ésta. A mayor
dispersión, menor representatividad de la medida de posición y viceversa. Veremos como ejemplos, entre
otros, la varianza, el recorrido y el coeficiente de variación de Pearson.
Medidas de forma; se distinguen principalmente dos medidas que estudian la simetría de una
distribución (coeficiente de asimetría de Fisher) y el grado de semejanza de la misma a la distribución
campaniforme de Gauss o también llamada normal (coeficiente de curtosis de Fisher).
MEDIDAS DE POSICIÓN
3. Medidas de Posición
www.clasesuniversitarias.com
Estudiaremos las Medidas de Posición, también llamadas Medidas de Centralización, ya que estamos
estudiando los valores centrales de la variable estadística, distinguiendo:
Variables Estadísticas de Datos Simples
MODA ABSOLUTA (Mo): El dato o datos con mayor frecuencia absoluta, es decir, el dato que aparece
más veces en la variable estadística. En caso de existir más de una Moda Absoluta, se puede decir que la
variable es bimodal, trimodal o multimodal.
Resulta también interesante definir moda relativa como aquel valor de la variable (o valores) cuya
frecuencia absoluta no es superada por los valores contiguos.
MEDIDAS DE POSICIÓN
Variables Estadísticas de Datos Agrupados en Intervalos
MEDIANA (Me): Dada una distribución de frecuencias con los valores ordenados de forma creciente,
llamamos Mediana y la representamos por Me al valor de la variable que deja a su izquierda y a su
derecha exactamente el 50% del número de frecuencias absolutas.
Se obtiene con facilidad a partir de la Tabla Estadística, analizando las Frecuencias Absolutas
Acumulados, buscando el valor N/2, es decir, la mitad de la población.
4. Medidas de Posición
www.clasesuniversitarias.com
Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 3 , 3 , 4 , 5
1
2
3
4
5
1
2
4
1
1
1
3
7
8
9
xi ni
iN
N=9
Mo=3 La Moda es 3, ya que se trata del valor con mayor
frecuencia absoluta.
Me=3 Para calcular la Mediana, hay que calcular el valor
central de la variable estadística, para lo cuál
obtenemos el valor:
5,4
2
9
2
N
En la Tabla Estadística buscamos el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5.
Si, como en este caso, no aparece una Frecuencia Absoluta Acumulada que coincida con el valor 4,5, la Mediana
será el primer valor cuya Frecuencia Absoluta Acumulada supere el valor 4,5. En este caso, será 3, ya que su
Frecuencia Absoluta Acumulada supera 4,5, siendo en este caso, 7
5. Medidas de Posición
www.clasesuniversitarias.com
Moda Absoluta y Mediana para Variables Estadísticas de Datos Simples (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Variable Estadística: 1 , 2 , 2 , 3 , 3 , 4
xi ni
iN
N=6
Mo=2 y 3 Se trata de una Variable Estadística bimodal, ya que
hay dos valores con una Frecuencia Absoluta mayor
Me=2,5 Partimos igualmente del valor 3
2
6
2
N
Y buscamos en la Tabla Estadística el valor 3. En este caso sí aparece el valor 3 en las
Frecuencias Absolutas Acumuladas, por lo que el proceso para el cálculo de la
mediana, varía.
En este caso, tomamos el valor xi, cuya Frecuencia Absoluta Acumulada coincide con 3 y el valor siguiente, xi+1, cuya
Frecuencia Absoluta Acumulada supera el valor 3, y calculamos la media de ambos valores.
1
2
3
4
1
2
2
1
1
3
5
6
5,2
2
32
2
1
ii xx
Me
6. Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MODA:
N=30
Mo=[1,6;1,7) En este caso es un Intervalo modal, ya que este
intervalo presenta la mayor Frecuencia Absoluta.
Pero tenemos que asignar un valor numérico a este intervalo modal, para que la Moda
sea un número. Vamos a ver dos formas de hacerlo:
La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su
Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
4
18
7
1
4
22
29
30
ni
iN
Mo=1,65
La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:
- densidad de frecuencia de los intervalos anterior y posterior al intervalo modal (hi-1 y hi+1)
- Límite Inferior del Intervalo Modal, (Li-1)
- su amplitud, (ci)
7. Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Ampliamos la Tabla Estadística con los valores mencionados anteriormente:
N=30
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
4
18
7
1
4
22
29
30
ni
iNic ih
0,1
0,1
0,1
0,1
0,4
1,8
0,7
0,1
i
ii
i
io c
hh
h
LM
11
1
1
Si, como en este caso, los intervalos de amplitud son constantes,
la moda absoluta se puede calcular utilizando frecuencias
absolutas en vez de densidades de frecuencia.
6878,11,0
429
29
6,1
11
1
1
i
ii
i
io c
NN
N
LM
8. Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
Me=[1,6;1,7)
Pero tenemos que asignar un valor numérico a este intervalo mediano, para que la
Mediana sea un número. Vamos a ver dos formas de hacerlo:
La primera, muy sencilla, es asignar al Intervalo el valor numérico correspondiente a su
Marca de Clase, es decir, el valor medio de los extremos. En este caso, 1,65.
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
4
18
7
1
4
22
29
30
ni
iN
La segunda, más elaborada, nos obliga a ampliar la información de la Tabla Estadística, incorporando los conceptos:
- Límite Inferior del Intervalo Modal, (Li-1)
- su amplitud, (ci)
Partimos igualmente del valor 15
2
30
2
N
9. Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
Ampliamos la Tabla Estadística con los valores mencionados anteriormente:
N=30
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
4
18
7
1
4
22
29
30
ni
iNic
0,1
0,1
0,1
0,1
6611,11,0
18
415
6,12
1
1
i
i
i
ie c
n
N
N
LM
i
i
i
ie c
n
NN
LM
1
1
2/
Si no quieres aprenderte esta fórmula de memoria, se puede razonar esta manera de calcular la Mediana de una
forma más sencilla, sin recurrir a complejas fórmulas….
10. Medidas de Posición
www.clasesuniversitarias.com
Moda y Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 1)
MEDIDAS DE POSICIÓN
N=30
Me=[1,6;1,7)
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es
constante, por lo que el intervalo [1,6;1,7) comienza con una frecuencia acumulada 4 y
termina con una frecuencia acumulada 22
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
4
18
7
1
4
22
29
30
ni
iN
Partimos igualmente del valor 15
2
30
2
N
1,6 1,7
Frecuencia
acumulada 4
Frecuencia
acumulada 22
Frecuencia
acumulada 15
x
Dos triángulos equivalentes (Teorema de Tales):
)6,17,1(
)422(
)6,1(
)415(
x )1,0(
)18(
)6,1(
)11(
x
Me = x = 1,6611
Como ves, el resultado coincide y no hemos tenido
que memorizar ninguna fórmula…
11. Medidas de Posición
www.clasesuniversitarias.com
Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
En este caso, existe un valor para el que la Frecuencia Absoluta Acumulada coincide
con 15, por lo que el Intervalo mediano se correspondería con la media de los intervalos
[1,6;1,7) y [1,7;1,8) ¿Cómo puedo hacer esto?
La primera, muy sencilla, es asignar a cada intervalo, el valor numérico correspondiente a su Marca de Clase, es
decir, el valor medio de los extremos, para calcular la semisuma, o media, de ambos valores numéricos.
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
ni
iN
Partimos del valor 15
2
30
2
N
6
9
13
2
6
15
28
30
Dos Formas:
Marca de clase del intervalo [1,6;1,7) = 1,65
Marca de clase del intervalo [1,7;1,8) = 1,75
70,1
2
75,165,1
eM
12. Medidas de Posición
www.clasesuniversitarias.com
Mediana para Variables Estadísticas de Datos Agrupados en Intervalos (Ejemplo 2)
MEDIDAS DE POSICIÓN
Dada la siguiente Tabla Estadística, calculemos la MEDIANA:
N=30
Intervalo
[1,5;1,6)
[1,6;1,7)
[1,7;1,8)
[1,8;1,9)
ni
iN
6
9
13
2
6
15
28
30
La segunda forma, consideramos que la evolución de las frecuencias absolutas dentro
de cada uno de los intervalos es constante, por lo que el intervalo [1,6;1,7) comienza
con una frecuencia acumulada de 6 y el intervalo [1,7;1,8) termina con una frecuencia
acumulada 28
1,6 1,8
Frecuencia
acumulada 4
Frecuencia
acumulada 28
Frecuencia
acumulada 15
1,7
Siguiendo esta argumentación, debemos
encontrar el valor para el cuál la Frecuencia
Absoluta Acumulada coincida con el valor 15. En
este ejemplo, está claro que ese valor es el 1,7,
por lo que:
Me = 1,7
13. Medidas de Posición
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
VENTAJAS:
MEDIANA
1. Es la medida más representativa en los
casos de variables que solo admitan la escala
ordinal.
2. Es sencilla de calcular.
3. Tiene fácil interpretación.
4. Es insensible a los valores extremos y solo
influyen en ella los valores centrales.
MODA
1. Es la única medida de posición central que
puede calcularse en aquellas variables que
solo admitan escala nominal.
2. Es sencilla de calcular.
3. Tiene fácil interpretación.
INCONVENIENTES:
MEDIANA
1. No participan todos los valores de la
variable sino todas las frecuencias
absolutas.
MODA
1. Se centra en una sola variable y no
en todas (como la media) o en las
frecuencias (mediana).
14. Medidas de Posición
www.clasesuniversitarias.com
MEDIA ARITMÉTICA: la suma de todos los valores de la distribución dividida por el número total de
observaciones.
El concepto de media aritmética de una distribución de frecuencias se debe utilizar cuando los datos
observados son de naturaleza aditiva (rentas, salarios, beneficios, primas de seguros, etc.) de tal forma
que una suma representa el total de los recursos repartidos entre todos los elementos de una distribución.
r
i
ii nx
N
x
1
1
Propiedades:
1. Si a la variable estadística xi la sometemos al mismo tiempo a un cambio de origen y escala mediante una transformación lineal (yi =
a+bxi) entonces resulta que
xbay
2. La suma de las desviaciones de los valores o datos respecto a su media aritmética es cero: 0)(
1
r
i
ii nxx
3. La suma de los cuadrados de las desviaciones de los valores observados unitarios respecto a una constante arbitraria C es mínima
cuando dicha constante coincide con la media aritmética.
4. Si el total de datos se estratifica en L grupos distintos, la media aritmética del total es una media aritmética de las distintas medias de
los estratos ponderadas por el número de observaciones que tienen los mismos
MEDIDAS DE POSICIÓN
15. Medidas de Posición
www.clasesuniversitarias.com
MEDIA GEOMÉTRICA de una distribución de frecuencias y la denotaremos por G, como la raíz N-ésima
del producto de los N valores observados
El concepto de media geométrica se debe utilizar cuando los valores representan la evolución de una
característica con respecto al valor que tiene en un período que llamamos base (números índices, tasas
de porcentajes, tipos de interés, etc.). La media geométrica es la medida de posición central más
representativa cuando la variable presenta variaciones acumulativas
Propiedad: su logaritmo coincide con la media aritmética de los logaritmos de los valores de la variable.
N
r
i
n
i
i
xG
1
MEDIA ARMÓNICA se define como:
Supongamos que queramos hallar el promedio de los beneficios por unidad de producción (xi) obtenidos
en r empresas de un sector económico determinado. Denominaremos ni a la cantidad de beneficios
obtenida por cada una de ellas, así el cociente (ni / xi) será el número de unidades producidas por cada
empresa. Llamaremos a su vez, N al total de beneficios obtenidos por el sector.
r
i i
i
x
n
N
H
1
MEDIDAS DE POSICIÓN
16. Medidas de Posición
www.clasesuniversitarias.com
VENTAJAS
MEDIA ARITMÉTICA
1. Utiliza todos los valores de la distribución.
2. Es calculable en variables cuantitativas.
3. Está objetivamente definida y es única.
4. Representa el centro de gravedad
MEDIA GEOMÉTRICA
1. Utiliza todos los valores de la distribución.
2. Está objetivamente definida y es única, si existe.
3. Es más representativa que la aritmética en variables que representan evolución.
4. Es menos influenciable por los valores extremos.
MEDIA ARMÓNICA
1. Utiliza todos los valores de la distribución.
2. Está objetivamente definida y es única, si existe.
3. Sencillo cálculo.
4. Es más representativa en casos de promedios en velocidades, rendimientos y productividades.
MEDIDAS DE POSICIÓN
17. Medidas de Posición
www.clasesuniversitarias.com
INCONVENIENTES
MEDIA ARITMÉTICA
1. Es muy sensible a valores extremos.
MEDIA GEOMÉTRICA
1. No puede calcularse cuando algún valor es cero o cuando el tenemos un número par de datos negativos y el
número total de datos es impar o viceversa.
2. Cálculo más complejo.
MEDIA ARMÓNICA
1. No puede calcularse cuando algún valor sea cero.
2. Si los valores están próximos a 0 la media armónica quedaría sobredimen-sionada.
RELACIÓN ENTRE LAS MEDIAS: xGH
MEDIDAS DE POSICIÓN
18. Medidas de Posición no centrales
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
Cuando hablamos de Mediana, hablamos de la posición central respecto a la totalidad de datos
ordenados. Por tanto a la hora de obtener esa posición central calculamos el cociente
2
N
Sin embargo, podemos analizar posiciones no centrales de la variable estadística. Los cuantiles son
aquellos valores de la variable que dividen a la distribución en un número de intervalos, que tienen un
número proporcional de frecuencias absolutas. Distinguimos:
CUARTILES: Dividimos los valores en cuatro partes, distinguiendo tres tipos de cuartiles:
4
1
N
Q
4
2
2
N
Q
4
3
3
N
Q
DECILES: Dividimos los valores en diez partes, distinguiendo nueve tipos de deciles:
10
1
N
D
10
2
2
N
D
10
3
3
N
D
10
9
9
N
D
PERCENTILES: Dividimos los valores en cien partes, distinguiendo noventa y nueve tipos de percentiles:
100
1
N
P
100
2
2
N
P
100
3
3
N
P
100
kN
Pk
100
99
99
N
P
19. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
75,4 85,2 79 87,3 82 84 86,2 80 78,3 81,3 76,2 83,1 82,9 80 80,6 89,8 83,9 82,4 83,9 78,4
Volvemos al ejemplo del PPT anterior: El peso de los alumnos de una clase son los siguientes:
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
MODA: En este caso es un Intervalo modal, ya que hay un intervalo
presenta la mayor Frecuencia Absoluta.
Mo=[81;84)
Para elegir un valor numérico representativo del intervalo modal, bien
utilizamos su marca de clase, 82,5, bien utilizamos la fórmula más compleja…
ic ih i
ii
i
io c
hh
h
LM
11
1
1Intervalo
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
76,5
79,5
82,5
85,5
88,5
xi
3
3
3
3
3
Como los intervalos de amplitud son constantes, utilizo las frecuencias
absolutas
823
36
3
81
11
1
1
i
ii
i
io c
NN
N
LM
6
24
48
57
60
20. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
MEDIANA: Utilizamos el valor 10
2
20
2
N
Me=[81,84)
El intervalo mediano será el primero que tenga una Frecuencia Absoluta
Acumulada superior a 10, por tanto, será:
Pero tenemos que asignar un valor numérico a este intervalo mediano, para que
la Mediana sea un número, bien eligiendo su Marca de Clase, 82,5, bien aplicando
la siguiente argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo
[81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16
81 84
Frecuencia
acumulada 8
Frecuencia
acumulada 16
Frecuencia
acumulada 10
x
Dos triángulos equivalentes (Teorema de Tales):
)8184(
)816(
)81(
)810(
x 3
8
)81(
3
x
Me = 81,75
21. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
CUARTIL 3: Utilizamos el valor 15
4
203
4
3
N
Q3=[81,84)
El intervalo Q3 será el primero que tenga una Frecuencia Absoluta Acumulada
superior a 15, por tanto, será:
Pero tenemos que asignar un valor numérico a este Q3, para que sea un número,
bien eligiendo su Marca de Clase, 82,5, bien aplicando la siguiente
argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo
[81,84) comienza con una frecuencia acumulada 8 y termina con una frecuencia acumulada 16
81 84
Frecuencia
acumulada 8
Frecuencia
acumulada 16
Frecuencia
acumulada 15
x
Dos triángulos equivalentes (Teorema de Tales):
)8184(
)816(
)81(
)815(
x 3
8
)81(
7
x
Q3 = 83,625
22. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
DECIL 3: Utilizamos el valor 6
10
203
10
3
N
D3=[78,81)
El intervalo D3 será el primero que tenga una Frecuencia Absoluta Acumulada
superior a 16, por tanto, será:
Pero tenemos que asignar un valor numérico a este D3, para que sea un número,
bien eligiendo su Marca de Clase, 79,5, bien aplicando la siguiente
argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo
[78,81) comienza con una frecuencia acumulada 2 y termina con una frecuencia acumulada 8
78 81
Frecuencia
acumulada 2
Frecuencia
acumulada 8
Frecuencia
acumulada 6
x
Dos triángulos equivalentes (Teorema de Tales):
)7881(
)28(
)78(
)26(
x 3
6
)78(
4
x
D3 = 80
23. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
PERCENTIL 96: Utilizamos el valor 2,19
100
2096
100
96
N
P96=[87,90]
El intervalo P96 será el primero que tenga una Frecuencia Absoluta Acumulada
superior a 16, por tanto, será:
Pero tenemos que asignar un valor numérico a este P96, para que sea un número,
bien eligiendo su Marca de Clase, 88,5, bien aplicando la siguiente
argumentación:
Consideramos que la evolución de las frecuencias absolutas dentro del intervalo es constante, por lo que el intervalo
[87,90) comienza con una frecuencia acumulada 19 y termina con una frecuencia acumulada 20
87 90
Frecuencia
acumulada 19
Frecuencia
acumulada 20
Frecuencia
acumulada 19,2
x
Dos triángulos equivalentes (Teorema de Tales):
)8790(
)1920(
)87(
)192,19(
x 3
1
)87(
2,0
x
P96 = 87,6
24. Ejemplo
www.clasesuniversitarias.com MEDIDAS DE POSICIÓN
ni
iNIntervalo
N=20
[75,78)
[78,81)
[81,84)
[84,87)
[87,90]
2
6
8
3
1
2
8
16
19
20
76,5
79,5
82,5
85,5
88,5
xi
MEDIA ARITMETICA
75,81
20
)1*5,883*5,858*5,826*5,792*5,76(1
N
nx
x
r
i
ii
MEDIA GEOMÉTRICA 69,815,885,855,825,795,7620 13862
1
N
r
i
n
i
i
xG
MEDIA ARMÓNICA 64,81
5,88
1
5,85
3
5,82
8
5,79
6
5,76
2
20
1
r
i i
i
x
n
N
H