2. 2
MÉTODOS ANALÍTICOS
MEDIDAS DE TENDENCIA CENTRAL
• Moda
• Media
• Mediana
• Cuantiles: cuartiles, deciles y percentiles
MEDIDAS DE DISPERSIÓN
• Rango o recorrido
• Recorrido intercuartílico
• Varianza y desviación típica
• Desviación media
• Coeficientes de variación
3. 3
MEDIDAS DE TENDENCIA CENTRAL
MEDIAARITMÉTICA:
n
nx
x
n
x
x
k
j
jj
n
i
i
11
Por ejemplo, con los datos muestrales: 2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 se
tienen dos modas: 4 y 6.
5
15
2827365342322
5
15
887766654443322
x
x
MODA, Mo: Es el dato que más se repite. Puede haber más de
una moda.
Con los datos anteriores, se tiene:
4. 4
CUANTIL DE ORDEN , C : Es un valor tal que, ordenados en
magnitud los datos, el 100 % es menor que él y el resto mayor.
Utilizaremos los cuartiles Q1, Q2, Q3 , los deciles D1,...,D9 y los
percentiles P1,...,P99 que corresponden a cuantiles con = 0.25,
0.5,0.75, = 0.1,...,0.9 y = 0.01,...,0.99 respectivamente.
MEDIANA Me: Es un valor tal que, ordenados en magnitud los
datos, el 50% es menor que él y el 50% mayor.
2 2 3 3 4 4 4 5 6 6 6 7 7 8 8
5. 5
Cálculo de cuantiles: (mediana, cuartiles y percentiles)
• Se ordenan los datos de menor a mayor.
• Se determina el valor n .
Donde n es el numero de datos
el orden del cuantil que queremos calcular
• Si n no es entero, se redondea al siguiente entero y el dato
que ocupe ese lugar es el cuantil buscado.
• Si n = k es entero el cuantil buscado es la media entre xk y
xk+1.
2,2,3,3,4,4,4,5,6,6,6,7,7,8,8 en este ejemplo n=15
La mediana será: Me = C0.5, es decir n =15*0.5 = 7.5, luego la mediana
ocupa el lugar 8, x8 =Me=5
El segundo decil D2 = C0.2, es decir n =15*0.2=3, luego D2 es la media
entre x3 y x4, D2=3
6. 6
ROBUSTEZ DE LA MEDIANA
Consideremos los datos del ejemplo anterior:
2 2 3 3 4 4 4 5 6 6 6 7 7 8 8
Si añadimos un nuevo dato x16 = 34 y calculamos de nuevo la media y
la mediana, obtenemos:
• Nueva media: = 6.8
• Nueva mediana: Me = 5.5
x
7. 7
COMPARACIÓN MEDIA-MEDIANA
• La media contiene más información porque usa los valores de
todos los datos.
• La mediana es más robusta frente a los cambios en los datos.
• La media es más sencilla de calcular y se presta mejor a los
cálculos algebraicos.
• Deben calcularse ambas pues proporcionan información
complementaria.
8. 8
MEDIDAS DE DISPERSIÓN
Las medidas de centralización proporcionan una información incompleta
del conjunto de datos.
Ejemplo: sean X e Y las notas de dos grupos de cuarenta
alumnos, con distribuciones de frecuencias:
xi ni
0 20
10 20
yi ni
4.5 3
5 34
5.5 3
Para ambas variables la media es
5, pero en el segundo caso 5 es un
valor más representativo de los
datos que en el primero.
Las medidas de dispersión nos permiten valorar si el valor de la medida
de tendencia central es , o no es , representativo.
9. 9
MEDIDAS DE DISPERSIÓN
Partimos de una muestra de tamaño n=15, 2 2 3 3 4 4 4 5 6 6 6 7 7 8 8
• RANGO O RECORRIDO: R = Max-Min =
7
1j
j
2
j
n
1i
2
i nxx
15
1
xx
n
1
V
7
1j
j
2
j
n
1i
2
i
2
nxx
14
1
xx
1-n
1
s
Dt V
2
ss
8 - 2 = 6
7 -3 = 4
3.87
4.14
= 1.97
= 2.04
• RECORRIDO INTERCUARTÍLICO: RQ = Q3 - Q1 =
• VARIANZA:
• CUASIVARIANZA:
• DESVIACIÓN TÍPICA:
• CUASIDESVIACIÓN TÍPICA:
10. 10
• DESVIACIÓN MEDIA:
j
7
1j
j
n
1i
i nMex
15
1
Mex
n
1
Dm
• COEFICIENTE DE VARIACIÓN DE PEARSON:
Dt
CV
x
• COEFICIENTE DE VARIACIÓN MEDIA:
Dm
CVm
Me
= 1.73
= 0.394
= 0.347
11. 11
Ejemplo de cómo la varianza no sirve para comparar
la dispersión de dos variables distintas:
Sea X el peso en Kg de una población de lagartos
Sea Y el peso en Kg de una población de tiburones
xi ni
0.4 3
0.45 4
0.5 6
0.55 2
yi ni
400 3
403 4
405 4
410 2
0.34CV
0.026V,473.0x
0.0076CV
9.846V404,y