Este documento describe varias medidas de variabilidad como la desviación estándar, la varianza y el rango intercuartílico. Explica cómo calcular estas medidas y cuándo es más adecuado usar cada una. Por ejemplo, la desviación estándar mide qué tan dispersos están los valores respecto a la media, mientras que el rango intercuartílico es mejor para distribuciones asimétricas y se usa con la mediana.
2. Los de variabilidad o dispersión nos indican si esas puntuaciones se
encuentran muy próximas entre sí o muy dispersas.
Por ejemplo, dados 3 valores en dos muestras distintas: (7,9, y 11) y
(1, 10, y 16) tienen la misma media (o posición) pero la variabilidad o
dispersión de las puntuaciones del primer grupo es menor que de las
puntuaciones del segundo.
La variabilidad es un indicador de la forma en que las puntuaciones de
una distribución están esparcidas o dispersas.
3. Medidas de variabilidad
Los estadísticos de tendencia central
indican dónde se sitúa un grupo de
puntuaciones (zona alta, media o baja).
La variabilidad se refiere al grado de
dispersión de los valores alrededor de la
tendencia central.
4. .
Las medidas de variabilidad o dispersión nos indican si esas
puntuaciones se encuentran muy próximas entre sí o muy dispersas.
Es decir, se busca un punto de referencia (medida de tendencia central)
a partir del cual se van a analizar las diferencias de las distintas
observaciones.
Ese punto de referencia es la media, y las diferencias se denominan
desvíos (X- media), es decir cada valor con respecto a la media (diferencia)
Las estadísticas que describen la cantidad de variación de
una distribución son: el rango, el rango intercuartilar, el
rango semiintercuartilar, la desviación estándar y la
varianza
5.
6. Si sumamos las diferencias de n puntuaciones respecto a su media,
sabemos que dicha suma vale siempre cero.
Para evitar este inconveniente, se puede elevar los desvíos al cuadrado y
sumar estas diferencias cuadráticas. Esta última táctica es la que seguiremos
con la desviación estándar y la varianza.
La desviación estándar se designa como s y la varianza de la media se
designara con s2
y referida a una población con σ2
.
Usaremos s en esta materia.
La sumatoria de la diferencia
siempre da cero
7. Algunas propiedades de la varianza y de la desviación
típica
1) La varianza y la desviación típica son valores esencialmente
positivos. En efecto, indican en cuántas unidades se separan
las observaciones del promedio. En el caso de la varianza, el
resultado tiene que ser positivo pues se suman las
desviaciones al cuadrado. En el caso de la desviación
estándar o típica se toma la raíz positiva.
2) Ni la varianza ni la desviación típica se alteran cuando a los
datos se les añade una constante.
3) Si los datos de una variable se multiplican por una constante
cualquiera, la desviación típica queda multiplicada por el valor
absoluto de dicha constante y la varianza por el cuadrado de
dicha constante.
8. Interpretación de la Varianza y la desviación típica
Ambos estadísticos están relacionados con las deviaciones de las puntuaciones
respecto de la media aritmética. Sin embargo, conviene indicar que son indicadores
de las diferencias individuales: cuanto mayores son estas diferencias individuales,
mayores son esos indicadores o estadísticos descriptivos.
Cuando decimos que una muestra es más variable que otra, no sólo podemos decir que
en una muestra los datos están menos concentrados en torno a la media sino también
que una muestra presenta mayores diferencias interindividuales
que la otra.
Comparar dos desviaciones típicas o dos varianzas no siempre es posible.
Se pueden comparar dos desviaciones típicas o dos varianzas de dos muestras
obtenidas sobre una misma variable, siempre que las medias no sean
exageradamente distintas.
Las varianzas y las deviaciones típicas son dos unidades de medida distintas,
como que digamos el m y el m2
, de aquí que la varianza admita una representación
gráfica en términos de superficie y la desviación típica se va a representar en términos de
distancia en el eje de las abscisas.
Ambos estadísticos son medidas de grupo pero la desviación típica
permite localizar a un sujeto en una variable.
9. Cálculo simple de la varianza (s2
) y desviación típica (s)
La varianza se calcula sumando los cuadrados de las desviaciones de las
puntuaciones respecto a la media y dividiéndola en el número total de casos:
n
x
S
∑=
2
2
La desviación típica presenta la siguiente fórmula:
n
x
s
∑=
2
* Usaremos mayormente la s en la investigación psicológica.
10. Ejemplo
“A una solicitante de un puesto en una empresa se le
aplicaron siete pruebas de procesamiento de palabras en el
transcurso de siete días hábiles”. Los resultados obtenidos
por la candidata de palabras por minuto son los siguientes:
52 55 39 56 35 50 54
Nos proponemos calcular la variabilidad en estos datos no
agrupados.
Aplicando la fórmula de la desviación típica para datos sin
agrupar tenemos:
n
x
s
∑=
2
Desvíos
de X=X- X
Nº total de
casos
11. Cálculo de la s
Primero se calcula la media:
Segundo se calcula la s (desviación
estándar) para lo cual se necesitan los
desvíos (esto es a cada valor se le resta la
media)
71,48
7
54503556395552
=
++++++
==
∑
N
X
X
n
x
s
∑=
2
~49
12. 56-49=7 55-49=6 54-49=5 52-49=3 50-49=1 39-49= 35-39=-
4
49 36 25 9 1 100 16
X
x2
76,5
1610019253649
=
++++++
=
∑
n
s
n
x
s
∑=
2
13. Cuando la distribución es simétrica o aproximadamente,
estamos en condiciones de decir que entre la media ± s, se
encuentra el 68 % de la distribución normal de los casos.
En este caso sería 49± 5,76=
49+5,76=54,76 y 49-5,76=43,24
43,24 y 54,76 demarcan el área del 68 %
central en este ejemplo.
14. Cálculo de s en una distribución
de frecuencias
Cuando los datos están agrupados en intervalos de amplitud i suponemos que
los valores están concentrados en el punto medio X´ de cada intervalo.
Es decir, cada punto medio representa a cada intervalo.
Por lo tanto, cada punto medio del intervalo se debe multiplicar
por su respectiva frecuencia para el cálculo de la media y por su respectivo
desvío al cuadrado (Ver fórmula) para el cálculo de la desviación.
A su vez, cada desvío x se calcula a partir de la diferencia de cada punto medio
con la media de ese grupo.
Por lo tanto, la s o dispersión se calculará con la siguiente formula:
==
∑
n
xf
s
2
.
15. Pasos para el cálculo de la s
1. Obtener los puntos medios de los intervalos
2. Restar a cada punto medio la media
3. Elevar esas diferencias o desvíos al cuadrado
4. Multiplicarlas por la frecuencia
5. Sumar los productos anteriores.
6. Dividir esta suma por n.
7. Sacar la raíz cuadrada
S= 6,76
16. Puntajes Prueba de Razonamiento f X´ X x2
f. x2
21-25 4 23 13,25 175,56 702,24
16-20 5 18 8,25 68,06 340,3
11-15 7 13 3,25 10,56 73,92
6-10 9 8 -1,75 3,06 27,54
1-5 15 3 -6,75 45,56 683,44
Total 40 1827,44
75,9=X
76,6
40
44,1827
==s
Ejemplo de cálculo de s para datos agrupados en
intervalos
( )2
` XX −( )XX −`
17. • El cálculo de la s se aplica preferentemente cuando la forma de la
distribución se asemeja a una campana ( distribución normal).
• Sólo se calcula a nivel intervalar o racional.
• Es la medida que se prefiere cuando se ha calculado la media como
medida de tendencia central. Es decir, es la medida de variabilidad
que acompaña a la media.
• Si a la media se le suma y se le resta la desviación estándar
se obtiene una zona en la que está incluido el 68% de los casos. Esta
zona se llama de “normalidad”. Por encima de ello, se considera
superior a lo normal, por debajo, inferior a lo normal.
( )sX ±
18. Amplitud intercuartil
Se suele indicas con las letras AQ
Mayúscula o RI
Su fórmula es la siguiente:
AQ es una medida de variabilidad. Es la DISTANCIA entre el cuartil
tercero y el cuartil primero. Es decir, entre el percentil 75 y el 25.
Para su cálculo basta con calcular los cuartiles 3 y 1 o los percentiles 75 y
25 y hallar la diferencia entre ambos.
AQ= Q3-Q1=
En estadística descriptiva, se le
llama rango intercuartílico o rango
intercuartil, a la diferencia entre el
tercer y el primer cuartil de una
distribución. Es una medida de la
dispersión estadística.
A diferencia del rango, se trata de
un estadístico robusto.
19. Amplitud intercuartil o rango
intercuartílico
El rango intercuartílico es una medida de
variabilidad adecuada cuando la medida de
posición central empleada ha sido la mediana.
Se define como la diferencia entre el tercer
cuartil (Q3) y el primer cuartil (Q1), es decir: AQ =
Q3 - Q1. A la mitad del rango intercuartil se le
conoce como desviación semi cuartil (DQ): DQ
= AQ/2= (Q3 - Q1)/2.
Se usa para construir los diagramas de caja y
bigote (box plots) que sirven para visualizar la
variabilidad de una variable y
comparar distribuciones de la misma variable;
además de ubicar valores extremos que no
serán objeto de este curso.
20. Veamos las fórmulas del tercer y del primer cuartil:
i
f
Fa
n
LQ i .4
3
3
−+=
i
f
Fa
n
LQ i .4
1
−+=
21. Dada la variable “Puntajes en la prueba de razonamiento”, para el cálculo de los
cuartiles 3 y 1 en esta distribución agrupada en intervalos, ubicaremos dónde
cae Q3 (3N/4) y Q1 (N/4) y los ubicaremos en las Fa:
CÁLCULO de los CUARTILES 1 Y 3 EN EL EJEMPLO
ANTERIOR
Lex inf Lex sup
22. Pasos:
Se sigue el modelo del cálculo de la Md.
1.Se calcula para el cuartil primero, la cuarta parte (N/4) del total, y para el
tercero, las tres cuartas partes del total (3N/4) para ver cuál es la observación
que deja por debajo ese porcentaje de casos respectivamente. Para ello se
ubica en Fa
2.Ubicamos en la columna de frecuencias acumuladas (Fa) el intervalo que
deja por debajo la ¾ parte y la ¼ parte de las observaciones. Hallamos de ese
modo el intervalo que contiene a los repsectivos cuartiles y los señalamos.
3. Hallamos los límites exactos inferiores de los intervalos señalados.
4. Aplicamos la fórmula (Ver en diapositiva que sigue)
30
4
3
10
4
=
=
n
n
23. Cálculo de los Cuartiles 3 y
1
i
f
Fa
n
LQ i .4
3
3
−+=
78,145.
7
2430
5,103 =
−
+=Q
i
f
Fa
n
LQ i .4
1
−+=
83,35.
15
010
5,01 =
−
+=Q
El cuartil 3 (Q3), correspondiente a la puntuación 14, 78 deja por debajo el
75 % de los casos.
El cuartil 1 (Q1, correspondiente al puntaje 3,83 deja por debajo el 25% de
los casos.
AQ=Q3-Q1=14,78-3,83= 10,95
La distancia entre el Q1 y el Q3, es decir el Rango intercuartílico
o Amplitud Intercuartil es de 10,95 puntos. Allí está comprendido
el 50% central de los casos.
24. Siempre que una distribución es simétrica las distancias entre los
cuartiles 1 y 3 serán iguales no así cuando son asimétricas.
Entonces se puede decir que entre el cuartil 1 y 3 está el 50% de la
distribución.
Q1 Q3
25
%
25
%
25. • Si la distribución no es muy asimétrica es una buena medida de la
densidad en su parte media.
• De todas, maneras AQ es la medida de variabilidad que acompaña a la
mediana como medida de tendencia central.
• Es decir, que es más preferible a la desviación típica en caso de
distribuciones muy asimétricas.
• Cuando el intervalo máximo carece de límite superior o el mínimo de límite
inferior, es imposible calcular la desviación típica. Bajo estas condiciones
es posible calcular la desviación o amplitud intercuartil siempre que el
primero y el tercer cuartil no se encuentre en esos intervalos extremos.
• Definida como distancia entre dos puntos sólo es calculable a nivel de
intervalos o de razón pero no a nivel meramente ordinal.
• Es menos sensible que la desviación típica, a la variación de los datos.
¿Cuándo es conveniente el uso de la
Amplitud Intercuartil o Rango
Intercuartílico ?
26. Amplitud Total o Rango o
Recorrido
Es la diferencia entre la
puntuación máxima y mínima.mínmáxAT −=
Aunque es muy sencilla de calcular tiene varios inconvenientes puesto que
no utiliza todos los datos de la muestra:
*Es muy inestable porque utiliza dos puntuaciones, las extremas. Si éstas
se mantienen constantes la amplitud también lo hará aunque varíen las
comprendidas entre ambas.
*No es muy independiente en general, del tamaño de las muestras. Por
ello, las amplitudes calculadas en muestras de distinto tamaño no son
directamente comparables. Sólo es eficaz con muestras pequeñas.
*En general, se puede afirmar que no es una medida muy recomendable
para estudiar diferencias individuales.
*En caso de que las variables estén agrupadas en intervalos se calcula la
diferencia entre los límites exactos inferior y superior.
27. Consideremos dos muestras:
A: 4 7 9 11 12
B: 4 8 16 20 24
La amplitud total (AT) en A= 12-4=8
La amplitud total (AT) en B= 24-4=20
De acuerdo con ello, podemos concluir de manera rápida que, en efecto,
las puntuaciones se dispersan más en “B” que en “A”.
*Es la más sencilla de las medidas de variabilidad.
28. Bibliografía
Amón, J. (1978). Estadística para psicólogos 1. Estadística Descriptiva,
Madrid, Pirámide.
Blalock, H. (1998). Estadística social, México, Fondo de Cultura
Económica.
Cohen , R. J y m. Swerdlik (2000). Pruebas y evaluación psicológicas.
Introducción a la spruebas y a la medición, México, Mac Graw Hill.
Cortada de Kohan, N. (1994). Diseño estadístico (para investigadores de
las ciencias sociales y de la conducta), Buenos Aires, Eudeba.
______________y otros (2008). Técnicas de investigación científica.
Buenos Aires: Lugar editorial.
Pardo, A. y R. San Martín (1994). Análisis de datos en Psicología, Madrid,
Pirámide.
Peña, D. y J. Romo (1997).estadística para las ciencias sociales, Madrid,
Mac. Graw Hill.
San Martín Castellanos, R. y otros (1987). Psicoestadística Descriptiva,
Madrid, Pirámide.
Bibliografía