2. Las medidas de dispersión nos informan sobre cuánto se alejan del
centro los valores de la distribución.
Son también llamadas medidas de variabilidad, muestran la variabilidad
de una distribución, indicando por medio de un número si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos
o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su
media, se calcula la media de las desviaciones de las puntuaciones
respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que se adoptan dos clases de estrategias para salvar
este problema. Una es tomando las desviaciones en valor absoluto
(desviación media) y otra es tomando las desviaciones al cuadrado
(varianza).
3. Características y Usos
Las medidas de dispersión nos dicen hasta que punto estas medidas de
tendencia central son representativas como síntesis de la información. Las
medidas de dispersión cuantifican la separación, la dispersión, la variabilidad
de los valores de la distribución respecto al valor central. Distinguimos entre
medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y
la moda sólo nos revelan una parte de la información que necesitamos acerca
de las características de los datos. Para aumentar nuestro entendimiento del
patrón de los datos, debemos medir también su dispersión, extensión o
variabilidad.
4. La dispersión es importante porque:
• Proporciona información adicional que permite juzgar la confiabilidad
de la medida de tendencia central. Si los datos se encuentran
ampliamente dispersos, la posición central es menos representativa de
los datos.
• Ya que existen problemas característicos para datos ampliamente
dispersos, debemos ser capaces de distinguir que presentan esa
dispersión antes de abordar esos problemas.
• Quizá se desee comparar las dispersiones de diferentes muestras. Si
no se desea tener una amplia dispersión de valores con respecto al
centro de distribución o esto presenta riesgos inaceptables,
necesitamos tener habilidad de reconocerlo y evitar escoger
distribuciones que tengan las dispersiones más grandes.
5. El rango es la diferencia entre el mayor y el menor de
los datos de una distribución estadística.
Requisitos:
•Ordenamos los números según su tamaño.
•Restamos el valor mínimo del valor máximo.
Rango para datos no agrupados;
R = Xmáx - Xmín = Xn-X1
6. La desviación respecto a la media es la diferencia entre
cada valor de la variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos
de las desviaciones respecto a la media.
7. La varianza es una medida estadística que mide la dispersión de los
valores respecto a un valor central (media), es decir, es el cuadrado de
las desviaciones:
8. Propiedades:
1. La varianza será siempre un valor positivo o cero, en el caso de
que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se
les suma un número la varianza no varía.
3. Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por el cuadrado de
dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos
sus respectivas varianzas se puede calcular la varianza total.
9. Observaciones:
1. La varianza, al igual que la media, es un índice muy sensible a las
puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será
posible hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los
datos, ya que las desviaciones están elevadas al cuadrado.
10. La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ.
11. Propiedades:
1. La desviación típica será siempre un valor positivo o cero, en el
caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se
les suma un número la desviación típica no varía.
3. Si todos los valores de la variable se multiplican por
un número la desviación típica queda multiplicada por
dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos
sus respectivas desviaciones típicas se puede calcular
la desviación típica total.
12. Observaciones:
1. La desviación típica, al igual que la media y la varianza, es un
índice muy sensible a las puntuaciones extremas.
2. En los casos que no se pueda hallar la media tampoco será
posible hallar la desviación típica.
3. Cuanta más pequeña sea la desviación típica mayor será
la concentración de datos alrededor de la media.
13. El coeficiente de correlación de Pearson, r, permite saber si el
ajuste de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el
producto de las desviaciones típicas (raíz cuadrada de las
varianzas).
14. Propiedades:
1. El coeficiente de correlación, r, presenta valores entre –1 y +1.
2. Cuando r es próximo a 0, no hay correlación lineal entre las variables. La
nube de puntos está muy dispersa o bien no forma una línea recta. No se
puede trazar una recta de regresión.
3. Cuando r es cercano a +1, hay una buena correlación positiva entre las
variables según un modelo lineal y la recta de regresión que se determine
tendrá pendiente positiva, será creciente.
4. Cuando r es cercano a -1, hay una buena correlación negativa entre las
variables según un modelo lineal y la recta de regresión que se determine
tendrá pendiente negativa: es decreciente.es