2. También llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un
número si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor,
mayor será la variabilidad, y cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos
son parecidos o varían mucho entre ellos.
Las medidas de dispersión nos sirven para cuantificar la
separación de los valores de una distribución.
3. Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o
menor separación de los valores de la muestra, respecto de las
medidas de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media
aritmética, resulta necesario acompañarla de otra medida que
indique el grado de dispersión, del resto de valores de la
distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS
DE DISPERSIÓN, pudiendo ser absolutas o relativas.
4. Tanto las unas como las otras, son medidas que se toman para
tener la posibilidad de establecer comparaciones de diferentes
muestras, para las cuales son conocidas ya medidas que se
tienen como típicas en su clase
Si se conoce el valor promedio de los aprobados en las
universidades venezolanas, y al estudiar una muestra de los
resultados de los exámenes de alguna Universidad en
particular, se encuentra un promedio mayor, o menor, del ya
establecido; se podrá juzgar el rendimiento de dicha institución
5. Rango es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con los datos. Permite obtener una idea de la
dispersión de los datos, cuanto mayor es el rango, más dispersos
están los datos de un conjunto
Solo suministra información de los extremos de la variable.
Informa sobre la distancia entre el mínimo y el máximo valor
observado.
Se limita su uso a una información inicial.
6. Expresa cuantas unidades de diferencia podemos esperar, como
máximo, entre dos valores de la variable.
El rango estima el campo de variación de la variable.
Se afecta mucho por observaciones extremas y utiliza únicamente una
pequeña parte de la información.
La formula es
rango = valor máximo - valor mínimo
Por ejemplo, teniendo los valores 2, 6, 4, 11, 7, 4 , 10, el máximo es
11 y el mínimo es 2, y el rango es consecuentemente 11 - 2 = 9.
Nota: cuando se calcula el rango no hay que dividir por el numero de
clases.
7. La desviación típica o desviación estándar (denotada con el símbolo σ
o s, dependiendo de la procedencia del conjunto de datos) es una
medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define
como la raíz cuadrada de la varianza de la variable.
Es afectada por el valor de cada observación
Como consecuencia de considerar desviaciones cuadráticas pone
mayor énfasis en las desviaciones extremas que en las demás
desviaciones.
Características
8. Si en el eje X de la distribución de frecuencias normal, se
mide a ambos lados de la media una distancia igual a :
Una desviación estándar se forma un intervalo en el cual se
encuentra el 68.27% de los valores centrales de la variable
Dos desviaciones estándar, se forma un intervalo donde se
encuentra el 95.43% de los valores centrales
Tres desviaciones estándar, se forma un intervalo que
contiene el 99.73% de los valores centrales
Al construir la tabla de frecuencias de una variable discreta y
calcular a partir de ella la desviación estándar no hay pérdida
de información por lo que la desviación para los datos
observados es igual que para los datos tabulados.
En la construcción de una tabla de una variable continua hay
pérdida de información por el agrupamiento de los valores en
intervalos y se traduce en la discrepancia entre el valor de la
desviación observada y tabulada.
9. Es de gran utilidad en la estadística , esta mide el grado de dispersión o
variabilidad. En primer lugar, midiendo la diferencia entre cada valor del
conjunto de datos y la media del conjunto de datos. Luego, sumando todas
estas diferencias individuales para dar el total de todas las diferencias.
Por último, dividiendo el resultado por el número total de observaciones
(normalmente representado por la letra “n”) para llegar a un promedio de
las distancias entre cada observación individual y la media. Este promedio
de las distancias es la desviación estándar y de esta manera representa
dispersión.
10. Varianza
Es aquella medida de dispersión que ostenta una variable aleatoria
respecto a su perspectiva. La varianza se relaciona con la desviación
típica o desviación estándar, la cual se denota a través de la letra
griega denominada sigma y que será la raíz cuadrada de la varianza.
Características
La varianza será siempre un valor positivo o cero, en el caso de que
las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la
varianza no varía.
Si todos los valores de la variable se multiplican por un número la
varianza queda multiplicada por el cuadrado de dicho número.
11. Utilidad Estadística
La principal utilidad que se le puede encontrar a la varianza es que nos
permite saber y determinar qué es normal, qué es grande, qué es
pequeño, aquello que es extra grande o bien aquello que es extra
pequeño.
Por ejemplo, si tomamos varias razas de perros y la idea es
determinar cuál de ellos es más grande y cuál el más pequeño, sin
dudas, la mejor manera de saber la respuesta a esta incógnita será
la aplicación de la fórmula de la varianza.
12. coeficiente de variación
El coeficiente de variación es una medida de dispersión que
describe la cantidad de variabilidad en relación con la media.
Puesto que el coeficiente de variación no se basa en unidades.
Características
El coeficiente de variación permite comparar las dispersiones
de dos distribuciones distintas, siempre que sus medias sean
positivas .
Se calcula para cada una de las distribuciones y los valores
que se obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de
variación mayor
13. Utilidad Estadística
Se puede utilizar en lugar de la desviación estándar para comparar la
dispersión de los conjuntos de datos que tienen diferentes unidades
o diferentes medias.