Este documento describe diferentes medidas de dispersión utilizadas en estadística, incluyendo el rango, la desviación estándar, la varianza y el coeficiente de variación. Estas medidas cuantifican cuán dispersos están los valores de una distribución con respecto a la media y permiten comparar la variabilidad entre conjuntos de datos.
2. También conocidas como medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un
número si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor, mayor
será la variabilidad, y cuanto menor sea, más homogénea será
a la media. Así se sabe si todos los casos son parecidos o
varían mucho entre ellos.
3. Las medidas de dispersión nos sirven para cuantificar la
separación de los valores de una distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o
menor separación de los valores de la muestra, respecto de
las medidas de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media
aritmética, resulta necesario acompañarla de otra medida
que indique el grado de dispersión, del resto de valores de la
distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS
DE DISPERSIÓN, pudiendo ser absolutas o relativas
4. Las medidas de dispersión se usan para indicar si los datos
están próximos entre sí o sí están dispersos.
Las medidas de dispersión nos permiten apreciar la distancia
que existe entre los datos a un cierto valor central e identificar
la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están
dos o más distribuciones de datos.
Una medida de dispersión puede utilizarse para evaluar la
confiabilidad de dos o más promedios
5. En el campo de la estadística, el rango señala la amplitud de la
variación de un fenómeno entre su límite menor y uno
claramente mayor. El rango estadístico, por lo tanto, es el
intervalo que contiene dichos datos y que puede calcularse a
partir de restar el valor mínimo al valor máximo considerado.
Solo suministra información de los extremos de la variable.
Informa sobre la distancia entre el mínimo y el máximo valor
observado.
Se elimina su uso a una información inicial.
6. Permite obtener una idea de la dispersión de los datos cuando mayor
es el rango, mas dispersos están los datos de un conjunto.
Formula :
Por ejemplo, teniendo los valores 2, 6, 4, 11, 7, 4 , 10, el máximo es 11 y el
mínimo es 2, y el rango es consecuentemente 11 - 2 = 9.
Nota: cuando se calcula el rango no hay que dividir por el numero de
clases.
7. La desviación típica o desviación estándar (denotada con el símbolo σ
o s, dependiendo de la procedencia del conjunto de datos) es una
medida de dispersión para variables de razón (variables
cuantitativas o cantidades racionales) y de intervalo. Se define
como la raíz cuadrada de la varianza de la variable.
Es afectada por el valor de cada observación
Como consecuencia de considerar desviaciones cuadráticas pone
mayor énfasis en las desviaciones extremas que en las demás
desviaciones.
8. Si en el eje X de la distribución de frecuencias normal, se
mide a ambos lados de la media una distancia igual a :
Una desviación estándar se forma un intervalo en el cual se
encuentra el 68.27% de los valores centrales de la variable
Dos desviaciones estándar, se forma un intervalo donde se
encuentra el 95.43% de los valores centrales
Tres desviaciones estándar, se forma un intervalo que
contiene el 99.73% de los valores centrales
Al construir la tabla de frecuencias de una variable discreta
y calcular a partir de ella la desviación estándar no hay
pérdida de información por lo que la desviación para los
datos observados es igual que para los datos tabulados.
En la construcción de una tabla de una variable continua hay
pérdida de información por el agrupamiento de los valores
en intervalos y se traduce en la discrepancia entre el valor
de la desviación observada y tabulada.
9. Es muy utilizada en la en la estadística , para medir el grado de
dispersión o variabilidad. En primer lugar, midiendo la diferencia
entre cada valor del conjunto de datos y la media del conjunto
de datos. Luego, sumando todas estas diferencias individuales
para dar el total de todas las diferencias. Por último, dividiendo
el resultado por el número total de observaciones (normalmente
representado por la letra “n”) para llegar a un promedio de las
distancias entre cada observación individual y la media. Este
promedio de las distancias es la desviación estándar y de esta
manera representa dispersión.
10. La varianza (que suele representarse como σ ²) en una variable
aleatoria es una medida de dispersión definida como la esperanza
del cuadrado de la desviación de dicha variable respecto a su
media.
Formula :
11. Es siempre un valor negativo , que puede ser igual o distinto
a de 0.
La varianza es la medida de dispersión cuadrática , optima
por ser la menor de todas .
Si a todos a todos los valores de la variable se le suma una
constante la varianza no se modifica.
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular la
varianza total.
12. La varianza es la medida de mayor utilidad en todos los
análisis estadísticos.
La varianza misma no es de utilidad directa, ella es la base
de todos los cálculos en estadística , es decir, nos sirven
para calcular las desviaciones estándar, el erros estándar , el
coeficiente de regresión, el coeficiente de correlación, y por
supuesto para hacer el análisis de la varianza , entre otros.
13. El coeficiente de variación es una medida de dispersión que
describe la cantidad de variabilidad en relación con la media.
Puesto que el coeficiente de variación no se basa en unidades,
se puede utilizar en lugar de la desviación estándar para
comparar la dispersión de los conjuntos de datos que tienen
diferentes unidades o diferentes medias.
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que 1. Sin
embargo ciertas distribuciones de probabilidad puede ser 1 o
mayor que1.
14. Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica , también conocida como ¨
Desviación Estándar ¨.
El coeficiente de variación es comúnmente en varios campos
de la probabilidad aplicada.
15. El coeficiente de variación permite comparar la dispersión entre
dos poblaciones distinta e incluso, comparar la variación de
producto de dos variables diferentes ( que pueden provenir de
una misma población ) .
El coeficiente de variación elimina la dimensionalidad de las
variables y tiene en cuenta la proporción existente entre una
medida de tendencia y una desviación típica o estándar