Este documento define y explica varias medidas de dispersión como el rango, la desviación típica, la varianza y el coeficiente de variación. El rango es la diferencia entre el valor más alto y más bajo en un conjunto de datos. La desviación típica mide cuánto se desvían los valores de la media, mientras que la varianza mide cuán lejos están los valores de su propia media. El coeficiente de variación permite comparar la dispersión entre distribuciones con diferentes medias.
2. Concepto
Son un conjunto de valores que tienen como función
cuantificar la separación, la dispersión y la variabilidad de
los valores de la distribución respecto al valor central.
3. Rango
Es la medida de variabilidad más fácil de calcular. Para datos
finitos o sin agrupar, el rango se define como la diferencia
entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin)
en un conjunto de datos.
Rango para datos no agrupados
R = Xmáx.-Xmín = Xn-X1
4. Desviación típica
Es una medida de la cantidad típica en la que los valores del conjunto de
datos difieren de la media. Es la medida de dispersión más utilizada. La
desviación estándar siempre se calcula con respecto a la media y es un
mínimo cuando se estima con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la
raíz cuadrada positiva de esta. A la desviación se le representa por la letra
minúscula griega "sigma" ( δ ) ó por la letra S mayúscula, según otros
analistas.
Cálculo de la DesviaciónTipica
δ = √δ2 ó S = √S2
5. Varianza
La varianza es una medida de que tan cerca, o que tan lejos están los
diferentes valores de su propia media aritmética. Cuando más lejos
están las Xi de su propia media aritmética, mayor es la varianza;
cuando más cerca estén las Xi a su media menos es la varianza.Y se
define y expresa matemáticamente de la siguiente manera:
6. Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y
su media.
Permite comparar las dispersiones de dos distribuciones distintas, siempre que
sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores
que se obtienen se comparan entre sí.
Se emplea fundamentalmente para:
• Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas
de unidades de medida. Por ejemplo, kilogramos y centímetros.
• Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más
personas distintas.
• Comparar dos grupos de datos que tienen distinta media.
• Determinar si cierta media es consistente con cierta varianza