2. Medidas de dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviación media) y otra es tomando las
desviaciones al cuadrado (varianza).
3. Medidas de dispersión
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y
la moda sólo nos revelan una parte de la información que necesitamos
acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su
dispersión, extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la
medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posición central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersión antes de
abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se
desea tener una amplia dispersión de valores con respecto al centro de
distribución o esto presenta riesgos inaceptables, necesitamos tener
habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones más grandes.
Pero si hay dispersión en la mayoría de los datos, y debemos estar en
capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su
grado de variabilidad es importante, ¿cómo medimos la variabilidad de una
distribución empírica?. Vamos a considerar sólo algunas medidas de
dispersión absolutas: el rango, la varianza, la desviación estándar y el
coeficiente de variación.
4. La desviación típica
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la
variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer también la
desviación que presentan los datos en su distribución respecto de la media
aritmética de dicha distribución, con objeto de tener una visión de los
mismos más acorde con la realidad al momento de describirlos e
interpretarlos para la toma de decisiones.
5. Varianza y coeficiente
En estadística, cuando se desea hacer referencia a la relación entre el tamaño
de la media y la variabilidad de la variable, se utiliza el coeficiente de
variación.
Su fórmula expresa la desviación estándar como porcentaje de la media
aritmética, mostrando una mejor interpretación porcentual del grado de
variabilidad que la desviación típica o estándar. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen. Por ello es importante que todos los valores
sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del
coeficiente de variación mayor heterogeneidad de los valores de la variable; y
a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V.
Exigimos que:
Se
calcula:
Donde es la
desviación típica. Se
puede dar en tanto
por ciento
calculando:
6. Varianza y coeficiente
Propiedades y aplicaciones
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en
ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en
mayor medida de la media aritmética, dado que cuando ésta es 0 o muy
próxima a este valor el C.V. pierde significado, ya que puede dar valores muy
grandes, que no necesariamente implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su
media, por lo que su coeficiente de variación es 1. La distribuciones con un
C.V. menor que uno, como la distribución de Erlang se consideran de "baja
varianza", mientras que aquellas con un C.V. mayor que uno, como la
distribución hiperexponencial se consideran de "alta varianza". Algunas
fórmulas en estos campos se expresan usando el cuadrado del coeficiente de
variación, abreviado como S.C.V. (por su siglas en inglés)