2. Medidas de dispersión Características
y usos
Las Medidas de Dispersión nos resumen la información de la “muestra” o
serie de datos, dándonos así información acerca de la magnitud del
alejamiento de la distribución de datos en relación a un valor central o
de concentración de los datos.
Características:
Las medidas de dispersión nos sirven para cuantificar la separación de los
valores de una distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor separación
de los valores de la muestra, respecto de las medidas de centralización
que hayamos calculado.
Al calcular una medida de centralización como es la media aritmética,
resulta necesario acompañarla de otra medida que indique el grado de
dispersión, del resto de valores de la distribución, respecto de esta
media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS DE DISPERSIÓN,
pudiendo ser absolutas o relativas
3. Rango
El rango se suele definir como la diferencia entre los dos valores extremos
que toma la variable. Es la medida de dispersión más sencilla y también,
por tanto, la que proporciona menos información. Además, esta
información puede ser errónea, pues el hecho de que no influyan más de
dos valores del total de la serie puede provocar una deformación de la
realidad.
Comparemos, por ejemplo, estas dos series:
Serie 1: 1 5 7 7 8 9 9 10 17
Serie 2: 2 4 6 8 10 12 14 16 18
Ambas series tienen rango 16, pero están desigualmente agrupadas, pues
mientras la primera tiene una mayor concentración en el centro, la
segunda se distribuye uniformemente a lo largo de todo el recorrido.
El uso de esta medida de dispersión, será pues, bastante restringido.
4. Desviaciones típicas
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
Desviación típica para datos agrupados
Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Desviación típica para datos agrupados
Ejemplo:
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la desviación típica de la distribución de la tabla:
Propiedades de la desviación típica:
1 La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por
dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.
5. Varianza
Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la
media, multiplicadas por el número de veces que se ha repetido cada
valor. El sumatorio obtenido se divide por el tamaño de la muestra. La
varianza siempre será mayor que cero. Mientras más se aproxima a cero,
más concentrados están los valores de la serie alrededor de la media. Por
el contrario, mientras mayor sea la varianza, más dispersos están.
6. El coeficiente de variación
Es una medida que se emplea fundamentalmente para:
Comparar la variabilidad entre dos grupos de datos referidos a distintos
sistemas de unidades de medida. Por ejemplo, kilogramos y centímetros.
Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más
personas distintas.
Comparar dos grupos de datos que tienen distinta media.
Determinar si cierta media es consistente con cierta varianza.
El Coeficiente de Variación muestra se denota y se define como:
7. Características Varianza y coeficiente
de variación
1La varianza será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la varianza no
varía.
3 Si todos los valores de la variable se multiplican por un número la varianza
queda multiplicada por el cuadrado de dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos sus
respectivas varianzas se puede calcular la varianza total.
8. Los coeficientes de variación tienen las siguientes características:
Puesto que tanto la desviación estándar como la media se miden en las
unidades originales, el CV es una medida independiente de las unidades de
medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para
comparar la variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos, el
CV es muy usado para evaluar la precisión de un experimento, comparando
en CV del experimento en cuestión con los valores del mismo en
experiencias anteriores.
9. Utilidad Varianza y coeficiente de
variación
El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su
media, por lo que su coeficiente de variación es 1. La distribuciones con un
C.V. menor que uno, como la distribución de Erlang se consideran de "baja
varianza", mientras que aquellas con un C.V. mayor que uno, como la
distribución hiperexponencial se consideran de "alta varianza". Algunas
fórmulas en estos campos se expresan usando el cuadrado del coeficiente
de variación, abreviado como S.C.V. (por su siglas en inglés)