1. Coeficiente de variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la
media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética,
mostrando una mejor interpretación porcentual del grado de variabilidad que la
desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de
la desviación típica este coeficiente es variable ante cambios de origen. Por ello es
importante que todos los valores sean positivos y su media dé, por tanto, un valor
positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los
valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la
variable. Suele representarse por medio de las siglas C.V.
Exigimos que:
Se calcula:
Donde es la desviación típica. Se puede dar en tanto por ciento calculando:
Propiedades y aplicaciones
El coeficiente de variación es típicamente menor que uno u ocho. Sin
embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor
que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica o también llamada "desviación estándar" y
en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy
próxima a este valor C.V. pierde significado, ya que puede dar valores muy
grandes, que no necesariamente implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos
la distribución exponencial es a menudo más importante que
la distribución normal. La desviación típica de una distribución exponencial
es igual a su media, por lo que su coeficiente de variación es 1. La
distribuciones con un C.V. menor que uno, como la distribución de
Erlang se consideran de "baja varianza", mientras que aquellas con un C.V.
2. mayor que uno, como la distribución hiperexponencial se consideran de
"alta varianza". Algunas fórmulas en estos campos se expresan usando
el cuadrado del coeficiente de variación, abreviado como S.C.V. (por su
siglas en inglés)
Hemos visto que las medidas de centralización y dispersión nos dan información
sobre una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes
para comparar dos poblaciones. Por ejemplo, si nos piden comparar la dispersión
de los pesos de las poblaciones de elefantes de dos circos diferentes, nos dará
información útil.
¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto
a su peso? Tanto la media como la desviación típica, y , se expresan en las
mismas unidades que la variable. Por ejemplo, en la variable altura podemos usar
como unidad de longitud el metro y en la variable peso, el kilogramo. Comparar
una desviación (con respecto a la media) medida en metros con otra en kilogramos
no tiene ningún sentido.
El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea
de masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la
masa, de dos poblaciones, pero con distintas unidades. Este es el caso en que
comparamos el peso en toneladas de una población de 100 elefantes con el
correspondiente en miligramos de una población de 50 hormigas.
El problema no se resuelve tomando las mismas escalas para ambas poblaciones.
Por ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades
que los elefantes (toneladas). Si la ingeriería genética no nos sorprende con alguna
barbaridad, lo lógico es que la dispersión de la variable peso de las hormigas sea
prácticamente nula (¡Aunque haya algunas que sean 1.000 veces mayores que
otras!)
En los dos primeros casos mencionados anteriormente, el problema viene de
la dimensionalidad de las variables, y en el tercero de la diferencia enorme entre las
medias de ambas poblaciones. El coeficiente de variaciones lo que nos permite
evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en
cuenta la proporción existente entre medias y desviación típica. Se define del
siguiente modo:
Basta dar una rápida mirada a la definición del coeficiente de variación, para ver
que las siguientes consideraciones deben ser tenidas en cuenta:
3. Sólo se debe calcular para variables con todos los valores positivos. Todo
índice de variabilidad es esencialmente no negativo. Las observaciones
pueden ser positivas o nulas, pero su variabilidad debe ser siempre
positiva. De ahí que sólo debemos trabajar con variables positivas, para la
que tenemos con seguridad que .
No es invariante ante cambios de origen. Es decir, si a los resultados de una
medida le sumamos una cantidad positiva, b>0, para tener Y=X+b,
entonces , ya que la desviación típica no es sensible ante
cambios de origen, pero si la media. Lo contario ocurre si restamos (b<0).
Es invariante a cambios de escala. Si multiplicamos X por una constante a,
para obtener , entonces
Observación
Es importante destacar que los coefientes de variación sirven para comparar las
variabilidades de dos conjuntos de valores (muestras o poblaciones), mientras que
si deseamos comparar a dos individuos de cada uno de esos conjuntos, es necesario
usar los valores tipificados.
Ejemplo
Dada la distribución de edades (medidas en años) en un colectivo de 100 personas,
obtener:
1.
La variable tipificada Z.
2.
Valores de la media y varianza de Z.
3.
Coeficiente de variación de Z.
Horas trabajadas Num. empleados
4. 0 -- 4 47
4 -- 10 32
10 -- 20 17
20 -- 40 4
100
Solución:
Para calcular la variable tipificada
partimos de los datos del enunciado. Será necesario calcular en primer lugar la
media y desvición típica de la variable original (X= años).
li-1 -- li xi ni xi ni xi2 ni
0 -- 4 2 47 94 188
4 -- 10 7 32 224 1.568
10 -- 20 15 17 255 3.825
20 -- 40 30 4 120 3.600
n=100 693 9.181
A partir de estos valores podremos calcular los valores tipificados para las marcas
de clase de cada intervalo y construir su distribución de frecuencias:
5. zi ni zi n i zi2 ni
-0,745 47 -35,015 26,086
0,011 32 0,352 0,004
1,220 17 20,720 25,303
3,486 4 13,944 48,609
n=100 0,021 100,002
A pesar de que no se debe calcular el coeficiente de variación sobre
variables que presenten valores negativos (y Z los presenta), lo
calculamos con objeto de ilustrar el porqué:
El coeficiente de variación permite comparar la dispersión entre dos poblaciones
distintas e incluso, comparar la variación producto de dos variables diferentes
(que pueden provenir de una misma población).
Estas variables podrían tener unidades diferentes, por ejemplo, podremos
determinar si los datos tomados al medir el volumen de llenado de un embase de
cierto líquido varían más que los datos tomados al medir la temperatura de
6. ellíquido contenido en el embase al salir al consumidor. El volumen los mediremos
en centímetros cúbicos y la temperatura en grados centígrados.
El coeficiente de variación elimina la dimensionalidad de las variables y tiene en
cuenta la proporción existente entre una medida de tendencia y la desviación
típica o estándar.
Coeficiente de variación (Cv): Equivale a la razón entre la media
aritmética y la desviación típica o estándar.
o
Si envés de la media aritmética se emplea la mediana, obtendremos el
coeficiente de variación mediana.
Este índice solo se debe calcular para variables con todo los valores positivos, para
dar seguridad de un o mayores a cero (un coeficiente de variación positivo).
Ejemplo: Desviación estándar para datos no agrupados
En un juego de tiro al blanco con escopeta de perdigones por dos participantes a
un tablero, obtienen el siguiente registro después de 15 disparos cada uno.
Determinar el coeficiente de variación para ambos casos.
Disparo f Disparo f
1 6 1 0
2 3 2 7
3 0 3 7
4 3 4 1
5 3 5 0
PASO 1: Calcular las medias aritméticas:
PASO 2: Calcular las varianzas
En este punto, la varianza es identificada por S2.
7. PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.
La puntuación de los disparos se aleja en promedio de la media aritmética en
aproximadamente 1,6818 para el jugador 1 y 0,6325 para el jugador 2.
PASO 4: Calcular el coeficiente de variación.
El menor coeficiente de variación indica que el jugador 2 presento una dispersión
menor de sus puntuaciones respecto a la media, caso contrario al jugador 1 donde
la dispersión fue mayor.
Coeficiente de variación
Las medidas de dispersión que se han estudiado son medidas absolutas yse
expresan en las mismas unidades con las que se mide la variable. Cuando
secomparan dos o más conjuntos de datos con unidades de medida de
observacióndiferentes, no es posible compararlas con estas medidas absolutas. Si
lasunidades de observación de los conjuntos de datos son iguales, estos
puedencompararse usando cualquiera de estos estadísticos (como en el ejemplo
anterior)pero siempre y cuando la media aritmética sea la misma, de lo contrario
estasapreciaciones no aportarán una buena conclusión sobre las series que
secomparan.Para efectuar comparaciones entre series de observaciones distintas,
enestadística se usa el
Coeficiente de variación
y así se puede determinar cuálserie tiene mayor o menor variabilidad relativa.
%100
×=
xsCV
Cuando el coeficiente de variación es muy alto se dice que la media