Este documento describe diferentes medidas de dispersión como la varianza, desviación típica y coeficiente de variación. Explica que estas medidas cuantifican cuán separados están los valores de una distribución con respecto a su valor central. También describe las propiedades de la varianza y desviación típica, como que miden la variabilidad de los datos de manera óptima. Finalmente, ofrece fórmulas para calcular la varianza, desviación típica y coeficiente de variación.
Las medidas de dispersión vienen a abundar más en el estudio estadístico, al proporcionar los medios de averiguar el grado en que dichos datos se separan o varían, esto con respecto al valor central, el cual es obtenido por medio de las medidas de tendencia central, es decir que nos dicen el grado de variación o de dispersión de los datos de la muestra, y configuran toda una disciplina que es conocida por el nombre de “Teoría de la dispersión”
1. PROFESOR: PEDRO BELTRÁN .
. ALUMNO: PEDRO ARAGUACHE
. C.I.: 15.249.193
BARCELONA; 22/06/2015
República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
Barcelona-Edo. Anzoátegui.
2. MEDIDAS DE DISPERSION
Las medidas que hasta ahora conocemos, medias, moda, percentiles, etc., tienen todas
ellas la propiedad de ubicarse siempre entre los dos valores extremos de los datos, mínimo y
máximo, pues indican posición, bien sea central, o bien sea extrema como por ejemplo el
percentil 5 , o el percentil 95.Las medidas que van a ser estudiadas en este capítulo no gozan
de esta propiedad, y persiguen como objetivo describir la homogeneidad o heterogeneidad de
los datos.
Las medidas de tendencia central son insuficientes para describir el comportamiento de
los datos, pues no proporcionan información acerca de cuan cerca o cuan lejos se encuentran
estos datos, con relación a ese valor central. Así por ejemplo el trío de datos {8 ,9 , 10 } y { 1 ,
10 , 16 } tienen ambos media 9; pero resulta obvio, que en el primero de ellos existe una menor
desviación con respecto a este valor central, que en el segundo. Medir la variabilidad resulta
muy importante en diversas situaciones prácticas, pues a través de su medición se podrán
comparar conjuntos de datos, y establecer cuando existe una mayor concentración de ellos en
la región central. Así por ejemplo, en estudios sociales las medidas de dispersión proporcionan
la información requerid a para analizar como es la distribución de los ingresos dentro de la
sociedad; en los estudios de calidad industrial, estas mismas medidas de dispersión se utilizan
para medir la precisión de las máquinas utilizadas en el proceso de producción.
Carcateristicas de Medidas de Dispersión
Las medidas de dispersión nos sirven para cuantificar la separación de los valores de una
distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor separación de los valores de
la muestra, respecto de las medidas de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media aritmética, resulta necesario
acompañarla de otra medida que indique el grado de dispersión, del resto de valores de la
distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS DE DISPERSIÓN, pudiendo ser
absolutas o relativas
3. Varianza y Desviación Típica:
Cuando se tiene un conjunto de datos { x1, x2,x3,......, xn} sin agrupar, se define como
desvío de cada dato con relación a su media aritmética , a la diferencia : di= xi-.Aunque
los desvíos pueden ser calculados respecto de cualquier valor, salvo que se indique lo
contrario, se sobreentiende que estos se calculan respecto de X, y como sabemos, la
suma de sus cuadrados es mínima, cuando estos desvíos se calculan respecto de la
media aritmética Cuanto mayor sea este desvío, mas alejado se encuentra el dato xi de X.
Estos desvíos pueden ser positivos o negativos, según el dato xi se encuentre a la
derecha o la izquierda de X, y su suma algebraica da siempre cero. En consecuencia, no
se puede tomar al promedio de los desvíos como medida de dispersión, debido a que este
promedio sería siempre nulo. El problema del signo de los desvíos puede ser resuelto de
dos maneras, o bien tomando su valor absoluto, o como segunda opción elevándolos al
cuadrado. Para definir la varianza, se adopta esta segunda alternativa.
La varianza de un conjunto de datos cuantitativos { x1, x2,x3, ......, xn} sin agrupar, se
define como la media aritmética del cuadrado de sus desvíos.
4. Propiedades de la varianza :
1ª.- Es siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente cuando
2ª.- La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
3ª.- Si a todos los valores de la variable se le suma una constante la varianza no se modifica. Veámoslo:
Si a xi le sumamos una constante xi’ = xi + k tendremos (sabiendo que )
4ª.- Si todos los valores de la variable se multiplican por una constante la varianza queda multiplicada por
el cuadrado de dicha constante. Veámoslo:
Si a xi’ = xi · k tendremos (sabiendo que )
5ª.- Si en una distribución obtenemos una serie de subconjuntos disjuntos, la varianza de la distribución inicial
se relaciona con la varianza de cada uno de los subconjuntos mediante la expresión
Siendo
Ni el nº de elementos del subconjunto (i)
S2i la varianza del subconjunto (i)
5. Rango
Es el intervalo entre el valor máximo y el valor mínimo; por ello,
comparte unidades con loobtener una idea de la dispersión de los
datos, cuanto mayor es el rango, más dispersos están los datos de un
conjunto.
Por ejemplo, para una serie de datos de carácter cuantitativo, como lo
es la estatura medida en centímetros, tendríamos:
es posible ordenar los datos como sigue:
donde la notación x(i) indica que se trata del elemento i-ésimo de la serie
de datos. De este modo, el rango sería la diferencia entre el valor
máximo (k) y el mínimo; o, lo que es lo mismo:
En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30.
6. Propiedades de la desviación típica
A su vez la desviación típica, también tiene una serie de propiedades
que se deducen fácilmente de las de la varianza (ya que la desviación
típica es la raíz cuadrada de la varianza):
1ª.- La desviación típica es siempre un valor no negativo S será
siempre 0 por definición. Cuando S = 0 X = xi (para todo i).
2ª.- Es la medida de dispersión óptima por ser la más pequeña.
3ª.- Si a todos los valores de la variable se le suma una misma
constante la desviación típica no varía.
4ª.- Si a todos los valores de la variable se multiplican por una misma
constante, la desviación típica queda multiplicada por el valor absoluto
de dicha constante.
7. Desviaciones Típicas
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
8. Coeficiente de variación
Es cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad
de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando
una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por
otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable
ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por
tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores
de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse
por medio de las siglas C.V.
Se calcula:
Donde es la desviación típica. Se puede dar en tanto por ciento calculando: