1. República Bolivariana de Venezuela
Instituto Universitario Politécnico “Santiago Mariño”
Sede-Barcelona
ING. Industrial
Profesor: Bachiller:
Chivico Darielys
C.I:25.313.308
Barcelona, junio del 2016
2. Medidas de Dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad,
muestran la variabilidad de una distribución, indicando por medio de un número
si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos
o varían mucho entre ellos. Para calcular la variabilidad que una distribución
tiene respecto de su media, se calcula la media de las desviaciones de las
puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones
es siempre cero, así que se adoptan dos clases de estrategias para salvar este
problema. Una es tomando las desviaciones en valor absoluto (desviación
media) y otra es tomando las desviaciones al cuadrado (varianza).
Característicasde las medidas de dispersión
Las medidas de dispersión nos sirven para cuantificar la separación de los
valores de una distribución. Llamaremos DISPERSIÓN O VARIABILIDAD, a la
mayor o menor separación de los valores de la muestra, respecto de las
medidas de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media aritmética,
resulta necesario acompañarla de otra medida que indique el grado de
dispersión, del resto de valores de la distribución, respecto de esta media. A
estas cantidades o coeficientes, les llamamos: MEDIDAS DE DISPERSIÓN,
pudiendo ser absolutas o relativas.
Rango
Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Desviación típica
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la
variable. Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer también la
desviación que presentan los datos en su distribución respecto de la media
aritmética de dicha distribución, con objeto de tener una visión de los mismos
3. más acorde con la realidad al momento de describirlos e interpretarlos para la
toma de decisiones.
La desviación típica es una medida del grado de dispersión de los datos con
respecto al valor promedio. Dicho de otra manera, la desviación estándar es
simplemente el "promedio" o variación esperada con respecto a la aritmética.
Por ejemplo, las tres poblaciones (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada
una tiene una media de 7. Sus desviaciones estándar poblacionales son 7, 5 y
1, respectivamente. La tercera población tiene una desviación mucho menor
que las otras dos porque sus valores están más cerca de 7.
La desviación estándar puede ser interpretada como una medida de
incertidumbre. La desviación estándar de un grupo repetido de medidas nos da
la precisión de éstas. Cuando se va a determinar si un grupo de medidas está
de acuerdo con el modelo teórico, la desviación estándar de esas medidas es
de vital importancia: si la media de las medidas está demasiado alejada de la
predicción (con la distancia medida en desviaciones estándar), entonces
consideramos que las medidas contradicen la teoría. Esto es coherente, ya que
las mediciones caen fuera del rango de valores en el cual sería razonable
esperar que ocurrieran si el modelo teórico fuera correcto. La desviación
estándar es uno de tres parámetros de ubicación central; muestra la
agrupación de los datos alrededor de un valor central (la media o promedio).
Coeficiente de variación
En estadística, cuando se desea hacer referencia a la relación entre el tamaño
de la media y la variabilidad de la variable, se utiliza el coeficiente de variación.
Su fórmula expresa la desviación estándar como porcentaje de la media
aritmética, mostrando una mejor interpretación porcentual del grado de
variabilidad que la desviación típica o estándar. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen.
Por ello es importante que todos los valores sean positivos y su media dé, por
tanto, un valor positivo. A mayor valor del coeficiente de variación mayor
heterogeneidad de los valores de la variable; y a menor C.V., mayor
homogeneidad en los valores de la variable. Suele representarse por medio de
las siglas C.V.
Propiedadesy aplicaciones DelCoeficiente de Variación
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo,
en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar",
y en mayor medida de la media aritmética, dado que cuando ésta es 0 o
muy próxima a este valor el C.V. pierde significado, ya que puede dar
4. valores muy grandes, que no necesariamente implican dispersión de
datos.
El coeficiente de variación es común en varios campos de la
probabilidad aplicada, como teoría de renovación y teoría de colas. En
estos campos la distribución exponencial es a menudo más importante
que la distribución normal. La desviación típica de una distribución
exponencial es igual a su media, por lo que su coeficiente de variación
es 1. La distribuciones con un C.V. menor que uno, como la distribución
de Erlang se consideran de "baja varianza", mientras que aquellas con
un C.V. mayor que uno, como la distribución hiperexponencial se
consideran de "alta varianza". Algunas fórmulas en estos campos se
expresan usando el cuadrado del coeficiente de variación, abreviado
como S.C.V. (por sus siglas en inglés).
Varianza
En teoría de probabilidad, la varianza (que suele representarse como ) una
variable aleatoria es una medida de dispersión definida como la esperanza del
cuadrado de la desviación de dicha variable respecto a su media.
Está medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si
la variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una
medida de dispersión alternativa expresada en las mismas unidades de los
datos del variable objeto de estudio. La varianza tiene como valor mínimo
0.Hay que tener en cuenta que la varianza puede verse muy influida por los
valores atípicos y no se aconseja su uso cuando las distribuciones de las
variables aleatorias tienen colas pesadas. En tales casos se recomienda el uso
de otras medidas de dispersión más robustas.
Características:
Una de las características de la varianza es que viene expresada en unidades
cuadráticas respecto de las unidades originales de la variable. Un parámetro de
dispersión derivado de la varianza y que tiene las mismas unidades de la
variable aleatoria es la desviación típica, que se define como la raíz cuadrada
de la varianza.
Utilidad de la Varianza
La principal función y utilidad que se le puede encontrar a la varianza es que
nos permite saber y determinar qué es normal, qué es grande, qué es pequeño,
aquello que es extra grande o bien aquello que es extra pequeño.