Este documento explica diferentes medidas de dispersión como el rango, la desviación típica y la varianza. Define cada medida y describe sus propiedades y cómo se calculan. También introduce el coeficiente de variación, el cual mide la variabilidad en relación con la media y permite comparar la dispersión entre conjuntos de datos con diferentes unidades o medias.
El Teatro musical (qué es, cuál es su historia y trayectoria...)
Medidas de dispersión: varianza, desviación típica y coeficiente de variación
1. Republica Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Superior.
Instituto Universitario Politécnico ‘’Santiago Mariño’’.
Ingeniería Industrial
Estadística I
Prof: Ramón Aray
Bachiller: José Macuare.
C.I: 25.262.736
Sección: YV
Barcelona, 24 de junio del 2016
2. Medidas de Dispersión
Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución, indicando
por medio de un número si las diferentes puntuaciones de una
variable están muy alejadas de la media. Cuanto mayor sea ese
valor, mayor será la variabilidad, y cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son
parecidos o varían mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su
media, se calcula la media de las desviaciones de las puntuaciones
respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que se adoptan dos clases de estrategias para
salvar este problema. Una es tomando las desviaciones en valor
absoluto (desviación media) y otra es tomando las desviaciones al
cuadrado (varianza).
3. Características de las medidas
de dispersión.
Las medidas de dispersión nos sirven para cuantificar la
separación de los valores de una distribución.
Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor
separación de los valores de la muestra, respecto de las medidas
de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media
aritmética, resulta necesario acompañarla de otra medida que
indique el grado de dispersión, del resto de valores de la
distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: MEDIDAS DE
DISPERSIÓN, pudiendo ser absolutas o relativas
4. Rango o recorrido.
Es la medida de variabilidad más fácil de calcular. Para datos finitos
o sin agrupar, el rango se define como la diferencia entre el valor
más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un conjunto de
datos.
Rango para datos no agrupados;
R = Xmáx.-Xmín = Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año,
a saber: 18,23, 27,34 y 25., para calcular la media aritmética
(promedio de las edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 años
5. Con datos agrupados no se saben los valores máximos y mínimos.
Si no hay intervalos de clases abiertos podemos aproximar el rango
mediante el uso de los límites de clases. Se aproxima el rango
tomando el limite superior de la última clase menos el limite inferior
de la primera clase.
Rango para datos agrupados;
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
Ejemplo:
6. El rango de la distribución de frecuencias se calcula así:
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
= (93.910 – 7.420) = 86.49
Propiedades del Rango o Recorrido:
- El recorrido es la medida de dispersión más sencilla de calcular e
interpretar puesto que simplemente es la distancia entre los
valores extremos (máximo y mínimo) en una distribución
- Puesto que el recorrido se basa en los valores extremos éste tiende
s ser errático. No es extraño que en una distribución
de datos económicos o comerciales incluya a unos pocos valores en
extremo pequeños o grandes. Cuando tal cosa sucede, entonces el
recorrido solamente mide la dispersión con respecto a esos valores
anormales, ignorando a los demás valores de la variable.
- La principal desventaja del recorrido es que sólo esta influenciado
por los valores extremos,, puesto que no cuenta con los demás
valores de la variable. Por tal razón, siempre existe el peligro de que
el recorrido ofrezca una descripción distorsionada de la dispersión.
- En el control de la calidad se hace un uso extenso del recorrido
cuando la distribución a utilizarse no la distorsionan y cuando
el ahorro del tiempo al hacer los cálculos es un factor de importancia.
7. Desviaciones típicas
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ. Y tiene la siguiente
expresión
Si operamos, podemos obtener la siguiente expresión, que es
mucho más sencilla de operar, y obtenemos menos error de
redondeo
N
nXx
SS ii
2
2
)(
2
22
2
)(
X
n
nx
n
nXx
S iiii
8. Propiedades de la desviación Típica
La desviación típica será siempre un valor positivo o cero, en el
caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la
desviación típica no varía
3 Si todos los valores de la variable se multiplican por
un número la desviación típica queda multiplicada por
dicho número.
4 Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se puede
calcular la desviación típica total.
9. Varianza
La varianza es la media aritmética del cuadrado de las desviaciones
respecto a la media de una distribución estadística.
Varianza para datos agrupados:
Para simplificar el cálculo de la varianza vamos o utilizar las
siguientes expresiones que son equivalentes a las anteriores.
Varianza para datos agrupados
10. Ejemplo: Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza de la distribución de la tabla
11. Propiedades de la varianza.
La varianza será siempre un valor positivo o cero, en el
caso de que las puntuaciones sean iguales.
2 Si a todos los valores de la variable se
les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por
un número la varianza queda multiplicada por
el cuadrado de dicho número.
4 Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas varianzas se puede calcular
la varianza total.
12. Coeficiente de variación
El coeficiente de variación es una medida de dispersión que describe
la cantidad de variabilidad en relación con la media. Puesto que el
coeficiente de variación no se basa en unidades, se puede utilizar en
lugar de la desviación estándar para comparar la dispersión de los
conjuntos de datos que tienen diferentes unidades o diferentes
medias.
Ejemplo:
usted es el inspector de control de calidad de una planta
embotelladora de leche que embotella el producto en recipientes
pequeños y grandes. Usted toma una muestra de cada producto y
observa que el volumen medio de los recipientes pequeños es de
una 1 taza, con una desviación estándar de 0.08 tazas, y el volumen
medio de los recipientes grandes es 1 galón (16 tazas), con una
desviación estándar de 0.4 tazas. Aunque la desviación estándar del
recipiente de un galón es cinco veces mayor que la desviación
estándar del recipiente pequeño, sus coeficientes de variación (COV)
apoyan una conclusión diferente:
13. Recipiente grande Recipiente pequeño
CV = 100 * 0.4 tazas / 16 tazas =
2.5
CV = 100 * 0.08 tazas / 1 tazas =
8
El coeficiente de variación del recipiente pequeño es más de tres veces
mayor que el coeficiente de variación del recipiente grande. En otras
palabras, aunque el recipiente grande tiene una mayor desviación
estándar, el recipiente pequeño presenta una variabilidad mucho mayor
con respecto a su media.
El coeficiente de variación es la relación entre la desviación típica de
una muestra y su media
El coeficiente de variación se suele expresar en porcentajes:
El coeficiente de variación permite comparar las dispersiones de dos
distribuciones distintas, siempre que sus medias sean positivas
Se calcula para cada una de las distribuciones y los valores que se
obtienen se comparan entre sí.