Las medidas de dispersión como la varianza, desviación estándar y coeficiente de variación miden cuánto se dispersan los valores de una serie de datos respecto a su media. La varianza mide la distancia promedio de cada valor a la media, la desviación estándar es la raíz cuadrada de la varianza, y el coeficiente de variación relaciona la desviación estándar con la media de manera adimensional.
1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación Superior
Instituto Universitario Politécnico “Santiago Mariño”
Sede – Barcelona
Profesor
Pedro Beltrán
Nombre
Paola Santos CI 26.520.174
Sección CV
2. Estudia la distribución de los valores de la serie, analizando si estos se encuentran
más o menos concentrados, o más o menos dispersos.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar
las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor más elevado y el valor más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.
3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.
4.- Coeficiente de varización de Pearson: se calcula como cociente entre la
desviación típica y la media.
3. Medidas de Dispersión:
Las medidas de dispersión vienen a abundar más en el estudio estadístico,
al proporcionar los medios de averiguar el grado en que dichos datos se separan o
varían, esto con respecto al valor central, el cual es obtenido por medio delas medidas
de tendencia central, es decir que nos dicen el grado de variación o de dispersión de
los datos de la muestra, y configuran toda una disciplina que es conocida por el
nombre de Teoría de la dispersión.
Usos de las Medidas de Dispersión:
Tanto las unas como las otras, son medidas que se toman para tener la posibilidad de
establecer comparaciones de diferentes muestras, para las cuales son conocidas ya
medidas que se tienen como típicas en su clase. Por ejemplo: Si se conoce el valor
promedio de los aprobados en las universidades venezolanas, y al estudiar una
muestra de los resultados de los exámenes de alguna Universidad en particular, se
encuentra un promedio mayor, o menor, del ya establecido; se podrá juzgar el
rendimiento de dicha institución.
4. Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin
agrupar, el rango se define como la diferencia entre el valor más alto (Xn o
Xmax.) y el más bajo(X1 o Xmín) en un conjunto de datos
Rango para datos no agrupados;
R = Xmáx.-Xmín= Xn-X1
Ejemplo:
a. Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber:
18,23, 27,34 y 25., para calcular la media aritmética (promedio delas edades,
se tiene que:
R = Xn-X1) = 34-18 = 16 años
b. Con datos agrupados no se saben los valores máximos y mínimos. Si no
hay intervalos de clases abiertos podemos aproximar el rango mediante el uso
de los límites de clases. Se aproxima el rango tomando el límite superior de la
última clase menos el límite inferior de la primera clase
Rango para datos agrupados;
R= (lim. Sup. De la clase n ± lim. Inf. De la clase 1)
5. La desviación estándar (o desviación típica) es una medida de dispersión para variables de
razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una
medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide en las
mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan los
datos en su distribución, con objeto de tener una visión de los mismos más acorde con la
realidad a la hora de describirlos e interpretarlos para la toma de decisiones.
Desviación estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos
respecto a su punto central o media. La desviación estándar nos da como resultado
un valor numérico que representa el promedio de diferencia que hay entre los datos y la
media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza,
por lo tanto su ecuación sería: S= a la raíz de S elevado al cuadrado.
6. EJEMPLO
1.-El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los
empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar
cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490,
500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con
una tendencia a variar por debajo o por encima de dicho peso en 12 gramos.
Esta información le permite al gerente determinar cuanto es el promedio de perdidas
causado por el exceso de peso en los empaques y le da las bases para tomar los
correctivos necesarios en el proceso de empacado.
7. A veces, los analistas investigan la variabilidad de una población, en lugar de su media
o proporción.
Esto es debido a que la uniformidad de la producción muchas veces es crítica en la
práctica industrial.
La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hipótesis
está diseñada para determinar si la varianza de una población es igual a algún valor
predeterminado.
La desviación estándar de una colección de datos se usa para describir la variabilidad
en esa colección y se puede definir como la diferencia estándar entre los elementos de
una colección de datos y su media.
La varianza de un conjunto de datos se define como el cuadrado de su desviación
estándar; y la varianza maestral se utiliza para probar la hipótesis nula que se refiere a
la variabilidad y es útil para entender el procedimiento de análisis de la varianza.
La hipótesis nula; para la prueba de la varianza, es que la varianza poblacional es igual
a algún valor previamente especificado. Como el aspecto de interés, por lo general es si
la varianza de la población es mayor que este valor, siempre se aplica una de una cola.
Para probar la hipótesis nula, se toma una muestra aleatoria de elementos de una
población que se investiga; y a partir de esos datos, se calcula el estadístico de prueba.
8. Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los
valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada
una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y
calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias
de cada valor respecto a la media y dividiendo este resultado por el número de
observaciones que se tengan. Si la varianza es calculada a una población (Total de
componentes de un conjunto).
9. Las medidas de dispersión anteriores son todas medidas de variación absolutas. Una
medida de dispersión relativa de los datos, que toma en cuenta su magnitud, está dada por
el coeficiente de variación.
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de
datos, que se obtiene dividiendo la desviación estándar del conjunto entre su media
aritmética y se expresa como para una muestra y para la población.
Los coeficientes de variación tienen las siguientes características:
Puesto que tanto la desviación estándar como la media se miden en las unidades originales,
el CV es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos, el CV es muy
usado para evaluar la precisión de un experimento, comparando en CV del experimento en
cuestión con los valores del mismo en experiencias anteriores.
Su formula es:
10. - Puesto que tanto la desviación
estándar como la media se miden en
las unidades originales, el CV es una
medida independiente de las
unidades de medición.
- Debido a la propiedad anterior
el CV es la cantidad más adecuada
para comparar la variabilidad de
dos conjuntos de datos.