2. Medidas de Dispersión
La Dispersión permite analizar cómo se dispersan los valores de una variable de tipo
intervalo/razón de menor a mayor y la forma gráfica que estos valores presentan. Si
se conoce la media e una población hay distintas posibles formas de distribuir los
valores, e posible que todos estén alrededor de la media o podrín estar sesgados
hacia un lado. Estudiar la dispersión es revisar el eje horizontal y observar donde
están alojados los datos.
Entonces los Estadísticos de Dispersión o Medidas de Dispersión describen como se
dispersan los datos de una variable a lo largo de su distribución. Las Medidas de
Dispersión son: el Rango, la Desviación Estándar y la Varianza.
3. Características
Las medidas de dispersión nos sirven para cuantificar la separación de los valores de
una distribución.
Llamaremos dispersión o variabilidad, a la mayor o menor separación de los valores
de la muestra, respecto de las medidas de centralización que hayamos calculado.
Al calcular una medida de centralización como es la media aritmética, resulta
necesario acompañarla de otra medida que indique el grado de dispersión, del resto
de valores de la distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: medidas de dispersión, pudiendo ser
absolutas o relativas
4. Usos
Tanto las unas como las otras, son medidas que se toman para tener la posibilidad de
establecer comparaciones de diferentes muestras, para las cuales son conocidas y a
medidas que se tienen como típicas en su clase. Por ejemplo: Si se conoce el valor
promedio de los aprobados en las universidades venezolanas, y al estudiar una
muestra de los resultados de los exámenes de alguna Universidad en particular, se
encuentra un promedio mayor, o menor, del ya establecido; se podrá juzgar el
rendimiento de dicha institución.
5. Rango
Rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el
rango se define como la diferencia entre el valor más alto (Xn ó Xmax.) y el más bajo
(X1 ó Xmin) en un conjunto de datos.
Rango para datos no agrupados;
R = Xmáx.-Xmín = Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23,
27,34 y 25., para calcular la media aritmética (promedio de las edades, se tiene que:
6. Desviaciones Típicas
R = Xn-X1 ) = 34-18 = 16 años
Con datos agrupados no se saben los valores máximos y mínimos. Si no hay
intervalos de clases abiertos podemos aproximar el rango mediante el uso de los
límites de clases. Se aproxima el rango tomando el límite superior de la última clase
menos el límite inferior de la primera clase.
Rango para datos agrupados;
R= (lim. Sup. de la clase n – lim. Inf. De la clase 1)
Es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en
la estadística descriptiva. Es una medida (cuadrática) de lo que se apartan los datos de su media, y por
tanto, se mide en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas
7. Varianza y coeficiente de variación
de tendencia central, sino que necesitamos conocer también la desviación que
representan los datos en su distribución, con objeto de tener una visión de los
mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la
toma de decisiones.
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de referencia es
la media aritmética de la distribución. Más específicamente, la varianza es una medida de que tan cerca,
o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi
de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es
la varianza.
El Coeficiente de variación (CV) es una medida de la dispersión relativa de un conjunto de datos, que se
obtiene dividiendo la desviación estándar del conjunto entre su media aritmética y se expresa como para
una muestra y para la población.
Los coeficientes de variación tienen las siguientes características:
8. Utilidad Estadística
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar la
variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos previos, el CV es
muy usado para evaluar la precisión de un experimento, comparando en CV del
experimento en cuestión con los valores del mismo en experiencias anteriores.
Su utilidad radica en que podemos determinar que tanta variabilidad existe entre dos muestra en las que
inclusive la información no tienen las mismas unidades o se trata de datos diferentes. En el siguiente
ejemplo se muestra la utilidad del coeficiente de variación