2. Medidas de Dispersión
Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto
menor sea, más homogénea será a la media. Así se sabe si todos
los casos son parecidos o varían mucho entre ellos.
3. Características de das medidas de
dispersión
A. Las medidas de dispersión nos sirven para cuantificar la
separación de los valores de una distribución.
B. Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o
menor separación de los valores de la muestra, respecto de
las medidas de centralización que hayamos calculado.
C. Al calcular una medida de centralización como es la
media aritmética, resulta necesario acompañarla de otra
medida que indique el grado de dispersión, del resto de
valores de la distribución, respecto de esta media.
D. A estas cantidades o coeficientes, les llamamos:
MEDIDAS DE DISPERSIÓN, pudiendo ser absolutas o
relativas
4. Usos de las medidas de dispersión
Tanto las unas como las otras, son medidas que se
toman para tener la posibilidad de establecer comparaciones de
diferentes muestras, para las cuales son conocidas a medida
que se tienen como típicas en su clase. Por ejemplo si se
conoce el valor promedio de los aprobados en las universidades
venezolanas, y al estudiar una muestra de los resultados de los
exámenes de alguna universidad en particular, se encuentra un
promedio mayor, o menor, del establecido; se podrá juzgar el
rendimiento de dicha institución.
5. Estas medidas permiten evaluar la confiabilidad del
valor del dato central de un conjunto de datos, siendo la
media aritmética el dato central más utilizado. Cuando existe
una dispersión pequeña se dice que los datos están dispersos
o acumulados cercanamente respecto a un valor central, en
este caso el dato central es un valor muy representativo. En el
caso que la dispersión sea grande el valor central no es muy
confiable. Cuando una distribución de datos tiene poca
dispersión toma el nombre de distribución homogénea y si su
dispersión es alta se llama heterogénea
Utilidad de las medidas de dispersión
6. Rango
El rango se suele definir como la diferencia entre los dos
valores extremos que toma la variable. Es la medida de
dispersión más sencilla y también, por tanto, la que
proporciona menos información. Además, esta
información puede ser errónea, pues el hecho de que no
influyan más de dos valores del total de la serie puede
provocar una deformación de la realidad.
Características
Suministra información de los extremos de la variable Informa
sobre la distancia entre el mínimo y el máximo valor observado.
Se limita su uso a una información inicial X min X max R x
Utilidad Estadística
El rango señala la amplitud de la variación de un fenómeno entre
su límite menor y uno claramente mayor
7. Desviaciones típicas
La desviación típica se representa por σ.
La desviación típica es la raíz cuadrada de la varianza y
se representa por la letra σ. Para calculara se calcula la
varianza y se saca la raíz. Las interpretaciones que se deducen
de la desviación típica son, por lo tanto, parecidas a las que se
deducían de la varianza.
Comparando con el mismo tipo de datos, una desviación típica
elevada significa que los datos están dispersos, mientras que
un valor bajo indica que los valores son próximos los unos de
los otros, y por lo tanto de la media.
8. Características de las desviaciones
típicas
La desviación típica será siempre un valor positivo o
cero, en el caso de que las puntuaciones sean
iguales.
Si a todos los valores de la variable se les suma un
número la desviación típica no varía.
Si todos los valores de la variable se multiplican
por un número la desviación típica queda
multiplicada por dicho número.
Si tenemos varias distribuciones con la misma
media y conocemos sus respectivas desviaciones
típicas se puede calcular la desviación típica total
9. Esta medida nos permite determinar el promedio
aritmético de fluctuación de los datos respecto a su punto
central o media. La desviación estándar nos da como
resultado un valor numérico que representa el promedio de
diferencia que hay entre los datos y la media. Para calcular
la desviación estándar basta con hallar la raíz cuadrada de la
varianza, por lo tanto su ecuación sería:
S = √S
Utilidad de las desviaciones típicas
10. Varianza
La varianza de unos datos es la media aritmética del
cuadrado de las desviaciones respecto a la media de la misma. Se
simboliza como σ2 y se calcula aplicando la fórmula
Del mismo modo que para la media, no siempre será posible
encontrar la varianza, y es un parámetro muy sensible a las
puntuaciones extremas. Se puede observar que al estar la desviación
elevada al cuadrado, la varianza no puede tener las mismas unidades
que los datos.
Comparando con el mismo tipo de datos, un varianza elevada
significa que los datos están más dispersos. Mientras que un valor de
la varianza bajo indica que los valores están por lo general más
próximos a la media.
Un valor de la varianza igual a cero implica que todos los
valores son iguales, y por lo tanto también coinciden con la media
aritmética.
11. Características
Una de las características de la varianza es que viene
expresada en unidades cuadráticas respecto de las unidades
originales de la variable.
Utilidad Estadística
Nos permite saber y determinar qué es normal, qué es
grande, qué es pequeño, aquello que es extra grande o bien
aquello que es extra pequeño
12. Coeficiente de variación
Las dos distribuciones cuyo histograma se ha representado,
tienen la misma media, pero desviaciones típicas diferentes.
Observa que cuanto menor es la desviación más apuntado
es el histograma.
También puede ocurrir que dos distribuciones tengan la
misma desviación típica pero las dispersiones sean totalmente
diferentes, por eso definimos el coeficiente de desviación, utilizado
para comparar las dispersiones de dos variables estadísticas que
vienen expresadas en distintas unidades.
Es el cociente entre la desviación típica y la media y
habitualmente se expresa en porcentaje.
Cuanto más pequeño sea el coeficiente de variación más
concentrados estarán los datos alrededor de la media.
13. Características de Coeficiente de
variación
Puesto que tanto la desviación estándar como la media
se miden en las unidades originales, el CV es una medida
independiente de las unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más
adecuada para comparar la variabilidad de dos conjuntos de
datos.
En áreas de investigación donde se tienen datos de
experimentos previos, el CV es muy usado para evaluar la
precisión de un experimento, comparando en CV del
experimento en cuestión con los valores del mismo en
experiencias anteriores. Utilidad
Estadística
Su utilidad radica en que podemos determinar que tanta
variabilidad existe entre dos muestra en las que inclusive la
información no tienen las mismas unidades o se trata de datos
diferentes. En el siguiente ejemplo se muestra la utilidad del
coeficiente de variación