2. Medidas de Dispersión
Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución, indicando por
medio de un número, si las diferentes puntuaciones de una variable están
muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la
variabilidad, cuanto menor sea, más homogénea será a la media. Así se
sabe si todos los casos son parecidos o varían mucho entre ellos.
3. Características de das medidas de dispersión
A. Las medidas de dispersión nos sirven para cuantificar la
separación de los valores de una distribución.
B. Llamaremos DISPERSIÓN O VARIABILIDAD, a la mayor o menor
separación de los valores de la muestra, respecto de las medidas de
centralización que hayamos calculado.
C. Al calcular una medida de centralización como es la media
aritmética, resulta necesario acompañarla de otra medida que indique
el grado de dispersión, del resto de valores de la distribución,
respecto de esta media.
D. A estas cantidades o coeficientes, les llamamos: MEDIDAS DE
DISPERSIÓN, pudiendo ser absolutas o relativas
4. Usos de las medidas de dispersión
Tanto las unas como las otras, son medidas que se toman para
tener la posibilidad de establecer comparaciones de diferentes
muestras, para las cuales son conocidas a medida que se tienen como
típicas en su clase. Por ejemplo si se conoce el valor promedio de los
aprobados en las universidades venezolanas, y al estudiar una muestra
de los resultados de los exámenes de alguna universidad en particular,
se encuentra un promedio mayor, o menor, del establecido; se podrá
juzgar el rendimiento de dicha institución.
5. Estas medidas permiten evaluar la confiabilidad del valor del
dato central de un conjunto de datos, siendo la media aritmética el dato
central más utilizado. Cuando existe una dispersión pequeña se dice
que los datos están dispersos o acumulados cercanamente respecto a
un valor central, en este caso el dato central es un valor muy
representativo. En el caso que la dispersión sea grande el valor central
no es muy confiable. Cuando una distribución de datos tiene poca
dispersión toma el nombre de distribución homogénea y si su
dispersión es alta se llama heterogénea
Utilidad de las medidas de dispersión
6. Rango
El rango se suele definir como la diferencia entre los dos
valores extremos que toma la variable. Es la medida de
dispersión más sencilla y también, por tanto, la que proporciona
menos información. Además, esta información puede ser
errónea, pues el hecho de que no influyan más de dos valores
del total de la serie puede provocar una deformación de la
realidad.
Características
Suministra información de los extremos de la variable Informa
sobre la distancia entre el mínimo y el máximo valor observado. Se limita
su uso a una información inicial X min X max R x
Utilidad Estadística
El rango señala la amplitud de la variación de un fenómeno entre
su límite menor y uno claramente mayor
7. Desviaciones típicas
La desviación típica se representa por σ.
La desviación típica es la raíz cuadrada de la varianza y se
representa por la letra σ. Para calculara se calcula la varianza y se saca
la raíz. Las interpretaciones que se deducen de la desviación típica son,
por lo tanto, parecidas a las que se deducían de la varianza.
Comparando con el mismo tipo de datos, una desviación típica elevada
significa que los datos están dispersos, mientras que un valor bajo
indica que los valores son próximos los unos de los otros, y por lo tanto
de la media.
8. Características de las desviaciones típicas
La desviación típica será siempre un valor positivo o cero,
en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un
número la desviación típica no varía.
Si todos los valores de la variable se multiplican por un
número la desviación típica queda multiplicada por dicho
número.
Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se puede
calcular la desviación típica total
9. Esta medida nos permite determinar el promedio aritmético
de fluctuación de los datos respecto a su punto central o media. La
desviación estándar nos da como resultado un valor numérico que
representa el promedio de diferencia que hay entre los datos y la
media. Para calcular la desviación estándar basta con hallar la raíz
cuadrada de la varianza, por lo tanto su ecuación sería:
S = √S
Utilidad de las desviaciones típicas
10. Varianza
La varianza de unos datos es la media aritmética del cuadrado de
las desviaciones respecto a la media de la misma. Se simboliza como σ2 y
se calcula aplicando la fórmula
Del mismo modo que para la media, no siempre será posible encontrar
la varianza, y es un parámetro muy sensible a las puntuaciones extremas. Se
puede observar que al estar la desviación elevada al cuadrado, la varianza no
puede tener las mismas unidades que los datos.
Comparando con el mismo tipo de datos, un varianza elevada significa
que los datos están más dispersos. Mientras que un valor de la varianza bajo
indica que los valores están por lo general más próximos a la media.
Un valor de la varianza igual a cero implica que todos los valores son
iguales, y por lo tanto también coinciden con la media aritmética.
11. Características
Una de las características de la varianza es que viene expresada
en unidades cuadráticas respecto de las unidades originales de la variable.
Utilidad Estadística
Nos permite saber y determinar qué es normal, qué es grande,
qué es pequeño, aquello que es extra grande o bien aquello que es extra
pequeño
12. Coeficiente de variación
Las dos distribuciones cuyo histograma se ha representado, tienen
la misma media, pero desviaciones típicas diferentes.
Observa que cuanto menor es la desviación más apuntado es el
histograma.
También puede ocurrir que dos distribuciones tengan la misma
desviación típica pero las dispersiones sean totalmente diferentes, por eso
definimos el coeficiente de desviación, utilizado para comparar las
dispersiones de dos variables estadísticas que vienen expresadas en
distintas unidades.
Es el cociente entre la desviación típica y la media y habitualmente
se expresa en porcentaje.
Cuanto más pequeño sea el coeficiente de variación más
concentrados estarán los datos alrededor de la media.
13. Características de Coeficiente de variación
Puesto que tanto la desviación estándar como la media se miden
en las unidades originales, el CV es una medida independiente de las
unidades de medición.
Debido a la propiedad anterior el CV es la cantidad más
adecuada para comparar la variabilidad de dos conjuntos de datos.
En áreas de investigación donde se tienen datos de experimentos
previos, el CV es muy usado para evaluar la precisión de un
experimento, comparando en CV del experimento en cuestión con los
valores del mismo en experiencias anteriores.
Utilidad Estadística
Su utilidad radica en que podemos determinar que tanta
variabilidad existe entre dos muestra en las que inclusive la información no
tienen las mismas unidades o se trata de datos diferentes. En el siguiente
ejemplo se muestra la utilidad del coeficiente de variación