Este documento explica las medidas de dispersión, que indican cuán dispersos están los datos en relación con un valor central como la media. Describe la varianza, desviación estándar, rango y coeficiente de variación, y cómo cada una mide la dispersión de una distribución de datos de manera diferente. También explica que las medidas de dispersión son útiles para tomar decisiones basadas en estadísticas al mostrar la variabilidad de los datos en relación con medidas de tendencia central.
libro grafismo fonético guía de uso para el lenguaje
Medidas dispersión datos indican alejan media
1. Instituto Universitario Politécnico Santiago Marino
Sede Barcelona, Edo. Anzoátegui
Estadística
Medidas de dispersión
Bachiller: Miguel Reina
V-20.202.540
2. ¿Que son las medidas de dispersión?
Las medidas de dispersión indican cuán esparcidos se
encuentran los datos, y nos permiten apreciar la distancia que existe
entre los datos a un cierto valor central. En otras palabras, permiten
estimar cuán dispersas están dos o más distribuciones de datos.
Las medidas de dispersión nos informan sobre cuánto se alejan
del centro los valores de la distribución.
Para calcular la variabilidad que una distribución tiene respecto
de su media, se calcula la media de las desviaciones de las
puntuaciones respecto a la media aritmética. Pero la suma de las
desviaciones es siempre cero, así que se adoptan dos clases de
estrategias para salvar este problema. Una es tomando las desviaciones
en valor absoluto y otra es tomando las desviaciones al cuadrado.
3. Varianza
La varianza es la media aritmética de los cuadrados de las
desviaciones respecto a la media aritmética, es decir, es el promedio de
las desviaciones de la media elevadas al cuadrado. La varianza es un
número muy grande con respecto a las observaciones, por lo que con
frecuencia se vuelve difícil para trabajar.
La varianza siempre será mayor que cero. Mientras más se aproxima a
cero, más concentrados están los valores de la serie alrededor de la
media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.
4. Desviación estándar o típica
Es la raíz de la varianza. O sea, la raíz cuadrada de la media de los
cuadrados de las puntuaciones de desviación.
Se representa por:
• La desviación estándar será siempre un valor positivo o cero, en el
caso de que las puntuaciones sean iguales.
• Si a todos los valores de la variable se
les suma un número la desviación estándar no varía.
5. Por ejemplo, si tenemos una producción de franelas y sabemos
que diariamente se producen un promedio de 500 franelas,
adicionalmente tenemos también que la desviación es de 25 franelas,
tendremos entonces una mejor comprensión del proceso pues este
último número nos indica que diariamente se producen entre 475 y
525 franelas.
• La varianza al igual que la desviación estándar proporciona una
medida sobre el punto hasta el cual se dispersan las observaciones
alrededor de su media aritmética.
• Además indican el grado en que están dispersos los datos en una
distribución. A mayor medida, mayor dispersión.
6. Por ejemplo:
Si se calcula la varianza de una distribución de datos medidos en
metros, segundos, dólares, etc, se obtendrá una varianza mediada en
metros cuadrados, segundos cuadrados, dólares cuadrados,
respectivamente, unidades de medida que no tienen significado lógico
respecto a los datos originales.
Para solucionar las complicaciones que se tiene con la varianza,
se halla la raíz cuadrada de la misma, es decir, se calcula la desviación
estándar, la cual es un número pequeño expresado en unidades de los
datos originales y que tiene un significado lógico respeto a los mismos.
• La varianza es siempre positiva o 0:
7. Rango
Es la diferencia entre el máximo y mínimo valor de una serie de
datos y nos da una vaga referencia a la posible dispersión que se puede
tener de los datos.
El rango se calcula sacando la diferencia del Dato más alto - Dato más
pequeño.
( X2 - X1 )
Ejemplo: Si tenemos una producción de franelas y sabemos que
diariamente se producen un promedio de 500 franelas, y si un día se
produce un mínimo de 415 franelas y otro día se produce un máximo
de 573 franelas entonces si vemos el RANGO de producción estará
entre 158 franelas, es decir, podemos tener una producción de 158
franelas a partir del valor mínimo.
8. Coeficiente de variación de Pearson
Se calcula como cociente entre la desviación típica y la media. Mide la
variabilidad relativa a la Media. Expresa la proporción de variabilidad de una
característica por cada unidad de la Media.
El interés del coeficiente de variación es que al ser un porcentaje permite
comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación
típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Caracteristicas:
• Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
• Debido a la propiedad anterior el CV es la cantidad más adecuada para comparar
la variabilidad de dos conjuntos de datos.
• En áreas de investigación donde se tienen datos de experimentos previos,
el CV es muy usado para evaluar la precisión de un experimento, comparando
en CV del experimento en cuestión con los valores del mismo en experiencias
anteriores.
9. Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la
altura de los alumnos de una clase y otra serie con el peso de dichos
alumnos, no se puede utilizar las desviaciones típicas (una viene vienes
expresada en cm y la otra en kg). En cambio, sus coeficientes de variación
son ambos porcentajes, por lo que sí se pueden comparar.
Utilidad de las medidas de dispersión
Las estadísticas básicas nos permiten tener una visión del
comportamiento de una serie de sucesos o eventos a los que denominamos
"variables", así tenemos varias herramientas estadísticas como lo son la
Media, la Mediana y la Moda. Pero estas Medidas no son suficientes,
necesitamos conocer la variabilidad de los datos, es decir, cuán parecidos
son los datos reales en comparación a las Medidas de Tendencia Central,
para esto contamos con esta nueva herramienta: las Medidas de Dispersión,
que no son otra cosa que indicadores de variabilidad y cuya importancia
reside en la necesidad de tomar decisiones, basadas en estadísticas básicas.