Este documento describe diferentes medidas de dispersión como el rango, la desviación media, la varianza y la desviación estándar. Explica que las medidas de dispersión cuantifican cuánto se alejan los valores de una distribución del centro y proveen información sobre la uniformidad de los datos. Además, define conceptos como la varianza, desviación estándar y coeficiente de variación, y describe sus fórmulas de cálculo y usos.
2. Las medidas de dispersión nos informan sobre cuánto se alejan del
centro los valores de la distribución.
Las medidas de tendencia central sirven para ubicar el centro de un
grupo de datos; pero no dicen cómo se reparten o dispersan los datos a uno y otro
lado del centro. Esta última característica se
denomina dispersión. Si la dispersión es poca,
indica gran uniformidad entre los valores;
una gran dispersión indica poca uniformidad;
y una ausencia de dispersión es señal de
uniformidad completa, lo cual quiere decir
que los datos tienen el mismo valor.
Entre las medidas de dispersión se encuentran:
el rango, la desviación media, la varianza y la
desviación estándar.
3. Características de las medidas de dispersión:
Las medidas de dispersión nos sirven para cuantificar la separación de los
valores de una distribución.
Llamaremos dispersión o variabilidad, a la mayor o menor separación de los
valores de la muestra, respecto de las medidas de centralización que
hayamos calculado.
Al calcular una medida de centralización como es la media aritmética,
resulta necesario acompañarla de otra medida que indique el grado de
dispersión, del resto de valores de la distribución, respecto de esta media.
A estas cantidades o coeficientes, les llamamos: medidas de dispersión,
pudiendo ser absolutas o relativas.
Usos de las medidas de dispersión:
Nos informan sobre cuanto se alejan del centro los valores de la
distribución.
son medidas que se toman para tener la posibilidad de establecer
comparaciones de diferentes muestras, para las cuales son conocidas ya
medidas que se tienen como típicas en su clase.
4. Esta medida de dispersión se define como la diferencia entre el mayor y
menos valor de los datos
R= Máximo valor - Mínimo valor
El uso del rango o recorrido, es muy difundido en las aplicaciones
industriales de la estadística, pues dada su sencillez de calculo se utiliza en la
construcción de las graficas de control conocidas como (X, R) cuyo objetivo es
detectar a tiempo la aparición de causas especiales dentro de un proceso de
producción.
Características:
Solo suministra información de los extremos de la variable
Informa sobre la distancia entre el mínimo y máximo valor observado.
Se limita su uso a una información inicial.
5. Utilidad
El rango representa la amplitud de la variación de un fenómeno entre
su limite menor y uno claramente menor.
conserva datos y se puede calcular a partir de restar el valor mínimo al
valor máximo considerado.
Utiliza únicamente una pequeña parte de la información.
Desviaciones típicas
La desviación estándar (o desviación típica) es una medida de
dispersión para variables de razón (ratio o cociente) y de intervalo, de gran
utilidad en la estadística descriptiva. Es una medida (cuadrática) de lo que se
apartan los datos de su media, y por tanto, se mide en las mismas unidades
que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer también la
desviación que representan los datos en su distribución, con objeto de tener
una visión de los mismos más acorde con la realidad a la hora de describirlos e
interpretarlos para la toma de decisiones
6. Esta medida nos permite determinar el promedio aritmético de
fluctuación de los datos respecto a su punto central o media. La desviación
estándar nos da como resultado un valor numérico que representa el promedio
de diferencia que hay entre los datos y la media. Para calcular la desviación
estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su
ecuación sería:
𝒮 = √𝒮2
7. Es el parámetro de dispersión mas utilizado.
Es afectada por el valor de cada observación.
Como consecuencia de considerar desviaciones cuadráticas poner mayor
énfasis en las desviaciones extremas que en las demás desviaciones.
Al construir la tabla de frecuencias de una variable discreta y calcular a partir
de ella la desviación típica, no hay perdida de información por lo que la
desviación para los datos observados es igual que para los datos tabulados.
Utilidad:
Uno de sus usos es determinar si un grupo de datos es más confiable
que otro. Por ejemplo: dos personas realizan encuestas independientes sobre una
misma variable en una misma zona, con la desviación tipica se puede calcular
cual de estas dos personas realizo la encuesta más confiable. Mientras más
pequeña la desviación estándar sea, más confiables los resultados serán. Otros
usos son analizar encuestas y ver cuan concluyentes son las respuestas; se puede
inferir la probabilidad de que alcancen las metas, de que alguien llegue tarde o
repruebe un ramo.
8. Varianza: es la media aritmética del
cuadrado de las desviaciones
respecto a la media de una
distribución estadística.
Utilidad: se utiliza para identificar a
la medida de las desviaciones
cuadráticas de una variable de
carácter aleatorio, considerando el
valor medio de este.
Coeficiente de variación: es una
medida de dispersión que describe la
cantidad de variabilidad en relación
con la media. Puesto que el
coeficiente de variación no se basa en
unidades, se puede utilizar en lugar
de la desviación estándar para
comparar la dispersión de los
conjuntos de datos que tienen
diferentes unidades o diferentes
medias.
9. Características de varianza:
Es siempre un valor no negativo,
que puede ser igual o distinta a 0.
La varianza es la medida de
dispersión cuadrática optima por
ser la menor de todas.
Si a todos los valores de la variable
se le suma una constante la
varianza no se modifica.
Si todos los valores de la variable
se multiplican por una constante la
varianza queda multiplicada por el
cuadrado de dicha constante.
Utilidad: El CV es muy usado para
evaluar la precisión de un
experimento, comparando en CV del
experimento en cuestión con los
valores del mismo en experiencias
anteriores.
Características:
Se calcula como cociente entre la
desviación típica y la media. Es un
porcentaje que permite comparar
el nivel de dispersión de dos
muestras.
Puesto que tanto la desviación
estándar como la media se miden
en las unidades originales, el CV es
una medida independiente de las
unidades de medición.
El coeficiente de variación es
típicamente menor que uno.