Este documento describe diferentes medidas de dispersión como el rango, la desviación estándar, la varianza y el coeficiente de variación. Explica que las medidas de dispersión indican qué tan dispersos están los datos de un conjunto y qué tan lejos están de la media. Cuanto mayor sea la medida, más variable será la distribución. El documento también provee detalles sobre el cálculo y la interpretación de cada medida.
El sistema solar el gran descubrimiento del sistema solar .pptx
Presentación2
1. República Bolivariana de Venezuela
Ministerio del Poder Popular para la Educación
Instituto Universitario Politécnico “Santiago Mariño”
Sede – Barcelona
Alumna:
Osmelys Jiménez
C.I.: 26.313.320
Ingeniería Civil
2. MEDIDAS DE DISPERSIÓN
Muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una
variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Características y usos
Las medidas de dispersión, variabilidad o variación nos indican si esos datos están próximos entre sí o si están
dispersos, es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten
apreciar la distancia que existe entre los datos a un cierto valor central e identificar la concentración de los mismos en
un cierto sector de la distribución, es decir, permiten estimar cuán dispersas están dos o más distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto de datos, siendo la media
aritmética el dato central más utilizado. Cuando existe una dispersión pequeña se dice que los datos están dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato central es un valor muy representativo. En
el caso que la dispersión sea grande el valor central no es muy confiable. Cuando una distribución de datos tiene poca
dispersión toma el nombre de distribución homogénea y si su dispersión es alta se llama heterogénea.
3. RANGO
Es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte unidades con los datos. Permite obtener
una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Utilidad:
Permite obtener una idea de la dispersión de los datos.
DESVIACIONES TÍPICAS
Es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable.
4. Utilidad y características:
La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un
grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de
acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las
medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces
consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango
de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación
estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor
central (la media o promedio).
5. VARIANZA
La varianza (que suele representarse como ) de una variable aleatoria es una medida de dispersión definida como
la esperanza del cuadrado de la desviación de dicha variable respecto a su media.
Está medida en la unidad de medida de la variable al cuadrado. Por ejemplo, si la variable mide una distancia en
metros, la varianza se expresa en metros al cuadrado. La desviación estándar es la raíz cuadrada de la varianza, es una
medida de dispersión alternativa expresada en las mismas unidades de los datos de la variable objeto de estudio. La
varianza tiene como valor mínimo 0.
Características:
1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un numero la varianza no varia.
3. Si todos los valores de la variable se multiplican por un numero la varianza queda multiplicada por el cuadrado de
dicho numero.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la
varianza total
6. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación
porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a
diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos
los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor
heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V.
COEFICIENTE DE VARIACIÓN
1. El coeficiente de variación no posee unidades.
2. El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad
puede ser 1 o mayor que 1.
3. Para su mejor interpretación se expresa como porcentaje.
4. Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de la media aritmética,
dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar valores muy
grandes, que no necesariamente implican dispersión de datos.
5. El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación y
teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de
variación es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se consideran de "baja
varianza", mientras que aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se consideran de
"alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del coeficiente de variación,
abreviado como S.C.V. (por su siglas en inglés)