Medidas de dispersión
Por Franklin Martinez C.I 24.447.836
Medidas de dispersión
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran la
variabilidad de una distribución, indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviación media) y otra es tomando las
desviaciones al cuadrado (varianza).
Medidas de dispersión
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y
la moda sólo nos revelan una parte de la información que necesitamos
acerca de las características de los datos. Para aumentar nuestro
entendimiento del patrón de los datos, debemos medir también su
dispersión, extensión o variabilidad.
La dispersión es importante porque:
Proporciona información adicional que permite juzgar la confiabilidad de la
medida de tendencia central. Si los datos se encuentran ampliamente
dispersos, la posición central es menos representativa de los datos.
Ya que existen problemas característicos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presentan esa dispersión antes de
abordar esos problemas.
Quizá se desee comparar las dispersiones de diferentes muestras. Si no se
desea tener una amplia dispersión de valores con respecto al centro de
distribución o esto presenta riesgos inaceptables, necesitamos tener
habilidad de reconocerlo y evitar escoger distribuciones que tengan las
dispersiones más grandes.
Pero si hay dispersión en la mayoría de los datos, y debemos estar en
capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su
grado de variabilidad es importante, ¿cómo medimos la variabilidad de una
distribución empírica?. Vamos a considerar sólo algunas medidas de
dispersión absolutas: el rango, la varianza, la desviación estándar y el
coeficiente de variación.
La desviación típica
La desviación típica o desviación estándar (denotada con el símbolo σ o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersión para variables de razón (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la
variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las
medidas de tendencia central, sino que necesitamos conocer también la
desviación que presentan los datos en su distribución respecto de la media
aritmética de dicha distribución, con objeto de tener una visión de los
mismos más acorde con la realidad al momento de describirlos e
interpretarlos para la toma de decisiones.
Varianza y coeficiente
En estadística, cuando se desea hacer referencia a la relación entre el tamaño
de la media y la variabilidad de la variable, se utiliza el coeficiente de
variación.
Su fórmula expresa la desviación estándar como porcentaje de la media
aritmética, mostrando una mejor interpretación porcentual del grado de
variabilidad que la desviación típica o estándar. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen. Por ello es importante que todos los valores
sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del
coeficiente de variación mayor heterogeneidad de los valores de la variable; y
a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V.
Exigimos que:
Se
calcula:
Donde es la
desviación típica. Se
puede dar en tanto
por ciento
calculando:
Varianza y coeficiente
Propiedades y aplicaciones
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en
ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en
mayor medida de la media aritmética, dado que cuando ésta es 0 o muy
próxima a este valor el C.V. pierde significado, ya que puede dar valores muy
grandes, que no necesariamente implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su
media, por lo que su coeficiente de variación es 1. La distribuciones con un
C.V. menor que uno, como la distribución de Erlang se consideran de "baja
varianza", mientras que aquellas con un C.V. mayor que uno, como la
distribución hiperexponencial se consideran de "alta varianza". Algunas
fórmulas en estos campos se expresan usando el cuadrado del coeficiente de
variación, abreviado como S.C.V. (por su siglas en inglés)

Medidas de dispersión - presentacion 2

  • 1.
    Medidas de dispersión PorFranklin Martinez C.I 24.447.836
  • 2.
    Medidas de dispersión Lasmedidas de dispersión, también llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (desviación media) y otra es tomando las desviaciones al cuadrado (varianza).
  • 3.
    Medidas de dispersión Aligual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. La dispersión es importante porque: Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos. Ya que existen problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas. Quizá se desee comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes. Pero si hay dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad es importante, ¿cómo medimos la variabilidad de una distribución empírica?. Vamos a considerar sólo algunas medidas de dispersión absolutas: el rango, la varianza, la desviación estándar y el coeficiente de variación.
  • 4.
    La desviación típica Ladesviación típica o desviación estándar (denotada con el símbolo σ o s, dependiendo de la procedencia del conjunto de datos) es una medida de dispersión para variables de razón (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la raíz cuadrada de la varianza de la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.
  • 5.
    Varianza y coeficiente Enestadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V. Exigimos que: Se calcula: Donde es la desviación típica. Se puede dar en tanto por ciento calculando:
  • 6.
    Varianza y coeficiente Propiedadesy aplicaciones El coeficiente de variación no posee unidades. El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1. Para su mejor interpretación se expresa como porcentaje. Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos. El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de variación es 1. La distribuciones con un C.V. menor que uno, como la distribución de Erlang se consideran de "baja varianza", mientras que aquellas con un C.V. mayor que uno, como la distribución hiperexponencial se consideran de "alta varianza". Algunas fórmulas en estos campos se expresan usando el cuadrado del coeficiente de variación, abreviado como S.C.V. (por su siglas en inglés)