Medidas de Dispersion

7.230 visualizaciones

Publicado el

Las Medidas De Dispersion En Estadistica

Publicado en: Datos y análisis
0 comentarios
2 recomendaciones
Estadísticas
Notas
  • Sé el primero en comentar

Sin descargas
Visualizaciones
Visualizaciones totales
7.230
En SlideShare
0
De insertados
0
Número de insertados
2
Acciones
Compartido
0
Descargas
127
Comentarios
0
Recomendaciones
2
Insertados 0
No insertados

No hay notas en la diapositiva.

Medidas de Dispersion

  1. 1. Ministerio del Poder Popular para la Educación Universitaria Instituto Universitario de Tecnología ´´Antonio José de Sucre´´ LAS MEDIDAS DE DISPERSIÓN Alumna: Profesor: Magdiony Bárcenas C.I: 20.632.217 Ranielina Rondón Mejías Clase: 78 Turno: Nocturno Cátedra: Estadisticas Barcelona, Junio 2014
  2. 2. LAS MEDIDAS DE DISPERSIÓN. Mide que tanto se dispersan las observaciones alrededor de su media. También llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos revelan una parte de la información que necesitamos acerca de las características de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su dispersión, extensión o variabilidad. Ejemplo: se toman por ejemplo los tres conjuntos de datos que se observan a continuación. Conjunto de datos 1: 0,5,10 Conjunto de datos 2: 4,5,6 Conjunto de datos 3: 5,5,5 · Los tres (3) tienen una media de cinco (5) ¿ Se debe por tanto concluir que los conjuntos de datos son similares ? IMPORTANCIA DE LA MEDIDA DE DISPERSIÓN.  Proporciona información adicional que permite juzgar la confiabilidad de la medida de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición central es menos representativa de los datos.  Coexisten problemas característicos para datos ampliamente dispersos, debemos ser capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
  3. 3.  Comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia dispersión de valores con respecto al centro de distribución o esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger distribuciones que tengan las dispersiones más grandes.  Dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla. Ya que la dispersión ocurre frecuentemente y su grado de variabilidad. TIPOS DE MEDIDAS DE DISPERSIÓN  Medidas dispersión absoluta:  Rango o Recorrido  Rango o recorrido intercuartilico  Desviación media  Desviación estándar o típica  Varianza  Desigualdad de tchebycheff  Estandarización Medidas de dispersión absoluta (viene expresada en el mismo valor de la variable)  Medidas de dispersión relativa: · Coeficiente de variación Medidas de dispersión relativa ( viene expresada en porcentaje) Ø Rango: valor máximo- valor mínimo Ø Rango intercuartílico: Q3-Q1 Donde:
  4. 4. Q3 = tercer cuartil Fórmula de Q3, para series de Datos agrupados: Donde: L1 = límite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil. Fórmula de Q1, para series de Datos agrupados: Q1= primer cuartil: Donde: L1 = límite inferior de la clase que lo contiene P = valor que representa la posición de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase · El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones. El cuartíl es un indicador de posición.
  5. 5. RANGO Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de cálculo. El rango o recorrido interarticular es la diferencia entre el valor máximo y el valor mínimo en un grupo de números aleatorios. Se le suele simbolizar con R'. Obtención del rango Ordenamos los números según su tamaño. Restamos el valor mínimo del valor máximo Rango = {(Max - Min)} Ejemplo Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se encuentran en un rango de: Rango = (9-4) = 5 DESVIACIÓN TÍPICA Es la raíz cuadrada de la varianza, se denota por Sx o s x. Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ. Desviación típica para datos agrupados
  6. 6. Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. Desviación típica para datos agrupados Ejemplo: Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la desviación típica de la distribución de la tabla: PROPIEDADES DE LA DESVIACIÓN TÍPICA  La desviación típica será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.  Si a todos los valores de la variable se les suma un número la desviación típica no varía.  Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número.  Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones típicas se puede calcular la desviación típica total. LA VARIANZA Es una medida estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, es el cuadrado de las desviaciones: Propiedades  La varianza es siempre positiva o 0:
  7. 7.  Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica. 1 c  Si a los datos de la distribución los multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.  Propiedad distributiva: cov COEFICIENTE DE VARIACIÓN Cuando se desea hacer referencia a la relación entre el tamaño de la media y la variabilidad de la variable, se utiliza el coeficiente de variación. Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es variable ante cambios de origen. Por ello es importante que todos los valores sean positivos y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele representarse por medio de las siglas C.V. Exigimos que: Se calcula: Donde es la desviación típica. Se puede dar en tanto por ciento calculando:
  8. 8. PROPIEDADES Y APLICACIONES  El coeficiente de variación no posee unidades.  El coeficiente de variación es típicamente menor que uno. Sin embargo, en ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.  Para su mejor interpretación se expresa como porcentaje.  Depende de la desviación típica, también llamada "desviación estándar", y en mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima a este valor el C.V. pierde significado, ya que puede dar valores muy grandes, que no necesariamente implican dispersión de datos.  El coeficiente de variación es común en varios campos de la probabilidad aplicada, como teoría de renovación y teoría de colas. En estos campos la distribución exponencial es a menudo más importante que la distribución normal. La desviación típica de una distribución exponencial es igual a su media, por lo que su coeficiente de variación es 1.

×