Qué es un Histograma estadístico teoria y problema
Medidas de dispersión
1. Ministerio del Poder Popular para la Educación Universitaria
Instituto Universitario de Tecnología
´´Antonio José de Sucre´´
LAS MEDIDAS DE DISPERSIÓN
Alumna: Profesor:
Magdiony Bárcenas C.I: 20.632.217 Ranielina Rondón Mejías
Clase: 78 Turno: Nocturno
Cátedra: Estadisticas
Barcelona, Junio 2014
2. LAS MEDIDAS DE DISPERSIÓN.
Mide que tanto se dispersan las observaciones alrededor de su media. También
llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando
por medio de un número, si las diferentes puntuaciones de una variable están muy alejadas
de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho
entre ellos.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda
sólo nos revelan una parte de la información que necesitamos acerca de las características
de los datos. Para aumentar nuestro entendimiento del patrón de los datos, debemos medir
también su dispersión, extensión o variabilidad.
Ejemplo: se toman por ejemplo los tres conjuntos de datos que se observan a continuación.
Conjunto de datos 1: 0,5,10
Conjunto de datos 2: 4,5,6
Conjunto de datos 3: 5,5,5
· Los tres (3) tienen una media de cinco (5)
¿ Se debe por tanto concluir que los conjuntos de datos son similares ?
IMPORTANCIA DE LA MEDIDA DE DISPERSIÓN.
Proporciona información adicional que permite juzgar la confiabilidad de la medida
de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición
central es menos representativa de los datos.
Coexisten problemas característicos para datos ampliamente dispersos, debemos ser
capaces de distinguir que presentan esa dispersión antes de abordar esos problemas.
3. Comparar las dispersiones de diferentes muestras. Si no se desea tener una amplia
dispersión de valores con respecto al centro de distribución o esto presenta riesgos
inaceptables, necesitamos tener habilidad de reconocerlo y evitar escoger
distribuciones que tengan las dispersiones más grandes.
Dispersión en la mayoría de los datos, y debemos estar en capacidad de describirla.
Ya que la dispersión ocurre frecuentemente y su grado de variabilidad.
TIPOS DE MEDIDAS DE DISPERSIÓN
Medidas dispersión absoluta:
Rango o Recorrido
Rango o recorrido intercuartilico
Desviación media
Desviación estándar o típica
Varianza
Desigualdad de tchebycheff
Estandarización
Medidas de dispersión absoluta (viene expresada en el mismo valor de la variable)
Medidas de dispersión relativa:
· Coeficiente de variación
Medidas de dispersión relativa ( viene expresada en porcentaje)
Ø Rango: valor máximo- valor mínimo
Ø Rango intercuartílico: Q3-Q1
Donde:
4. Q3 = tercer cuartil
Fórmula de Q3, para series de Datos agrupados:
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase.
Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del
percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.
Fórmula de Q1, para series de Datos agrupados:
Q1= primer cuartil:
Donde:
L1 = límite inferior de la clase que lo contiene
P = valor que representa la posición de la medida
f1 = la frecuencia de la clase que contiene la medida solicitada.
Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
Ic = intervalo de clase
· El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos,
es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las
observaciones.
El cuartíl es un indicador de posición.
5. RANGO
Es la primera medida que vamos a estudiar, se define como la diferencia existente entre
el valor mayor y el menor de la distribución,. Lo notaremos como R. Realmente no es una
medida muy significativa e la mayoría de los casos, pero indudablemente es muy fácil de
cálculo. El rango o recorrido interarticular es la diferencia entre el valor máximo y el valor
mínimo en un grupo de números aleatorios. Se le suele simbolizar con R'.
Obtención del rango
Ordenamos los números según su tamaño.
Restamos el valor mínimo del valor máximo
Rango = {(Max - Min)}
Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus valores se
encuentran en un rango de:
Rango = (9-4) = 5
DESVIACIÓN TÍPICA
Es la raíz cuadrada de la varianza, se denota por Sx o s x.
Este estadístico se mide en la misma unidad que la variable por lo que se puede
interpretar mejor. Es decir, la raíz cuadrada de la media de los cuadrados de las
puntuaciones de desviación.
La desviación típica se representa por σ.
Desviación típica para datos agrupados
6. Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes
a las anteriores.
Desviación típica para datos agrupados
Ejemplo:
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la desviación típica de la distribución de la tabla:
PROPIEDADES DE LA DESVIACIÓN TÍPICA
La desviación típica será siempre un valor positivo o cero, en el caso de que las
puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la desviación típica no
varía.
Si todos los valores de la variable se multiplican por un número la desviación típica
queda multiplicada por dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
desviaciones típicas se puede calcular la desviación típica total.
LA VARIANZA
Es una medida estadística que mide la dispersión de los valores respecto a un valor
central (media), es decir, es el cuadrado de las desviaciones:
Propiedades
La varianza es siempre positiva o 0:
7. Si a los datos de la distribución les sumamos una cantidad constante la varianza no
se modifica.
1
c
Si a los datos de la distribución los multiplicamos una constante, la varianza queda
multiplicada por el cuadrado de esa constante.
Propiedad distributiva: cov
COEFICIENTE DE VARIACIÓN
Cuando se desea hacer referencia a la relación entre el tamaño de la media y la
variabilidad de la variable, se utiliza el coeficiente de variación. Su fórmula expresa la
desviación estándar como porcentaje de la media aritmética, mostrando una mejor
interpretación porcentual del grado de variabilidad que la desviación típica o estándar. Por
otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen. Por ello es importante que todos los valores sean positivos
y su media dé, por tanto, un valor positivo. A mayor valor del coeficiente de variación
mayor heterogeneidad de los valores de la variable; y a menor C.V., mayor homogeneidad
en los valores de la variable. Suele representarse por medio de las siglas C.V.
Exigimos que:
Se calcula:
Donde es la desviación típica. Se puede dar en tanto por ciento calculando:
8. PROPIEDADES Y APLICACIONES
El coeficiente de variación no posee unidades.
El coeficiente de variación es típicamente menor que uno. Sin embargo, en
ciertas distribuciones de probabilidad puede ser 1 o mayor que 1.
Para su mejor interpretación se expresa como porcentaje.
Depende de la desviación típica, también llamada "desviación estándar", y en
mayor medida de la media aritmética, dado que cuando ésta es 0 o muy próxima
a este valor el C.V. pierde significado, ya que puede dar valores muy grandes,
que no necesariamente implican dispersión de datos.
El coeficiente de variación es común en varios campos de la probabilidad
aplicada, como teoría de renovación y teoría de colas. En estos campos la
distribución exponencial es a menudo más importante que la distribución
normal. La desviación típica de una distribución exponencial es igual a su
media, por lo que su coeficiente de variación es 1.