1. DISTRIBUCIONESMUESTRALES
Estadística
El estudio de determinadas característicasdeuna población seefectúa a través de diversas muestras que
pueden extraerse de ella.
El muestreo puede hacersecon o sin reposición,y la población departida puede ser infinita o finita.Una
población finita en la que se efectúa muestreo con reposición puede considerarseinfinita teóricamente.
También, a efectos prácticos,una población muy grande puede considerarsecomo infinita.En todo nuestro
estudio vamos a limitarnos a una población departida infinita o a muestreo con reposición.
Consideremos todas las posiblesmuestras detamaño n en una población.Para cada muestra podemos
calcular un estadístico (media,desviación típica,proporción,...) que variarádeuna a otra. Así obtenemos
una distribución del estadístico quesellama distribución muestral.
Las dos medidas fundamentales de esta distribución son lamedia y la desviación típica,también
denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande las distribuciones
muestrales son normales y en esto se basarán todos los resultados quealcancemos.
DISTRIBUCIONES MUESTRALES PARA UNA POBLACIÓN NORMAL
De todas las posibles distribuciones básicas es ,sin duda ,la distribución normal la
más importante por el gran número de poblaciones que se distribuyen así, real o
asintóticamente ,(en virtud de los Teoremas Límite).
Así pues ,en los subapartados siguientes ,consideraremos que conocemos la
distribución de la población y que ‚ ésta , es normal . Consideraremos
igualmente muestreo aleatorio simple (m.a.s.)
DISTRIBUCIÓN DE LA MEDIA MUESTRAL
Si la población se distribuye N[ ; ] entonces
2. en efecto si y dado que siendo
independientes pues realizamos m.a.s. y en aplicación del teorema fundamental
de las distribuciones normales obtendremos
DISTRIBUCIÓN DE LA VARIANZA MUESTRAL
En lugar de obtener la distribución muestral del estadístico varianza muestral
L [S2] que nos llevaría a conclusiones próximas a las anteriormente descritas en
el apartado en el que la población no era normal, es más conveniente la
utilización de la variable aleatoria que recordemos , no es un estadístico
, y que contiene en su expresión a la varianza muestral y a la poblacional , de ahí
su utilidad dado que ambas quedan relacionadas con una distribución conocida ;
la jhi-dos.
No demostramos la relación pero la recordamos dada su importancia posterior.
DISTRIBUCIÓN DE LA MEDIA MUESTRAL CON VARIANZA
DESCONOCIDA
En apartados anteriores estudiamos el comportamiento de la media muestral y
vimos que ésta dependía tanto del valor de la media poblacional , como de la
varianza poblacional , parece lógico pensar que si nuestro interés radica en inferir
comportamientos de la población partiendo de la muestra parece ilógico pensar
que conozcamos la varianza . De ahí la importancia de establecer una distribución
para la media muestral que la relacione únicamente con la poblacional , lo que hará
que conocida la muestral concreta podamos aventurar el comportamiento de la
poblacional.
Así tendríamos :
lo que da lugar a :
3. hemos visto sin demostrar que
conocemos
que luego simplificando tendríamos
expresión que relaciona ambas medias y la varianza muestral con
una distribución conocida
4 Estimación puntual
La estimación de parámetros tiene por finalidad asignar valores
a los parámetros poblacionales a partir de los estadísticos
obtenidos en las muestras. Dicho de otra manera, la finalidad de
la estimación de parámetros es caracterizar las poblaciones a
partir de la información de las muestras (por ejemplo, inferir el
valor de la Media de la población a partir de los datos de la
muestra).
Estadística Inferencial
Tema 8: Estimación
1 Introducción
2 Muestreo
3 Media, Varianza y proporción
4 Estimación puntual
4.1 Introducción
4.2 Características estimadores
5 Estimación por intervalos
Tema 9: Contraste de Hipótesis
4. Tema 10: Inferencia paramétrica
Tema 11: Inferencia no paramétrica
4.1 Introducción
La estimación puntual consiste en atribuir un valor
(la estimación) al parámetro poblacional. Si la muestra es
representativa de la población, podemos esperar que los
estadísticos calculados en las muestras tengan valores
semejantes a los parámetros poblacionales, y la estimación
consiste en asignar los valores de los estadísticos muestrales a
los parámetros poblacionales. Los estadísticos con que
obtenemos las estimaciones se denominan estimadores.
Ejemplo
Se desea estimar la Media de las puntuaciones del curso
2003/4, pero solo se dispone de 50 puntuaciones seleccionadas
aleatoriamente. La Media de la muestra (el estimador), es igual
a 5.6 y atribuimos este valor (la estimación) a la Media del
curso completo.
Resumiendo:
Podemos utilizar como estimadores de la Media de la población
otros estadísticos de tendencia central como la Moda o la
Mediana, pero NO todos los estimadores son apropiados. Los
estimadores deben satisfacer ciertos requisitos, y por esta
razón, interesa conocer sus propiedades a fin de utilizar los que
sean adecuados según las circunstancias de la estimación.
Estadística Inferencial
Tema 8: Estimación
5. 1 Introducción
2 Muestreo
3 Media, Varianza y proporción
4 Estimación puntual
4.1 Introducción
4.2 Características estimadores
5 Estimación por intervalos
Tema 9: Contraste de Hipótesis
Tema 10: Inferencia paramétrica
Tema 11: Inferencia no paramétrica
4.2 Características estimadores
1) Sesgo. Se dice que un estimador es insesgado si la
Media de la distribución del estimador es igual al parámetro.
Estimadores insesgados son la Media muestral (estimador de la
Media de la población) y la Varianza (estimador de la Varianza
de la población):
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual
a 5.09 han hecho un muestreo aleatorio (número de muestras=
10000, tamaño de las muestras= 100) y hallan que la Media de
las Medias muestrales es igual a 5.09, (la media poblacional y la
media de las medias muestrales coinciden). En cambio, la
Mediana de la población es igual a 5 y la Media de las Medianas
es igual a 5.1 esto es, hay diferencia ya que la Mediana es un
estimador sesgado.
La Varianza es un estimador sesgado. Ejemplo: La Media de las
Varianzas obtenidas con la Varianza
6. en un muestreo de 1000 muestras (n=25) en que la Varianza de
la población es igual a 9.56 ha resultado igual a 9.12, esto es,
no coinciden. En cambio, al utilizar la Cuasivarianza
la Media de las Varianzas muestrales es igual a 9.5, esto es,
coincide con la Varianza de la población ya que la Cuasivarianza
es un estimador insesgado.
2) Consistencia. Un estimador es consistente si
aproxima el valor del parámetro cuanto mayor es n (tamaño de
la muestra).
Algunos estimadores consistentes son:
Ejemplo
En una población de 500 puntuaciones cuya Media (m) es igual
a 4.9 han hecho tres muestreos aleatorios (número de
muestras= 100) con los siguientes resultados:
7. vemos que el muestreo en que n=100 la Media de las Medias
muestrales toma el mismo valor que la Media de la población.
3) Eficiencia. Diremos que un estimador es más eficiente
que otro si la Varianza de la distribución muestral del estimador
es menor a la del otro estimador. Cuanto menor es la eficiencia,
menor es la confianza de que el estadístico obtenido en la
muestra aproxime al parámetro poblacional.
Ejemplo
La Varianza de la distribución muestral de la Media en un
muestreo aleatorio (número de muestras: 1000, n=25) ha
resultado igual a 0.4. La Varianza de la distribución de Medianas
ha resultado, en el mismo muestreo, igual a 1.12, (este
resultado muestra que la Media es un estimador más eficiente
que la Mediana).