Estimación estadística

Instituto Universitario ddee TTeeccnnoollooggííaa..
AAnnttoonniioo JJoosséé ddee SSuuccrree..
EExxtteennssiióónn BBaarrqquuiissiimmeettoo..
EEssttaaddííssttiiccaa
AApplliiccaaddaa
MMaarriieellyy JJ.. VVaarrggaass ZZ..
VV-- 1199..882288..442222
EEssttaaddííssttiiccaa IIII
SSeecccciióónn SS11
22001144--22ii

EEssttiimmaacciióónn ddee ppaarráámmeettrrooss::
Estimación puntual y por intervalos.
Características deseables de un
estimador. Cálculo de los intervalos de
confianza para los principales
parámetros.

EEssttiimmaacciióónn:: puntual y por intervalos
Como ya hemos visto, a partir de los estadísticos que hemos
obtenido en la/s muestra/s queremos obtener una idea de los
valores de los parámetros en la población.
Se trata de emplear los estadísticos para estimar los parámetros.
VVEERREEMMOOSS DDOOSS TTIIPPOOSS DDEE EESSTTIIMMAADDOORREESS::
1) Estimación puntual. Aquí obtendremos un punto, un valor,
como estimación del parámetro.
2) Estimación por intervalos. Aquí obtendremos un intervalo
dentro del cual estimamos (bajo cierta probabilidad) estará el
parámetro.

p Estimación puunnttuuaall ddee ppaarráámmeettrrooss
Un estimador puntual es simplemente un estadístico (media aritmética, varianza,
etc.) que se emplea para estimar parámetros (media poblacional, varianza
poblacional, etc.).
Es decir, cuando obtenemos una media aritmética a partir de una muestra, tal
valor puede ser empleado como un estimador para el valor de la media
poblacional.
(Algunos autores comparan los estimadores con los lanzamientos en una diana; el
círculo central sería el valor real del parámetro.)

Propiedades ddeesseeaabblleess eenn llooss
eessttiimmaaddoorreess
VVeerreemmooss CCUUAATTRROO pprrooppiieeddaaddeess::
1. Ausencia de sesgo
2. Consistencia
3. Eficiencia
4. Suficiencia

eessttiimmaaddoorreess ((11))
q
1. Ser insesgado. Diremos que es un estimador insesgado de si la
esperanza de es . Es decir, q )
q
q )
)
E(q ) =q
La media muestral es un estimador insesgado de la
media poblacional.
Pero la varianza muestral NO es un estimador
insesgado de la varianza poblacional, pero sí lo es en
cambio la cuasivarianza.

2. CCoonnssiisstteenncciiaa.. Se dice que un estimador es consistente si se cumple que
)
lim P ( q - q > e
) =
0
n
®¥
Esta expresión indica que a medida que se incrementa el tamaño muestral, la
diferencia entre el estimador y el parámetro será menos que cualquier número
(e).
A diferencia de la “ausencia de sesgo” que se define para valores finitos de n, la
“consistencia” es una propiedad asintótica.
Tanto la media muestral como la cuasivarianza son estimadores consistentes.
Nota: la varianza muestral ES un estimador consistente de la varianza
poblacional, dado que a medida que el tamaño muestral se incrementa, el sesgo
disminuye y disminuye.

3. EEffiicciieenncciiaa.. Se emplea para COMPARAR estimadores.
Si tenemos dos estimadores y de un mismo parámetro q, diremos que
es más eficiente que si tenemos que var( )<var( )
Se puede comprobar que la varianza muestral es más eficiente que la
cuasivarianza muestral a la hora de estimar la varianza poblacional.
(Aún así, se prefiere la cuasivarianza muestral como estimador de la
varianza poblacional por ser un estimador insesgado.)
1 q )
1 q )
2 q )
2 q )
2 q ) 1 q )
2 q )

q ) q
4. Suficiencia. Diremos que es un estimador suficiente del parámetro
si dicho estimador basta por sí solo para estimar
q

Intervalos ddee ccoonnffiiaannzzaa ppaarraa llooss
pprriinncciippaalleess ppaarráámmeettrrooss
El caso de la media (1)
En este caso, en lugar de indicar simplemente un único valor como estimación del
parámetro, lo que haremos es ofrecer un intervalo de valores que sea asumible con cierta
probabilidad por el parámetro que queremos estimar.
-IInntteerrvvaalloo ddee ccoonnffiiaannzzaa:: Es el intervalo de las estimaciones (probables) sobre el parámetro.
-LLíímmiitteess ddee llooss iinntteerrvvaallooss ddee ccoonnffiiaannzzaa:: Son los dos valores extremos del intervalo de
confianza

Intervalos de ccoonnffiiaannzzaa ppaarraa llooss pprriinncciippaalleess
ppaarráámmeettrrooss:: EEll ccaassoo ddee llaa mmeeddiiaa ((22))
Ahora bien, ¿cuán grande habrá de ser el intervalo de confianza?
Evidentemente, si decimos que el intervalo de confianza va de menos infinito a
más infinito, seguro que acertamos...pero eso no es muy útil. Por su parte, el
extremo es la estimación puntual, en la que lo usual es que no demos con el valor
del parámetro...
La idea es crear unos intervalos de confianza de manera que sepamos en qué
porcentaje de casos el parámetro estará dentro del intervalo crítico.
¿Y cómo fijamos tal porcentaje de casos? Usualmente se asume un porcentaje del
95%. Al calcular un intervalo de confianza sobre la media al 95% ello quiere
decir que el 95% de las veces que repitamos el proceso de muestreo (y calculemos
la media muestral), la media poblacional estará dentro de tal intervalo.

Intervalos de confianza para los principales
parámetros: El caso de la media (3)
Pero, ¿cómo calculamos eessttooss ddooss llíímmiitteess??
Sabemos que la distribución subyacente es normal, lo cual nos ayuda enormemente.
En una distribución normal tipificada, es muy fácil saber qué puntuación típica (z) deja a
la izquierda el 2.5% de los datos (yendo a las tablas es -1.96) y cuál deja a la izquierda el
97.5% de los datos (o a la derecha el 2.5% de los datos: 1.96).
Ahora habrá que pasar esos datos a puntuaciones directas....

Pero, ¿cómo calculamos estos dos límites?
Vamos a ver DOS casos.
Primero, veremos el caso de que sepamos la varianza poblacional.
Segundo, veremos el caso de que NO sepamos la varianza poblacional

Conocemoss 2
Nuestra distribución es normal, pero con cierta media y cierta desviación típica,
las cuales sabemos por el tema anterior:
1) La media de la distribución muestral de medias es la media poblacional m
2) La varianza de la distribución muestral de medias es s2/n
O lo que es lo mismo, la desviación típica de la dist.muestral de medias es
n
s

Y para pasar directas-típicas:
m X Recordad que
Estimador de es
z = X -
X
O lo que es análogo
Conocemoss 2
= × s +
i i X z X
n
/
i
i
s n

Conocemoss 2
z 0’975 z 0’025
+ × s
+ × s 0.975 X z
En definitiva
Aplicando la lógica
de pasar de
puntuaciones típicas
a directas
En Punt.típicas
En Punt.directas
æ + × s < m < + × s ö = çè ÷ø
0.025 0.975 P X z X z 0.95
n n
0.025 X z
n
n

Intervalos de confianza para la media: CASO DE
DESCONOCER LA VARIANZA POBLACIONAL
Para la media (cuando conocemos la varianza poblacional), tenemos la expresión
æ + × s < m < + × s ö = çè ÷ø
0.025 0.975 P X z X z 0.95
n n
Pero si no conocemos la varianza poblacional, no podemos emplear
En su lugar hemos de emplear
s2
%
n
Ahora la distribución ya no es exactamente una distribución normal...
Por el tema anterior sabemos que la distribución muestral de
2
n
s
X
s n
-m
%
/
no es una distribución normal, sino una distribución t de
Student con n-1 grados de libertad.
z X
= -
Recordad, en el caso de varianza
i
conocida teníamos: i
/
m
n
s

Intervalos de confianza para la media: CASO DE
DESCONOCER LA VARIANZA POBLACIONAL
En definitiva, para la media (cuando conocemos la varianza poblacional), tenemos la
expresión
æ + × s < m < + × s ö = çè ÷ø
P X z0.025 X z0.975 0.95
n n
Pero si no conocemos la varianza poblacional (el caso realista), tenemos la expresión:
P X t s X t s
æ % çè + × < m < + × %
ö ÷ø
= - -
0.025 1 0.975 1 0.95 n n
n n
En todo caso, recordad que si "n" es grande, la distribución t de Student será
virtualmente una distribución normal N(0,1). En otras palabras, si "n" es grande,
ambas fórmulas dan unos intervalos virtualmente idéntico, y emplear la distribución
normal es correcto.

Intervalos de confianza para los principales parámetros:
El caso de la media (7)
¿Qué quiere decir la expresión siguiente?
æ + × s < m < + × s ö = çè ÷ø
P X z0.025 X z0.975 0.95
n n
Quiere decir que cada vez que extraigamos una muestra y hallemos la media, el
parámetro desconocido m estará entre los límites de dicho intervalo el 95% de
las veces. (O el 99% si hubiéramos elegido un intervalo al 99%, etc.)

Tamaño muestral y la amplitud del intervalo de
confianza
Para el caso de la media hemos visto que
æ + × s < m < + × s ö = çè ÷ø
P X z0.025 X z0.975 0.95
n n
Es claro que a medida que el tamaño muestral aumente, la amplitud del intervalo
disminuye. (Evidentemente, esto es general, no sólo para la media.) Veamos, en todo caso
un ejemplo:
Caso A1. Media muestral=10, varianza pobl=4, tamaño muestral=12
10 ( 1.96) 2 10 1.96 2 ( 8.87 11.13) 0.95
Pæç + - × < m < + × ö÷ = P < m < = è 12 12
ø
Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=20
10 ( 1.96) 2 10 1.96 2 ( 9.12 10.88) 0.95
Pæç + - × < m < + × ö÷ = P < m < = è 20 20
ø

Amplitud del intervalo de confianza y el valor del índice
de confianza
El caso "usual" (por defecto) es emplear intervalos al 95%.
æ + × s < m < + × s ö = çè ÷ø
P X z0.025 X z0.975 0.95
n n
Pero evidentemente es posible emplear intervalos a, digamos, el 99%. En tal caso, tendremos
más seguridad de que el parámetro de interés se halle en los límites del intervalo. El problema es
que incrementar tal índice aumenta así mismo la amplitud del intervalo.
Caso A1. Media muestral=10, varianza pobl.=4, tamaño muestral=12. Intervalo al 95%
10 ( 1.96) 2 10 1.96 2 ( 8.87 11.13) 0.95
Pæç + - × < m < + × ö÷ = P < m < = è 12 12
ø
Caso A2. Media muestral=10, varianza pobl=4, tamaño muestral=12. Intervalo al 99%
10 ( 2.57) 2 10 2.57 2 ( 8.52 11.48) 0.99
Pæç + - × < m < + × ö÷ = P < m < = è 12 12
ø

Intervalos de confianza para OTROS parámetros
Intervalos de confianza para las proporciones
Caso de muestras grandes
éæ - ö æ - öù êçç + ÷÷ £ £ çç + ÷÷ú = êëè ø è øúû
P P z P(1 P) p
P z P(1 P) 0.95
.025 .975
n n
Caso de muestras pequeñas

Intervalos de confianza para OTROS parámetros
Intervalos de confianza para la varianza
éæ × 2 ö æ × 2
öù êç ÷ £ £ ç ÷ú =
ëè ø è øû
P n S s 2
n S
2 2
c c - -
.975 1 .025 1
0.95
n n

Estimación estadística

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (8)

Similar a Estimación estadística

Similar a Estimación estadística (20)

Más de Mariely Sanz Cerezo

Más de Mariely Sanz Cerezo (6)

Último

Último (20)

Estimación estadística