1. UNIVERSIDAD NACIONAL EXPERIMENTAL
“FRANCISCO DE MIRANDA”
DPTO. DE FÍSICA Y MATEMÁTICA
CÁTEDRA: ESTADÍSTICA
TEMA Nº 6. ESTIMACIÓN
PARÁMETRO:
Es cualquier característica de una población que sea medible. Un parámetro es
una medida que se calcula para describir una característica de una población
completa. Se denota “ θ ”.
ESTADÍSTICO:
Es una medida que se calcula para describir una característica a partir de solo
una muestra. Se denota “ ˆ ”.
μ Población
Muestra
X
σ2
s2
ρ
ˆ
ρ
Parámetros Estadístic os
θ ˆ
ESTIMACIÓN:
Consiste en la búsqueda de uno o varios parámetros de una población entre la
que se ha efectuado un muestreo. Por ejemplo, Un candidato para un puesto
público desea estimar la proporción real de votantes que lo apoyan mediante la
obtención de las opiniones de una muestra aleatoria de n votantes. La fracción
de ellos que lo apoyan puede usarse como una estimación de la Proporción
real de la población total de votantes. Este problema pertenece, entonces al
área de Estimación.
CARACTERÍSTICAS DESEABLES DE UN ESTIMADOR:
2. Es posible definir muchas estadísticas para estimar un Parámetro desconocido
θ . Por ejemplo, puede elegirse la Mediana muestral para estimar el valor de la
media Poblacional, o también la Media muestral. Entonces, ¿Cómo seleccionar
un buen estimador de θ ? , ¿Cuáles son los criterios para juzgar cuando un
estimador de θ es “bueno” o “malo”?. Si se piensa en términos de estimadores
humanos como se encuentran en las grandes compañías, entonces, quizá un
buen estimador es aquella persona cuyas estimaciones siempre se encuentran
muy cercanas a la realidad.
De aquí surgen dos propiedades deseables de un estimador:
1. La distribución muestral de ˆ debe tener una media igual al parámetro θ
estimado
2. La varianza del estimador debe ser la menor posible
1. ESTIMADOR INSESGADO: Un estimador debe estar próximo en algún
sentido al valor verdadero del parámetro desconocido. Se dice que ˆ es un
estimador insesgado de θ si el valor esperado de ˆ es igual a θ . Esto
equivale a afirmar que la media de la distribución de probabilidad de ˆ (o la
media de la distribución de muestreo de ˆ ) es igual a θ .
Si E( ˆ ) = θ , entonces el estimador es insesgado
Si el estimador no es insesgado, entonces: E( ˆ ) - θ = sesgo
En ocasiones existen varios estimadores insesgados del parámetro ( θ )
de la población.
2. VARIANZA DE UN ESTIMADOR: La varianza de un estimador insesgado
es la cantidad más importante para decidir qué tan bueno es el estimador
para estimar un parámetro θ . Por ejemplo, sean ˆ 1 y ˆ 2 dos estimadores
insesgados del mismo parámetro poblacional. Se dice que ˆ es un 1
estimador más eficiente de θ que ˆ 2 si Var( ˆ 1 ) Var( ˆ 2 ). Es muy común
utilizar el cociente Var( ˆ ) / Var( ˆ ) para determinar la eficiencia relativa de
1 2
ˆ con respecto a ˆ 1 .“Si se consideran todos los estimadores
2
insesgados posibles de θ , aquel con la varianza más pequeña recibe
el nombre de estimador más eficiente de θ .
3. ˆ1
ˆ3
ˆ2
θ
Para la figura anterior, se observa claramente que solo ˆ sony ˆ
1 2
insesgados, dado que sus distribuciones se centran en θ . El estimador ˆ 1
tiene varianza más pequeña que ˆ , por tanto es más eficiente. En
2
consecuencia el estimador de θ que se seleccionaría es ˆ 1 .
TIPOS DE ESTIMACIÓN:
1. ESTIMACIÓN PUNTUAL: Una estimación puntual de algún parámetro θ de
ˆ
la población es un valor numérico θ de la estadística ˆ . Los estimadores
más frecuentes de los siguientes parámetros son:
Parámetro Estimador más probable
μ x , la media muestral
σ2 o σ s2 o s, la varianza muestral o desviación estándar muestral
ρ ˆ
ρ =X/n, la proporción muestral, donde x es el número de objetos
en una muestra aleatoria de tamaño n que pertenece a la clase
de interés
μ1 μ2 x1 x 2 , la diferencia de medias muestrales de dos muestras
aleatoria independientes
ρ1 ρ2 ˆ ˆ
ρ1 ρ2 , la diferencia entre las proporciones de dos muestras
aleatorias independientes
2. ESTIMACIÓN POR INTERVALOS: En muchas situaciones, una estimación
puntual no proporciona información suficiente sobre un parámetro θ . Por
ejemplo, si se tiene interés en estimar la resistencia promedio a la tensión
de cierto elemento estructural, es probable que un solo número no sea tan
significativo como un intervalo, dentro del cual se espera encontrar el valor
4. de este parámetro. El intervalo estimado recibe el nombre de Intervalo de
Confianza.
Una estimación por intervalos de un parámetro desconocido θ es un
intervalo de la forma l θ u , donde los puntos extremo l y u dependen del
valor numérico de la estadística ˆ para una muestra en particular y de la
distribución de muestreo de ˆ .
De la distribución de muestreo de ˆ es posible determinar los valores de l y
u tales que la siguiente proposición sea verdadera:
P( l θ u ) = 1 - ; 0< <1
Por tanto se tiene una probabilidad de 1- de seleccionar una muestra que
produzca un intervalo que contiene el valor verdadero de θ . El intervalo
resultante:
l θ u
Se conoce como Intervalo de Confianza del 100 (1- ) por ciento.
Las cantidades l y u se denominan límites de confianza inferior y superior y
1- es el coeficiente de confianza. De tal forma, cuando =0,05, se tiene un
Intervalo de confianza del 95% y cuando =0,01 se tiene uno del 99%.
Entre mayor es el intervalo de confianza se tiene más seguridad de que el
mismo contenga el parámetro desconocido.
Un intervalo del tipo l θ u , recibe el nombre más apropiado de Intervalo
de Confianza Bilateral. También existen intervalos de confianza
Unilaterales: θ l y θ u , donde los límites de confianza se eligen de modo
que:
P( θ l ) = 1- y P( θ u ) = 1-
A continuación se presentan métodos para encontrar Intervalos de
Confianza para Medias, Varianzas y Proporciones:
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN
CON VARIANZA CONOCIDA: Si x es la media de una muestra
aleatoria de tamaño n de una población con varianza conocida σ 2 , un
intervalo de confianza para μ del 100(1- ) por ciento esta dado por:
σ σ
X - Z1-α 2 μ X Z1-α 2
n n
5. Donde Z α 2 es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
POBLACIONALES CON VARIANZAS CONOCIDAS: Si x1 y x 2 son las
medias de dos muestras aleatorias independientes de tamaño n1 y n2
tomadas de poblaciones con varianzas conocidas σ1 y σ 2
2
2
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para μ1 μ2 esta dado por:
σ1
2
σ2 σ1
2
σ2
x1 - x 2 Z1 α2
2
μ1 μ2 x1 - x 2 Z1 α2
2
n1 n2 n1 n2
Donde Z α 2 es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2
INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN
CON VARIANZA DESCONOCIDA: Si x y s son la media y la desviación
estándar de una muestra aleatoria de tamaño n de una población con
varianza desconocida σ 2 , un intervalo de confianza para μ del 100(1- )
por ciento esta dado por:
S S
X - t1-α 2,n 1 μ X t1-α 2,n 1
n n
Donde Tα 2 es el punto crítico superior que corresponde al % /2 en la
Distribución T con n-1 G.L.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
POBLACIONALES CON VARIANZAS DESCONOCIDAS PERO
IGUALES: Si x1, x 2 y s1 , s 2 son las medias y las varianzas de dos
2
2
muestras aleatorias independientes de tamaño n1 y n2 tomadas de
poblaciones con varianzas desconocidas pero iguales σ1 σ 2 2
2
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para μ1 μ2 esta dado por:
1 1 1 1
x1 - x 2 t1 α 2,n1 n2 2 Sp μ1 μ2 x1 - x 2 t1 α 2,n1 n2 2 Sp
n1 n2 n1 n2
6. Donde Sp se denomina Estimador combinado de la desviación estándar
común de la población:
n1 1 s1 n2 1 s2
2
2
Sp
n1 n2 2
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
POBLACIONALES CON VARIANZAS DESCONOCIDAS Y
DIFERENTES: Si x1, x 2 y s1 , s 2 son las medias y las varianzas de dos
2 2
muestras aleatorias independientes de tamaño n1 y n2 tomadas de
poblaciones con varianzas desconocidas y diferentes σ1 σ 2 2
2
respectivamente, entonces un intervalo de confianza del 100(1- ) por
ciento para μ1 μ2 esta dado por:
2
s1 s2 2
s1 s2
x1 - x 2 t1 α 2,ν
2
μ1 μ2 x1 - x 2 t1 α 2, ν
2
n1 n2 n1 n2
Donde “v” son los grados de libertad, y están dados por:
2
s1 n1 s 2 n2
2
2
v 2 2
2
s1 n1 s 2 n2
2
n1 1 n2 1
INTERVALO DE CONFIANZA PARA LA VARIANZA DE UNA
POBLACIÓN: Si s2 es la Varianza de una muestra aleatoria de tamaño
n, tomada de una distribución normal con varianza desconocida σ 2 ,
entonces un intervalo de confianza del 100(1- ) por ciento para σ 2 esta
dado por:
(n 1) S2 (n 1) S2
σ2
χ1 α 2,n 1
2
χ 2 2,n 1
α
Donde χ 2 2 y χ1-α 2 son valores en la Distribución Chi-Cuadrado de v=n-1
α
2
grados de libertad
7. INTERVALO DE CONFIANZA PARA EL COCIENTE DE DOS
VARIANZAS POBLACIONALES: Si s1 y s 2 son las Varianzas de dos
2
2
muestras aleatorias e independientes de tamaño n1 y n2
respectivamente, tomadas de poblaciones normales, entonces un
intervalo de confianza del 100(1- ) por ciento para σ 1 σ 2 esta dado por:
2
2
2
s1 1 σ1
2 2
s1 1
2
s2 fα 2,n1 1,n2 1 σ2
2
2
s2 f1 α 2,n2 1,n1 1
Donde:
1
fα 2,n1 1,n2 1
f1 α 2,n2 1,n1 1
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN DE UNA
ˆ
POBLACIÓN: Si ρ es la proporción de éxitos en una muestra aleatoria
de tamaño n que pertenece a una clase de interés, entonces un intervalo
de confianza del 100(1- ) por ciento para la proporción ρ de la
población esta dado por:
ˆ ˆ
p (1 p) ˆ ˆ
p (1 p)
ˆ
p Z1 α 2 p ˆ
p Z1 α 2
n n
Donde Z α 2 es el punto en la Distribución Normal Estándar que
corresponde al porcentaje /2
INTERVALO DE CONFIANZA PARA DIFERENCIA DE
ˆ ˆ
PROPORCIONES POBLACIONALES: Si ρ1 y ρ 2 son las proporciones
de éxitos en dos muestras aleatorias de tamaños n1 y n2
respectivamente, que pertenecen a una clase de interés, entonces un
intervalo de confianza del 100(1- ) por ciento para ρ1 ρ2 esta dado por:
ˆ ˆ
ρ1q1 ˆ ˆ
ρ 2 q2 ˆ ˆ
ρ1q1 ˆ ˆ
ρ 2 q2
ˆ ˆ
ρ1 ρ 2 Z1-α 2 ρ1 ρ 2 ˆ ˆ
ρ1 ρ 2 Z1-α 2
n1 n2 n1 n2
Donde:
ˆ ˆ
q1 1 ρ1 y ˆ
q2 ˆ
1 ρ2