1. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
LA ESTIMACIÓN COMO BASE EN LA
ESTADÍSTICA INFERENCIAL
AUTOR:
Aponte Juan Carlos
TUTOR:
Barrios Álvaro
Upata, Junio 2015
2. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
LA ESTIMACIÓN COMO BASE EN LA
ESTADÍSTICA INFERENCIAL
AUTOR:
Aponte Juan Carlos
TUTOR:
Barrios Álvaro
Resumen
En las ciencias, un psicólogo tal vez quiera determinar el tiempo promedio que una
persona adulta necesita para reaccionar a estímulos visuales; en los negocios, un
funcionario sindical quizá desee conocer la magnitud de la variación del tiempo que
requieren los miembros del sindicato para llegar al trabajo; y en la vida diaria,
probablemente queremos investigar el porcentaje de accidentes de un automóvil
ocasionados por la fatiga del conductor. Todos estos son problemas de estimación,
pero serían pruebas de hipótesis si el psicólogo quisiera decidir si el tiempo
promedio que un adulto necesita para reaccionar a estímulos en realidad es 0.44
segundos, si el funcionario sindical quisiera saber si la variación del tiempo que
necesitan los miembros del sindicato para llegar al trabajo es mayor del que afirma
la compañía y si deseáramos verificar si es verdad que 14.5% de todos los
accidentes de un automóvil se deben a la fatiga del conductor.
3. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
INTRODUCCIÓN
El propósito de todo esto es crear un fundamento que le permita a los
estudiosos de la estadística sacar conclusiones acerca de los parámetros de
una población a partir de datos experimentales. Por ejemplo, el teorema del
límite central proporciona información acerca de la distribución de la media
muestral. La distribución comprende la media poblacional. Entonces
cualesquiera conclusiones referentes a la media poblacional que se obtenga
de un promedio muestral observado dependen del conocimiento de esta
distribución muestral. En el presente trabajo se inicia con de una manera
formal del propósito de la inferencia estadística.
Tradicionalmente los problemas de inferencia estadística se han
dividido en problemas de estimación, donde asignamos valores numéricos a
parámetros de una población, pruebas de hipótesis, donde aceptamos o
rechazamos aseveraciones acerca de los parámetros o formas de las
poblaciones y en problemas de pronóstico, donde pronosticamos valores
futuros de una variable aleatoria. En cada caso, todas las inferencias se
basan en datos muestrales. Los problemas de estimación surgen en todas
las áreas: en las ciencias, en los negocios y en la vida cotidiana.
4. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
La estimación.
En inferencia estadística se llama estimación al conjunto de técnicas
que permiten dar un valor aproximado de un parámetro de una población a
partir de los datos proporcionados por una muestra. Por ejemplo, una
estimación de la media de una determinada característica de una población
de tamaño N podría ser la media de esa misma característica para una
muestra de tamaño n.1
La estimación se divide en tres grandes bloques, cada uno de los
cuales tiene distintos métodos que se usan en función de las características
y propósitos del estudio:
1) Estimación puntual:2
-Método de los momentos;
-Método de la máxima verosimilitud;
-Método de los mínimos cuadrados;
2) Estimación por intervalos.
3) Estimación bayesiana.
Un estimador es una regla que establece cómo calcular una
estimación basada en las mediciones contenidas en una muestra estadística.
5. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
Consiste en la estimación del valor del parámetro mediante un sólo valor,
obtenido de una fórmula determinada. Por ejemplo, si se pretende estimar la
talla media de un determinado grupo de individuos, puede extraerse una
muestra y ofrecer como estimación puntual la talla media de los individuos.
Lo más importante de un estimador, es que sea un estimador eficiente. Es
decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mínima) Estimación puntual. Sea X una variable
poblacional con distribución Fθ , siendo θ desconocido. El problema de
estimación puntual consiste en, seleccionada una muestra X1, ..., Xn,
encontrar el estadístico T(X1, ..., Xn) que mejor estime el parámetro θ. Una
vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la
estimación puntual de θ, T(x1, ..., xn) = ˆ θ .
Vemos a continuación dos métodos para obtener la estimación puntual de un
parámetro: método de los momentos y método de máxima verosimilitud.
Método de los momentos: consiste en igualar momentos poblacionales a
momentos muestrales. Deberemos tener tantas igualdades como parámetros
a estimar. Momento poblacional de orden r αr = E(Xr) Momento muestral de
orden r ar = Xn i=1 Xr i n
Método de máxima verosimilitud: consiste en tomar como valor del parámetro
aquel que maximice la probabilidad de que ocurra la muestra observada. Si
X1, ..., Xn es una muestra seleccionada de una población con distribución Fθ
o densidad fθ(x), la probabilidad de que ocurra una realización x1, ..., xn
viene dada por: Lθ(x1, ..., xn) = Yn i=1 fθ(xi).
6. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
A Lθ(x1, ..., xn) se le llama función de verosimilitud.(credibilidad de la
muestra observada). Buscamos entonces el valor de θ que maximice la
función de verosimilud, y al valor obtenido se le llama estimación por máxima
verosimilitud de θ. Nota: si la variable X es discreta, en lugar de fθ(xi )
consideramos la función masa de probabilidad pθ(xi).
Ejemplo 7.1: Sea X → N(µ, σ), con µ desconocido. Seleccionada una m.a.s.
X1, ..., Xn, con realización x1, ..., xn, estimamos el parámetro µ por ambos
métodos. Según el método de los momentos: E(X) = Xn i=1 Xi n = − X, y al
ser µ = E(X) se obtiene que ˆ µ = − x. Por el método de máxima verosimilitud:
Lµ(x1, ..., xn) = Yn i=1 fµ(xi ) = = Yn i=1 1 √ 2πσ e −(xi−µ) 2 2σ
Estimación por Intervalos de confianza 109 y maximizamos en µ tal función;
en este caso resulta más fácil maximizar su logaritmo: lnLµ(x1, ..., xn) = − 1
2σ 2 Xn i=1 (xi − µ) 2 − n ln( √ 2πσ) ∂ ∂µ lnLµ(x1, ..., xn) = 1 σ 2 Xn i=1 (xi −
µ) = n − x − nµ σ 2 = 0 ⇐⇒ ˆ µ = −.
Estimación por intervalos.
Consiste en la obtención de un intervalo dentro del cual estará el valor del
parámetro estimado con una cierta probabilidad. En la estimación por
intervalos se usan los siguientes conceptos:
Intervalo de confianza: El intervalo de confianza es una expresión del tipo [θ1,
θ2] ó θ1 ≤ θ ≤ θ2, donde θ es el parámetro a estimar. Este intervalo contiene al
parámetro estimado con un determinado nivel de confianza. Pero a veces
puede cambiar este intervalo cuando la muestra no garantiza un axioma o un
equivalente circunstancial.
7. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
Variabilidad del parámetro: Si no se conoce, puede obtenerse una
aproximación en los datos aportados por la literatura científica o en un
estudio piloto. También hay métodos para calcular el tamaño de la muestra
que prescinden de este aspecto. Habitualmente se usa como medida de esta
variabilidad la desviación típica poblacional y se denota σ.
Error de la estimación: Es una medida de su precisión que se corresponde
con la amplitud del intervalo de confianza. Cuanta más precisión se desee en
la estimación de un parámetro, más estrecho deberá ser el intervalo de
confianza y, si se quiere mantener o disminuir el error, más observaciones
deberán incluirse en la muestra estudiada. En caso de no incluir nuevas
observaciones para la muestra, más error se comete al aumentar la
precisión. Se suele llamar E, según la fórmula E = (θ2 - θ1)/2.
Limite de confianza: Es la probabilidad de que el verdadero valor del
parámetro estimado en la población se sitúe en el intervalo de confianza
obtenido. El nivel de confianza se denota por (1-α), aunque habitualmente
suele expresarse con un porcentaje ((1-α)·100%). Es habitual tomar como
nivel de confianza un 95% o un 99%, que se corresponden con valores α de
0,05 y 0,01 respectivamente.
Valor α: También llamado nivel de significación. Es la probabilidad (en
tanto por uno) de fallar en nuestra estimación, esto es, la diferencia entre la
certeza (1) y el nivel de confianza (1-α). Por ejemplo, en una estimación con
un nivel de confianza del 95%, el valor α es (100-95)/100 = 0,05.
8. República Bolivariana de Venezuela
Universidad Nacional Experimental de Guayana
Ingeniería en Industrias Forestales
Cátedra: Estadística II
BIBLIUOGRAFÍA.
ESTADÍSTICA ELEMENTAL. GARY A. SIMON & JHON FREUD, OCTAVA
EDICIÓN. EDITORIAL: NICK ROMANELLI
PROBABILIDAD Y ESTADÍSTICA. WAMPOLE & MYERS, CUARTA
EDICIÓN. EDITORIAL: RICARDO DEL BOSQUE ALAYÓN