Tema 3 MCRLN.pdf

Modelo clásico de regresión
lineal normal (MCRLN)

• MCO  , ,
• MCRL  , , -- > MELI
• ¿Qué tan cerca están los estimadores de los verdaderos parámetros?
• , ,  variables aleatorias; Por tanto es necesario conocer sus
distribuciones para sacar conclusiones
Teoría clásica
Estimación
Prueba de hipótesis

Distribución de probabilidad de las pertubaciones
= = , (1) siempre que =
Pero como
= + + :
= ( + + ) (2)
Por tanto es una función de y dependerá de su supuesto
• como se requiere conocer las distribuciones de probabilidad de los
estimadores de MCO, la naturaleza de la distribución de probabilidad
de ui desempeña un papel importante en las pruebas de hipótesis

¿Qué sabemos de ?
• Sabemos poco de  ¿Su distribución
probabilística?
• Debemos suponer que las u siguen una determinada
distribución de probabilidad
• Suponemos que tiene la distribución de
probabilidad Normal
• Modelo clásico de regresión lineal normal (MCRLN).

Supuesto de normalidad de
• El modelo clásico de regresión lineal normal supone que cada ui está
normalmente distribuida con:

¿Por qué debe formularse el
supuesto de normalidad?

Razón # 1
Se espera que la inﬂuencia de las variables omitidas o descartadas sea
pequeña y, en el mejor de los casos, aleatoria
• Teorema central del límite (TCL)  Si existe un gran número de
variables aleatorias independientes con idéntica distribución,
entonces, con pocas excepciones, la distribución de su suma tiende a
ser normal a medida que se incrementa al inﬁnito el número de tales
variables
• Aunque el número de variables no sea muy grande, o si estas
variables no son estrictamente independientes, su suma puede estar
aún normalmente distribuida

Razón # 2
• Se derivan con facilidad las distribuciones de probabilidad de los
estimadores de MCO:
• Una propiedad de la distribución normal es que cualquier función
lineal de variables normalmente distribuidas estará también
normalmente distribuida.
• Como ya analizamos, los estimadores de MCO y son funciones
lineales de . Por consiguiente, si está normalmente distribuida,
también lo están y , lo cual hace que la tarea de probar
hipótesis sea muy fácil.

Razón #3
• La distribución normal es una distribución comparativamente sencilla
y requiere sólo dos parámetros (la media y la varianza);
• al parecer muchos fenómenos se rigen por la distribución normal.

Razón # 4
• Se permite utilizar las pruebas estadísticas t, F y χ2 para los modelos
de regresión
• las pruebas t y F que se basan en el supuesto de que el término de
error está distribuido normalmente pueden seguir aplicándose con
validez

Propiedades de los estimadores
de MCO según el supuesto de
normalidad

• Si suponemos que
Los estimadores MCO tienen las siguientes propiedades:
1. Son insesgados
2. Tienen varianza mínima. En combinación con 1, esto significa que
son estimadores insesgados con varianza mínima, o eficientes
3. Presentan consistencia; es decir, a medida que el tamaño de la
muestra aumenta indefinidamente, los estimadores convergen
hacia sus verdaderos valores poblacionales.

4. al ser una función lineal de , está normalmente distribuída:

5. (al ser una función lineal de ui) está normalmente distribuida
con

6. (n − 2)( / ) está distribuida como la distribución χ2 (ji cuadrada),
con (n − 2) gl.
• (Saber esto ayuda a hacer inferencias respecto de la verdadera a
partir de la estimada)
7. ( , ) se distribuyen de manera independiente respecto de
8. y tiene las varianzas mínimas entre todas las clases de
estimadores insesgados lineales y no lineales. mejores estimadores
insesgados (MEI)

Resumiendo lo importante
• El supuesto de normalidad permite derivar las distribuciones de
probabilidad, o muestrales, de y (ambas normales), y de
(relacionada con ji cuadrada).
• si suponemos que N(0, ), Yi, al ser una función lineal de ,
posee también una distribución normal con una media y una varianza
dadas por

Regresión con dos variables:
estimación por intervalos y pruebas de hipótesis

Estimación por intervalos
• es de 0.7240, que constituye una cifra estimada (puntual) del valor
poblacional desconocido
• ¿Qué tan conﬁable es esta estimación? En muestreos repetidos
E(
• En estadística, la conﬁabilidad de un estimador puntual se mide por
su error estándar.
• Por tanto, en lugar de depender de un solo estimador puntual, se
puede construir un intervalo alrededor del estimador puntual; por
ejemplo, dentro de dos o tres errores estándar a cada lado del
estimador puntual, tal que este intervalo tenga, por ejemplo, 95% de
probabilidad de incluir al verdadero valor del parámetro.

¿Qué tan cerca está de ?
• Intervalo de confianza
• 1 – α  coeficiente de confianza
• α  nivel de significancia 0 < α < 1
• ( - δ) y ( + δ)  Límites de confianza o valores críticos

A tener en cuenta
• No se afirma que la probabilidad de que se encuentre entre los
límites dados sea 1 − α.
• Como se supone que , aunque se desconoce, es un número fijo,
se dice que está o no está dentro del intervalo.
• Se establece que, al utilizar el método, la probabilidad de construir
un intervalo que contenga es 1 − α.
• El intervalo a construir es aleatorio, porque se basa en , que
también es aleatorio
• si se construyen muchos intervalos de confianza como el anterior
con base probabilís ca de 1 − α, a la larga, en promedio, tales
intervalos contendrán, en 1 − α de los casos, el valor verdadero del
parámetro.

• El intervalo es aleatorio siempre y cuando sea
desconocido, una vez que se conoce ya no podemos
afirmar que la probabilidad de que el intervalo fijo dado incluye
al verdadero sea 1- . Cuando lo encontramos y calculamos,
afirmamos que: la probabilidad de que el verdadro B esté en el
intervalo ( o fuera )de él es de 0 ó 1

Intervalos de conﬁanza para los coeﬁcientes
de regresión y
• Demostramos que con el supuesto de normalidad de , los
estimadores de MCO y son en sí mismos normalmente
distribuidos con medias y varianzas allí establecidas.
• Por consiguiente, por ejemplo, la variable
•
Si Z

• Si se conoce , una propiedad importante de una variable
normalmente distribuida con media µ y varianza es que el área bajo la
curva normal entre µ ± σ es cercana a 68%, que entre µ ± 2σ es alrededor
de 95%, y que entre los límites µ ± 3σ el área es cercana a 99.7%.
• Pero pocas veces se conoce 𝟐 y, en la práctica, está determinada por el
estimador insesgado 𝟐

la variable t, así deﬁnida, sigue la distribución t con n − 2 gl

Por consiguiente, en lugar de utilizar la distribución normal, se puede
utilizar la distribución t para construir un intervalo de conﬁanza para β2 de
la siguiente forma:
Pr (− ≤t ≤ ) =1−α

• De vuelta al ejemplo de regresión del salario promedio por hora (Y) y
el nivel de escolaridad (X):
• Datos:
• = 0.7240; = -0.01445
• ee( )=0.0700; ee( )= 0.9317359
• 13 observaciones  11 gl
• Suponemos 
•
• ∝/ = 2.201

 𝟐
 𝟏
0,57 0,88

• La interpretación de este intervalo de confianza es:
• Dado el coeficiente de confianza de 95%, en 95 de cada 100 casos,
los intervalos como la ecuación (1) contendrán al verdadero valor de
β2.
• por consiguiente, β2 se encontrará o no dentro de él: la probabilidad
de que el intervalo fijo específico incluya al verdadero valor de β2 es
por consiguiente 1 o 0.

Intervalo de conﬁanza para
Por tanto, con la distribución χ2 se establece el intervalo de conﬁanza
para :
∝/ ∝/

• = 21.9200 y = 3.8157
• (13 – 2)
• 0.4484
• La interpretación de este intervalo es la siguiente: Si establecemos
límites de conﬁanza a 95% sobre , se puede afirmar que en
muestras repetidas, entre estos límites caerá el verdadero ,

Pruebas de hipótesis
Consideraciones generales

• En nuestro ejemplo, ¿Es = 0.724 consistente con la hipótesis
planteada? De ser así , NO rechazaremos la hipótesis, de lo contrario
tendremos que rechazar.
•  Hipótesis nula ;  Hipótesis alterna (Ej. )
• puede ser simple o compuesta
¿Es compatible o no lo es una observación o un hallazgo,
según algunas hipótesis planteadas?

¿En qué consiste la prueba de hipótesis?
Reglas que
Permitan
aceptar o
Rechazar Ho
intervalo de conﬁanza
prueba de signiﬁcancia

Pruebas de hipótesis:
método del intervalo de conﬁanza

Prueba bilateral o de dos colas
• En nuestro ejemplo, el coeﬁciente de pendiente es 0.7240.
Supongamos que se postula que:
• ¿Es = 0.724 compatible con la hipótesis planteada?
• Sabemos que los intervalos como (0.5700, 0.8780) contendrán al
verdadero β2 con una probabilidad de 95%.
• Por consiguiente, si el β2 en Ho se encuentra dentro del intervalo de
conﬁanza 100(1 − α)%, no se rechaza la hipótesis nula; si se encuentra
por fuera del intervalo, se puede rechazar.
Hipótesis bilateral
(H1 puede ser > ó >)

• ¿Y en nuestro ejemplo?
• (0.5700 0.8780)
• Hallazgo estadísticamente signiﬁcativo  cuando se rechaza la
hipótesis nula
• Hallazgo NO es estadísticamente signiﬁcativo  Cuando No se
rechaza la hipótesis nula

Prueba unilateral o de una cola
• Existen expectativas de que la hipótesis alternativa es unilateral o
unidireccional, por lo que, por ejemplo podemos plantear:

Pruebas de hipótesis:
enfoque de la prueba de signiﬁcancia

Prueba de significancia de los coeficientes de
regresión: la prueba t
• Se utiliza los resultados muestrales para verificar la verdad o falsedad
de una hipótesis nula
• Utilizamos un estadístico de prueba (un estimador) y su distribución
muestral según la hipótesis nula para aceptar o no la Ho.
• El procedimiento consiste en utilizar la distribución t como este
estadístico de prueba

sigue la distribución t con n − 2 gl

Ojo con la diferencia
• Intervalo de confianza  Establecer un rango o intervalo que tenga
una probabilidad determinada de contener al verdadero aunque
desconocido β2,
• Prueba de significancia  Someter a hipótesis algún valor de y se
ve si el calculado se encuentra dentro de límites (de confianza)
razonables alrededor del valor sometido a hipótesis

En nuestro ejemplo:
• = 0.724 ; 13 observaciones  11 gl; ee( ) = 0.700
• Si  / = 2.201
= ∗
= 0.5 y :

Otra forma:
un valor “grande” de |t| será evidencia en contra de la hipótesis nula

• Un estadístico es estadísticamente signiﬁcativo si el valor del
estadístico de prueba cae en la región crítica. En este caso, se rechaza
la hipótesis nula.
• Una prueba no es estadísticamente signiﬁcativa  si el valor del
estadístico de prueba cae en la región de aceptación. No se rechaza la
hipótesis nula

En una sola cola
• Supongamos que la experiencia
indica que la pendiente es mayor
que 0.5

La prueba t de signiﬁcancia: reglas de decisión

Prueba de signiﬁcancia de : la prueba χ2
Ejercicio: Encontrar el valor de y los valores críticos suponiendo que

Resultados del ejercicio de la prueba de significancia ji cuadrada
• Con = 16.3845
• Los valores críticos son: 3.8157 y 21.9200
Como el valor
calculado cae dentro
de estos límites, los
datos apoyan la
Hipótesis nula y no la
rechazamos

Pruebas de hipótesis
Algunos aspectos prácticos

Signiﬁcado de “aceptar” o “rechazar” una hipótesis
• Si, con base en una prueba de signiﬁcancia, decidimos “aceptar” la hipótesis nula, no se sostiene
que la hipótesis nula sea verdadera con absoluta certeza, solamente: No existe razón para
rechazarla.
• Al “aceptar” una hipótesis nula siempre se debe tener presente que puede existir otra hipótesis
nula igualmente compatible con los datos
• Ejemplo:
• Teníamos: : = 0.70 Y = 0.7241; ee ( ) = 0.0701
¿Cuál de estas dos hipótesis nulas es la “verdadera”?
Es preferible, por tanto, decir que se puede aceptar la hipótesis nula en lugar de decir que la aceptamos

Hipótesis nula “cero” y regla práctica “2t”
• La Hipótesis nula de “cero” es un mecanismo para establecer si Y
tiene relación con X, la variable explicativa
• REGLA 2t práctica:
• Si el número de grados de libertad es 20 o más, y si α, el nivel de
signiﬁcancia, se ﬁja en 0.05, se rechaza la hipótesis nula = 0 si el
valor de t [ = /ee( ) ]es superior a 2 en valor absoluto

¿Cómo se formulan las Hipótesis nula y alternativa?
• No existen reglas especíﬁcas, el fenómeno en estudio sugerirá la
forma de las hipótesis nula y alternativa
• Ejemplo: Se pide estimar la Línea del Mercado de Captiales (LCM) de
la teoría de portafolios: = + , donde:}
• = rendimiento esperado del portafolio y = desviación estándar
del rendimiento, una medida de riesgo.
• : = 0 , entonces

Selección del nivel de signiﬁcancia α
• Errores tipo I y tipo II Esquemáticamente, tenemos
• Lo ideal sería reducir los errores tipo I y tipo II
• Se supone que la probabilidad de que un error tipo I es más grave en la
práctica que un error tipo II.
• tratar de mantener la probabilidad de cometer un error tipo I en un nivel
relativamente bajo, como 0.01 o 0.05, y luego tratar de reducir al máximo
la probabilidad de incurrir en un error tipo II.
• la probabilidad de un error tipo I se representa con α y se denomina nivel
de signiﬁcancia, y la probabilidad de un error tipo II se representa con β.

• ¿por qué α se ﬁja generalmente en los niveles de 1, 5 o, cuanto
mucho, 10%?
• para un tamaño de muestra dada, si tratamos de reducir un error
tipo I, aumenta un error tipo II, y viceversa
• Tamaño de la muestra  Compensación
• pocas veces se conocen los costos de cometer los dos tipos de error

Nivel exacto de significancia: Valor p
• Probabilidad exacta de cometer un error tipo I.
• Más técnicamente, el valor p se define como nivel de significancia
más bajo al cual puede rechazarse una hipótesis nula
• ¿por qué no tan sólo consultar la tabla estadística y encontrar la
probabilidad real de obtener un valor del estadístico de prueba tan
grande o mayor que el obtenido en el ejemplo?
• Ejemplo: Con : = 0.5 y hallamos t=3.2
¿Cuál es el valor p de obtener un valor t igual o superior
a 3.2?

• Con Gretl, se calcula que el valor p de obtener un valor t igual o
mayor que 3.2 es de 0.00001
• Este nivel exacto de significancia del estadístico t es mucho menor
que el nivel de significancia que se fija de manera convencional y
arbitraria, como 1, 5 o 10%.
• si se utilizara el valor p recién calculado y se rechazara la hipótesis
nula de que el verdadero coefi ciente de escolaridad es 0.5, la
probabilidad de cometer un error tipo I sería más o menos de sólo 1
en 100 000.
• a medida que aumenta |t|, el valor p se reduce y, por consiguiente,
se rechaza la hipótesis nula con mayor confi anza

Tema 3 MCRLN.pdf

Recomendados

Recomendados

Más contenido relacionado

Similar a Tema 3 MCRLN.pdf

Similar a Tema 3 MCRLN.pdf (20)

Último

Último (17)

Tema 3 MCRLN.pdf