Clase9 Esperanza condicional y modelo de regresión

1
Clase 9. Esperanza condicional y modelo de regresión
lineal
Nerys Ram´ırez Mordán
Pontificia Universidad Católica Madre y Maestra
Econometr´ıa II (EC-411-T)
4 de septiembre de 2018

2
Contenido
1 Introducción
Media condicional y repaso
estad´ıstico
Independencia y momentos
de una v.a.
2 Regresión y esperanza
condicional
Descomposición de una
variable aleatoria
Modelo de Regresión Lineal
Regresión particionada
Efecto causal
Momentos del estimador
Bootstrap
3 Efectos marginales de formas
funcionales
Dummys
Interacciones
Elasticidades
4 Bondad de ajuste
Coeficiente de determinación
5 Inferencia
6 Referencias

4
Introducción
Suponiendo una distribución aleatoria entre grupos
(tratamiento y control), se verifican cuales momentos
poblacionales pudiesen ayudar a medir un efecto causal de
interés.
Este momento se conoce como la esperanza condicional de una
variable aleatoria. Siendo, el modelo de regresión la mejor
aproximación lineal a la esperanza condicional (Elejalde, nd).

5
Regresi´on y esperanza condicional

6
Repaso estad´ıstico
Población: colección de todos los elementos de interés.
Variable aleatoria (Y ): resumen numérico de un resultado
aleatorio, que se puede caracterizar mediante la función de
probabilidad Pr(y = k) que la caracteriza por medio de los
momentos.
Esperanza o media poblaacional: µ = E[Y ] = n
i=1 ki Pr[Y = ki]
Varianza: σ2 = V ar(Y ) = E[(Y − E[Y ])2]
Momentos parciales de orden inferior
SV ar(X) = E m´ın(X − E X], 0)2] (Novales, 2016, p.13).
Función de probabilidad condicionada Pr[Y |X = x0].

7
Esperanza condicional
Dado una variable a explicar (y) y un vector de variables
aleatorias X = (x1, x2, ..., xk), la media condicional de la variable
dependiente (y), es su media poblacional manteniendo ﬁja las x’s.
Caso discreto:
E [y|x = xi] =
n
i=1
k Pr[Y = k|x = xi] (1)
Caso continuo:
E [y|x = xi] = k·fy|x (k|xi) dk (2)

8
Funci´on de esperanza condicional
Asumiendo la base de datos siguiente:
obs Urbana mujer salario
1 0 1 8
2 1 0 21
3 1 0 17
4 0 0 13
n 1 1 15
Podemos obtener la funci´on de esperanza condicional e incondicional a partir de las
esperanzas condicionales (ley de esperanzas iteradas):
[E [Y |X]] = E [Y ] = E [E (w|urb = 1) Pr[urb = 1] + E [w|urb = 0] Pr[urb = 0]]
E[salario|urbana] Pr
Urbana = 1 17.667 0.6
Urbana = 0 10.5 0.4
E [E [Y |X]] 14.80
E [Y ] 14.80

9
Función de esperanza condicional
Gráfico 1. Relación gastos e ingresos
Fuente: Gujarati y Porter, 2009.

10
Repaso estad´ıstico
Y ⊥⊥ X (independientes), si Pr[Y |X] = Pr[Y ], siendo equivalente a
Pr[X, Y ] = Pr[X] Pr[Y ].
Independencia en media E [Y |X] = E [y], por lo que, la recta de
regresi´on es plana.
Independencia en media implica ausencia de correlaci´on,
covarianzas nulas:
σx,y = Cov(x, y) = E [(Y − E(Y )) (X − E(X))] = 0 (3)

11
Descomposición de una variable aleatoria
Siempre es posible descomponer la variable aleatoria en una parte
que depende de X y otra que no:
yi = E [yi|xi] + ui (4)
La varianza de la variable aleatoria se puede descomponer en una
parte sistemática y otra idiosincrática:
V ar (Y ) = V ar (E [yi|xi]) + E u2
(5)
V ar(u|x) = E E u2|x , por lo que, utilizando LEI (= E(u2)).

12
El mejor predictor lineal es la función (f(y|x) = x β) que minimiza
el error cuadrático medio de predicción entre las funciones lineales
en x.
β = m´ın
b
E Y − X b
2
= m´ın
b
E Y − ˆY
2
(6)

13
En el modelo de regresi´on lineal:
∂E (Y − X b)2
∂b
= 2E X Y − X b = 0 (7)
b = E XX
−1
E (XY ) (8)

14
Cuando X = (1, x1), entonces f(y|x) = β0 + β1x1, asumiendo una
relaci´on lineal entre las variables y teniendo como resultado:
β1 =
Cov (x1, y)
V ar (x1)
(9)
β0 = E [y] − β1E [x] (10)
Utilizando la posibilidad de descomponer la variable aleatoria, la
dependiente se puede descomponer en una parte explicada por x y
otra no:
y = x β + u (11)

15
De aqu´ı se deduce que el valor predicho de y, como (que coincide
con la recta de regresión):
ˆy = f(y|x) = x β (12)
Propiedad: E(ˆyu) = 0.
Los residuales del modelo se estiman a partir de la diferencia entre
el valor predicho de y (ˆy) y el observado (observe tenemos un
residual por cada observación).
ûi = yi − ˆyi = yi − β0 + β1x1 (13)

16
Regresión particionada
Cuando X = (1, x1, x2, ...xk), el modelo de regresión múltiple es:
y = β0 + β1x1 + β2x2 + βjxj + ... + βkxk + u (14)
Como βj representa el efecto parcial de xj, se puede recuperar el
efecto parcial de xj (βj) a partir de la regresión simple de y y el
residuo de la regresión auxiliar de xj sobre el resto de variables
independientes (ûaux
xj
).
βj =
Cov ûaux
xj
, y
V ar ûaux
xj
(15)
Donde:
xj = α0 + α1x1 + α2x2 + αkxk + uaux
xj
(16)

17
Efecto causal
Por tanto, el estimador (función de las variables muestrales) βj
mide del efecto causal de xj una vez controlado el efecto del
resto de variables explicativas.
No obstante, para obtener el efecto causal necesitamos que
E[u|x] = 0, referido a la inexistencia de diferencias sistemáticas
entre los factores no observables que puedan afectar la variable
independiente.
Se comparan observaciones con variables observables similares,
pero con distintos valores de xj (asignación aleatoria condicional
en observables).

18
Efecto causal
Ecuación sobre el precio de las viviendas
Dada la pregunta de interés sobre el efecto de incrementar el
tamaño de las casas sobre su precio, siendo ui los factores
adicionales a las variables explicativas que influyen sobre el precio.
pricei = β0 + β1sqrfti + β2bdrmsi + ui
La intuición es hacer casas de distintos tamaños comparables, al
controlar por variables observables (asignación aleatoria
condicional).
Obtener β1 requiere que E [ui|sqrfti] = 0, lo que permite dar una
interpretación causal a la esperanza condicional.

19
Momentos de estimador
La distribuci´on del estimador se puede derivar de forma anal´ıtica:
ˆβj ∼ N

βj,
ˆσ2
u
xj − ¯xj 1 − R2
aux,xj

 (17)

20
Bootstrap
Propuesta por Efron (1979), basada en el remuestreo de muestras
(x1, x2, . . . , xN ), mediante muestreo aleatorio con reemplazo.
Posteriormente, se utiliza la distribución emp´ırica de los
estad´ıstico para construir intervalos de confianza a partir de la
estimación numérica de los momentos:
Se realizan los cálculos para una sub-muestra con reemplazo.
Se obtiene la distribución emp´ırica y se realiza inferencia.
Estimador de la media
Considere la muestra x1, x2, . . . , x1,000 y tomamos m sub-muestras
sobre la cual se obtiene el estad´ıstico de interés (¯x = 1
n
n
i=1 xi) y se
guarda este valor (ˆ¯x1, ˆ¯x2, ˆ¯xm), para obtener la distribución emp´ırica.

21
Bootstrap
Considere el modelo de interés, de donde se desea obtener ˆθ a
partir de algún método de estimación (mco, mle, gmm...), con el
propósito de realizar inferencia:
yi = f(xi, θ, ui)
Se toma una sub muestra de las variables (x1
1, x1
2, ...x1
n:y1
1, y1
2, ...y1
n),
y se obtiene ˆθ1
mco del modelo. Luego, se genera una distribución
emp´ırica a partir de la función g(ˆθ).

22
Efectos marginales de formas funcionales

25
Efecto margial
Nivel-Log: E (y|x1, xj) = β0 + β1x1 + βj log xj:
∂E (y|x)
∂xj
= βj
1
xj
⇒ ∆E (y|x) ≈ βj
∆xj
xj
(23)
∆E (y|x) =
βj
100
∆xj
xj
· 100
Un cambio en xj en un 1 % est´a asociado a un cambio en la media
condicionada de y, de
βj
100.

29
Coeficiente de determinación
Siempre que dispongamos de una constante en el modelo, podemos
descomponer la varianza de una variable aleatoria, como:
V ar (Y ) = V ar (E [yi|xi]) + E u2
(26)
Se aqu´ı se puede obtener el coeficiente de determinación:
R2
= 1 −
E u2
V ar (Y )
=
V ar (E [yi|xi]
E (u2)
(27)

31
Contraste de restricción lineal
Utilizando la propiedad de consistencia Plimˆβ = β y la
distribución asintótica normal se obtiene la distribución del
estimador.
Teniendo por h0 : βj = βjh0 y ha : βj = βjh0 , se puede construir el
estad´ıstico de prueba y establecer la regla de rechazo alrededor de
esta variable.
tˆβj
=
ˆβj − βjh0
ee ˆβj
(28)

32
Contraste de restricción lineal
El tamaño del test es la probabilidad del error tipo I (rechazar H0
cuando esta es verdadera):
l´ım Pr[RechazarH0|H0cierta] = l´ım
n−∞
Pr[Tc
> Tt
|H0] = α
El valor cr´ıtico cα (= tt) depende del tamaño del test seleccionado.
La regla de decisión es: si Tc > Tt, rechazamos H0.

33
Ecuación sobre el precio de las viviendas
Dada la ecuación sobre el precio de las viviendas.
pricei = β0 + β1sqrfti + β2bdrmsi + ui
H0: βbdrms = 0 indica que el tamaño de las casas no tiene efecto
sobre el precio de las viviendas, una vez controlado el resto de
variables incluidas en el modelo.
Ha: βbdrms = 0 indica que el tamaño de las casas tiene efecto sobre
el precio de las viviendas.
Pero interesar´ıa testear Ha: βbdrms > 0, por ende, en muchos casos
enfrentamos la alternativa de una cola.

34
P-valor
El p-valor se deﬁne como el nivel de signiﬁcatividad marginal
(mayor nivel de al que se rechaza h0):
P − valor = Pr[Tt
> Tc
] = 2 (1 − φ (|tc
|))

35
Intervalo de confianza
Una consideración más amplia de la estimación puntual de βj (ˆβj)
es un intervalo de confianza que contiene a βj con cierta
probabilidad (Elejalde, nd):
l´ım
n−∞
Pr[ˆβj − c∞s.e. ˆβj < βj < ˆβj + c∞s.e. ˆβj ] = 1 − α

36
Restricciones de exclusi´on
Permite testear si un conjunto de variables tiene o no efecto sobre
y.
H0 : βk−q+1 = βk−q+2 = ... = βk = 0
Siendo el estad´ıstico de contraste:
F =
(SRCr − SRCnr) /q
SRCnr/ (n − k)
(29)

38
Bibliograf´ıa
1 Elejalde, Ramiro (nd). Esperanza Condicional y Modelo Lineal de Regresión.
Universidad Alberto Hurtado.
2 ————– (nd). Modelo Lineal de Regresión: Inferencia por MCO. Universidad
Alberto Hurtado.
3 Gujarati y Carter (2009). Econometr´ıa.
4 Novales, Alfonso (2016). Modelo de regresión. Universidad complutense de
Madrid.
5 Uriel, E. (2013). Contraste de hipótesis en el modelo de regresión múltiple.
Universidad de Valencia. Descargar.
6 Wooldridge, J. (2009). Introducción a la econometr´ıa: un enfoque moderno. .

Clase9 Esperanza condicional y modelo de regresión

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Clase9 Esperanza condicional y modelo de regresión

Similar a Clase9 Esperanza condicional y modelo de regresión (20)

Más de Nerys Ramírez Mordán

Más de Nerys Ramírez Mordán (8)

Último

Último (20)

Clase9 Esperanza condicional y modelo de regresión