Tratamiento, variables instrumentales, Validez del instrumento, Varianza del estimador VI, Mínimo cuadrado en 2 etapas
(MC2E), Prueba de endogeneidad de Hausman
TEMA 3 DECISIONES DE INVERSION Y FINANCIACION UNIVERISDAD REY JUAN CARLOS
Clase10 Endogeneidad y estimación por variables instrumentales
1. 1
Clase 10. Endogeneidad y estimaci´on por variables
instrumentales
Nerys Ram´ırez Mord´an
Pontificia Universidad Cat´olica Madre y Maestra
Econometr´ıa II (EC-411-T)
11 de septiembre de 2018
2. 2
Contenido
1 Introducci´on
¿C´omo surge la
endogeneidad?
Tratamiento
2 M´etodo de variables
instrumentales
Validez del instrumento
Estimador VI
Varianza del estimador VI
3 M´ınimo cuadrado en 2 etapas
(MC2E)
Varianza del estimador
MC2E
Prueba de endogeneidad de
Hausman
Consideraciones finales
4 Referencias
4. 4
Introducci´on
En el modelo MCO de regresi´on m´ultiple:
yi = β0 + β1x1i + β2x2i + · · · + βkxki + ui (1)
Si E(u|xj) = 0 ∀j = 1, 2, · · · , k, se dice las variables explicativas
son end´ogenas, lo que invalida los estimadores MCO,
volvi´endolos inconsistentes.
Endogeneidad cov[xj, u] = 0
Exogeneidad cov[xj, u] = 0
Por tanto, se dice que una variable xj es end´ogena si esta
correlacionada con ui (Wooldridge, 2010, p.54).
5. 5
¿C´omo surge la endogeneidad?
Sesgo por variable omitida.
Tratamiento end´ogeno: cuando en el modelo ln Y = β x + αD + u,
se verifica corr(D, u) = 0.
Simultaneidad.
Error de medici´on, donde la variable x se aproxima a partir de
xproxy = x + e, lo que ocasiona que el error u = u + βe. Es decir,
corr(xproxy, u ) = 0.
6. 6
¿C´omo surge la endogeneidad? Variable omitida
Suponga el modelo de regresi´on:
yi = β0 + β1x1i + β2x2i + ei (2)
Pero se omite la variable relevante x2i, por lo que dy
dx = β2 + du
dx .
yi = β0 + β1x1i + (ei + β2x2i) (3)
7. 7
¿C´omo surge la endogeneidad? Tratamiento end´ogeno
Suponga necesitamos comparar los salarios de individuos que
participan en un programa de capacitaci´on (P):
wi = β0 + β1P + β2Xi + e (4)
Pero, la participaci´on es una variable de elecci´on end´ogena:
Pi = α0 + α1D + α1xi + e (5)
Por lo que, el modelo a estimar es:
wi = β0 + β1 (α0 + α1D + α1xi) + β2Xi + e (6)
Dado corr (D, T) = 0, el no incluir a D en el modelo, el par´ametro
β1 estar´ıa capturando parte del efecto de D.
8. 8
¿C´omo surge la endogeneidad? Error de medida
Suponga el modelo de regresi´on:
yi = β0 + β1xi + ei (7)
Donde xi es una variable relevante (cov[xi, u] = 0), pero no
observada. Estando la variable observada (x∗
i ) sujeta a un error de
medici´on w.
wi = xi − x∗
i
Por lo que, utiliz´andola en el modelo:
yi = β0 + β1x∗
i + ei
yi = β0 + β1(xi − wi) + ei
yi = β0 + β1xi + (ei − β1wi)
Por lo que, el error esta correlado con la variable explicativa
observada.
9. 9
¿C´omo surge la endogeneidad? Simultaneidad
La simultaneidad. ´Esta surge cuando una o m´as de las variables
explicativas se determina conjuntamente con la variable
dependiente (Wooldridge, 2009, p.546).
Suponga el modelo de regresi´on:
yi = β0 + β1xi + ei
Pero xi = f(y).
10. 10
Introducci´on
La idea de las estimaciones con variables instrumentales es
detectar los movimientos en x no correlacionados con el error
(S´anchez-Mangas, nd).
11. 11
Introducci´on
Alternativa 1: el m´etodo de variables instrumentales permite
obtener estimadores consistentes en situaciones donde MCO no.
Este, identifica un instrumento (Z) que cumpla la condici´on de
exogeneidad (cov(z, ) = 0) y relevancia (Corr(Zi, Xi) = 0).
yi = β0 + β1zi1 + ui
12. 12
Introducci´on
Alternativa 2: m´ınimos cuadrados en dos etapas (MC2E).
En la primera etapa estima la relaci´on end´ogena, donde las
dependientes cumplen la condici´on de corr(X, ε) = 0, por tanto,
ˆD = π0 + π2Z tampoco lo estar´a (es decir, a´ısla la parte de D, no
correlacionada con ε), y en una segunda etapa se estima el modelo.
xi = α0 + α1Zi1 + α2Zi2 + ui
yi = β0 + β1ˆxi1 + ui
14. 14
Justificaci´on: variables omitidas
El m´etodo de variables instrumentales reconoce la presencia de
variables omitidas, dejando la variable inobservable en el termino
de error.
Tener en cuenta que MCO es m´as eficiente que VI cuando las
regresoras son ex´ogenas, por lo que, VI solo se utiliza cuando se
demuestra endogeneidad de las variables.
15. 15
Variables instrumentales
La idea del m´etodo de VI es que dado el modelo:
yi = β0 + β1xi + i (8)
Donde x es una variable end´ogena (corr(xi, i) = 0) que hace
inconsistente el estimador MCO.
En consecuencia, necesitamos un instrumento (z) para aislar la
parte de x no correlacionada con . Por lo que, este instrumento
debe cumplir las condiciones de (Alonso, 2015):
1 Exogeneidad (cov(z, ) = 0). En t´erminos pr´acticos, indica que zi no
debe estar correlacionada con las variables omitidas.
2 Relevancia (Corr(Zi, Xi) = 0). Cuando esta correlaci´on es baja,
decimos enfrentamos instrumentos d´ebiles.
16. 16
Ejemplo 1: Ecuaci´on de salarios con variables omitidas
Supongamos un modelo de salario sobre la poblaci´on activa:
log (w) = β0 + β1edui + β2h´abili + ui
Pero al no disponer de una proxy adecuada para la variable h´abil,
esta quedar´a contenida en el residuo del modelo:
log (w) = β0 + β1edui + ( i = uii + β2h´abil) (9)
En este contexto, el m´etodo de VI busca un instrumento (z), que
permita estimar la ecuaci´on anterior, a´un omitiendo la variable
h´abil, utilizando una variable relacionada con la educaci´on, pero
no con la variable omitida como: educaci´on de la madre o el
n´umero de hermanos.
17. 17
Validez del instrumento: Relevancia
La relevancia del instrumento se defini´o a partir de que la
Corr(Zi, Xi) = 0. Por tanto, dado que ambas variables son
observables, se puede testear a partir de la regresi´on.
xi = π0 + π1z + υ (10)
Testear ho : π1 = 0 frente a ho : π1 = 0 para las variables
individuales.
Test F para testear ho : πj = 0 ∀j = 1, 2, ..., ˙k, con ˙k n´umero de
instrumentos.
18. 18
Validez del instrumento: Relevancia
La relevancia incide sobre la manera en que la distribuci´on del
estad´ıstico se aproxima a una normal (afectando la inferencia
(Bound y Bake, 1965)) e incrementa el sesgo (Hall y Piexe, 2003).
Gr´afico 1. Relaci´on precio del petr´oleo y gasolina premium
Fuente: S´anchez-Mangas, UAM.
19. 19
Validez del instrumento: exogeneidad
La exogeneidad del instrumento se defini´o como Corr(Zi, ) = 0,
de lo contrario no se aislar´a el componente de xi no correlado con
ui.
No podemos testear exogeneidad, en la pr´actica solo se supone por
conjetura econ´omica (Alonso, 2015, p.16).
Respecto a las variables omitidas, esta condici´on crea una
diferencia importante entre una proxy y un instrumento, porque
en el caso de la proxy buscamos una alta correlaci´on con la
variable omitida, mientras que en el instrumento no.
20. 20
Estimador VI
Dada la exogeneidad del instrumento Cov(Zi, i) = 0, utilizando el
m´etodo de los momentos:
E[u] = E[y − β0 − β1x] = 0
E[uz] = Cov(Zi, yi − β0 − β1xi1) = 0
De la primera ecuaci´on se obtiene la constante:
1
N (y − β0 − β1x) = 0
βV I
0 = ¯y − βV I
1 ¯x
El estimador de VI se puede obtener (si z = x, βV I
i = βMCO
i ):
Cov(Zi, yi) − β1Cov(Zi, xi1) = 0
βV I
i =
n
i=1
(zi−¯z)(yi−¯y)
n
i=1
(zi−¯z)(xi−¯x)
(11)
21. 21
Estimador VI
Por tanto, cuando el corr(Zi, ui) = 0 el estimador de VI es
consistente (sesgo de consistencia):
βV I
1i =
(zi − ¯z) (yi − ¯y)
(zi − ¯z) (xi − ¯x)
=
(zi − ¯z) Yi
(zi − ¯z) Xi
=
(zi − ¯z) (β0 + β1x1 + ui)
(zi − ¯z) Xi
βV I
1i = β1 +
(zi − ¯z) (ui)
(zi − ¯z) xi
p
−→ β1 +
cov (zi, ui)
cov (zi, xi)
= β1
22. 22
Varianza del estimador VI
Wooldridge (2009, p.511) muestra que la varianza asint´otica del
estimador es:
V (ˆβV I
1 ) =
ˆσ2
nσ2
xρ2
xz
(12)
Siendo ˆσ2 =
˜u2
n−k , estimado con el residuo del modelo de VI; ρ2
xz
es el cuadrado de la correlaci´on poblacional entre x y z (solo en el
caso de regresi´on simple); σ2
x es la varianza poblacional de x.
23. 23
Varianza del estimador VI
V (ˆβV I
1 ) =
ˆσ2
(xi − ¯x)2
R2
xz
(13)
Por tanto, si x es ex´ogena, realizar VI en vez de MCO tiene un
coste en t´erminos de eficiencia, en tal sentido, a menor correlaci´on,
mayor varianza de VI respecto a MCO [recuerde que las varianza
muestral de x, σ2
x = STCx/n, se cancelan las n].
Dado que esta estimaci´on difiere de la de MCO
V (ˆβMCO
1 ) = ˆσ2
(xi−¯x)2 por R2
xz, que al ser siempre menor que 1,
V (ˆβV I
1 ) > V (ˆβMCO
1 ).
24. 24
Varianza del estimador VI
La desviaci´on est´andar del coeficiente se puede utilizar para
obtener los estad´ısticos t y realizar inferencia de la forma habitual.
tvi
ˆβj
=
ˆβj − βho
de(ˆβV I
1 )
(14)
26. 26
MC2E
El m´etodo permite emplear m´as de una variable explicativa
ex´ogena como instrumento (Wooldridge, 2009, p.521).
En una primera etapa se elimina la correlaci´on entre la end´ogena y
el error, mediante instrumentos (variables ex´ogenas) que est´an
altamente correlacionadas con la variable explicativa de inter´es.
Dado dos instrumentos v´alidos (z1 y z2), se podr´ıa utilizar
cualquiera de estos para obtener VI, sin embargo, utilizar una
combinaci´on de ambos ser´a siempre m´as eficiente.
27. 27
MC2E
Suponiendo tres variables instrumentales (z1, z2 y z3) que se
pueden usar como VI, se estima en una primera etapa:
x2 = ˆπ0 + ˆπ1z1 + ˆπ2z2 + ˆπ3z3 + υ (15)
ˆx2 = ˆπ0 + ˆπ1z1 + ˆπ2z2 + ˆπ3z3 (16)
Donde ˆx2, es la parte de x2 no correlacionada con u (como zi no
est´an correlaciona con ui, una combinaci´on lineal de estas
tampoco lo estar´a) se puede utilizar como instrumento de x2.
28. 28
MC2E
La ecuaci´on:
x2 = ˆπ0 + ˆπ1z1 + ˆπ2z2 + ˆπ3z3 + υ (17)
Descompone la variable end´ogena de forma aditiva en dos
componentes:
1 La parte ex´ogena de x, explicada en funci´on de los instrumentos
ˆπ0 + ˆπ1z1 + ˆπ2z2 + ˆπ3z3.
2 La parte end´ogena υ, que es la parte de x no explicada por los
instrumentos.
29. 29
MC2E
Una vez se obtiene la parte ex´ogena de x, se utiliza como
instrumento:
yi = ˆβ0 + ˆβ1ˆx2 + ˆβ2xi + ui (18)
30. 30
Ejemplo 2: Ecuaci´on de salarios de mujeres casadas
Suponga la siguiente ecuaci´on de salarios:
ln salarioi = −18.5 + 0.109educi + ui
Ahora, se utiliza la variable de educaci´on del padre como
instrumento de la variable educ ¿Qu´e suponemos sobre esta
variable?:
educi = 10.24 + 0.269educpadre + ui
Ahora, utilizando ˆeduci, se estima la segunda etapa:
ln salarioi = 0.441 + 0.059 ˆeduci + ui
31. 31
Varianza del estimador MC2E
Wooldridge (2009, p.511) muestra que la varianza asint´otica del
estimador es:
V (ˆβMC2E
1 ) =
ˆσ2
ˆSTC2 1 − ˆR2
xz
Siendo ˆσ2 =
˜u2
n−k , ˆSTC2 es la variaci´on total de ˆx y ˆR2
xz es el R2
de la regresi´on de ˆx sobre todas las variables que aparecen en el
modelo estructural.
32. 32
Prueba de endogeneidad de Hausman
Cuando las variables explicativas son ex´ogenas, los MC2E pueden
tener errores muy grandes, por tanto, la prueba de endogeneidad
nos ayudar´ıan a detectar si se necesita estimar por VI o MC2E.
Housman (1978), utilizando un test χ2, sugiri´o comparar las
estimaciones de MCO y MC2E, y determinar si existen diferencias
estad´ısticamente significativas. Esto, porque ambos m´etodos,
deben ser iguales al menos en el limite dada la consistencia de los
estimadores.
33. 33
Prueba de endogeneidad de Hausman
Para testear si las diferencias en las estimaciones son significativas,
suponga una ´unica variable end´ogena x3i:
yi = β0 + β1x1i + β2x2i + β3x3i + ui (19)
La prueba de regresi´on, estima x3i en funci´on de todas las
variables instrumentales y regresoras:
x3i = ˆπ0 + ˆπ1z1 + ˆπ2z2 + ˆπ3z3 + ˆπ4x1i + ˆπ5x2i + υi (20)
34. 34
Prueba de endogeneidad de Hausman
Ahora, dada corr(Zj, u) = 0, ˆx3i no esta correlacionada con ui,
solo si υ y u, tampoco lo est´an. Es decir, δ = 0 en u = δυ + , si los
errores de ambos modelos no est´an correlacionados.
Ahora, en la pr´actica, como υ no es observable, se utiliza su
estimaci´on (ˆυ) en el modelo original, estimado mediante MCO:
yi = β0 + β1x1i + β2x2i + β3x3i + δˆυ + ui (21)
Sobre esta, se prueba si H0: δ = 0 (x es ex´ogena), mediante el
estad´ıstico t. Si se rechaza, la hip´otesis nula x3i es end´ogena,
porque u y υ est´an correlacionados.
35. 35
Prueba de endogeneidad de Hausman
De forma pr´actica (Ram´ırez F., 2016, p.31):
1 Estimar un modelo entre la variable explicativa end´ogena, sobre
todas las variables explicativas incluyendo los instrumentos. Se
obtienen los residuos.
2 Se agrega este residuo a la ecuaci´on estructural, se estima por MCO
y se eval´ua la significancia de los coeficientes asociados a los
residuos. Si el coeficiente es estad´ısticamente distinto de cero, se
concluye que la variable de inter´es es end´ogena.
36. 36
Consideraciones finales
No es correcto estimar las dos etapas secuencialmente, porque el
termino de error (u), incluye υ.
En la pr´actica, es dif´ıcil encontrar instrumentos v´alidos.
38. 38
Referencias
1 Alonso, 2015 Variables Instrumentales. Departamento de Econom´ıa.
Universidad Carlos III de Madrid.
2 Francisco Ram´ırez (2016). Endogeneidad y estimaci´on por variables
instrumentales. Econometr´ıa II.
3 S´anchez-Mangas, R. (nd). Regresi´on con Variables Instrumentales (VI).
Universidad Aut´onoma de Madrid.
4 Wooldridge, J. (2009). Introducci´on a la Econometr´ıa: un enfoque moderno.
4ta. ed. Michigan State University. Cengage Learning
5 Wooldridge, J. (2010). Econometric Analysis of Cross Section and Panel Data.