1) O documento discute o problema da inferência na regressão múltipla, incluindo testes de hipóteses sobre os coeficientes e o uso da estatística F.
2) É mostrado um exemplo com dados de mortalidade infantil, onde os coeficientes são testados individualmente usando o teste t e conjuntamente usando o teste F.
3) A análise da contribuição incremental de cada variável é discutida por meio da decomposição da soma dos quadrados do modelo.
1. Econometria
Tópico 3 – Regressão Múltipla
O Problema da Inferência
Ricardo Bruno N. dos Santos
Professor Adjunto da Faculdade de Economia
e do PPGE (Economia) UFPA
2. Lembre-se que os vídeos necessários para o
acompanhamento dessa apresentação são todos os
vídeos que iniciam por 05, e encontram-se dentro da
pasta Vídeos no mediafire.
Link do mediafire:
http://www.mediafire.com/?q1dbpxh1b4uxo
No Slideshare:
3. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O que devemos ter em mente?
- Normalidade dos resíduos, portanto, devemos
considerar:
𝑢𝑖~𝑁(0, 𝜎2)
- Deve-se levar em conta que nossos estimadores são
os Melhores Estimadores Lineares Não Tendenciosos (MELNT)
4. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
A estatística t para avaliar os estimadores ’s continua a
mesma, ou seja, para avaliar a significância estatística
individual dos estimadores devemos considerar que:
𝑡 =
𝛽1 − 𝛽1
𝑒𝑝 𝛽1
𝑡 =
𝛽2 − 𝛽2
𝑒𝑝 𝛽2
𝑡 =
𝛽3 − 𝛽3
𝑒𝑝 𝛽3
Nesse caso, segue distribuição t com n-3 graus de
liberdade.
5. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O teste de hipótese na Regressão Múltipla
Como já observado na regressão simples, o teste de
hipótese anteriormente aplicado é semelhante a múltipla, por
esse motivo, não iremos nos deter nesse tópico novamente,
analisaremos apenas o modelo já estimado na seção anterior
sobre mortalidade infantil, e a partir deste modelo iremos
tecer alguns comentários sobre a análise da significância e da
construção do intervalo de confiança.
6. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
O modelo estimado para o caso da mortalidade infantil
foi:
𝑀𝐼𝑖 = 263,6416 − 0,0056𝑃𝑁𝐵𝑝𝑐𝑖 − 2,2316𝑇𝐴𝐹𝑖
𝑒𝑝 = 11,5932 0,0019 0,2099
𝑡 = 22,7411 −2,8187 −10,6293
𝑝 − 𝑣𝑎𝑙𝑜𝑟 = 0,00000 0,0065 0,000000
𝑅2
= 0,7077 𝑅2
= 0,6981
Podemos estabelecer que:
𝐻0: 𝛽2 = 0 𝑒 𝐻1: 𝛽2 ≠ 0
7. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
A interpretação literal da hipótese nula (H0) seria a de que,
mantida constante a Taxa de Alfabetização Feminina, X2 (PNBpc)
NÃO EXERCE influência (linear) sobre Y ( Mortalidade Infantil). Para
testar tal hipótese, usamos o teste t, onde:
𝑡 = −
0,0056
0,0020
= −2,8187
Podemos então achar o valor tabelado para comparar se o
valor do t calculado de -2,8187 é, em módulo, maior que o valor
tabelado, para encontrarmos o valor tabelado basta consultarmos
a tabela t para 𝛼 = 5% e com 61 graus de liberdade, haja vista
que o número de observações utilizadas é de 64.
Com (n-k) graus de liberdade, sendo k o número de
variáveis, teremos: (64-3=61 gl) o valor tabelado portanto é de 2
8. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Assim, podemos verificar que o valor calculado é maior
que o tabelado, nos direcionando a rejeição da hipótese nula.
Logo a conclusão é de que é significativo o efeito do PNBpc na
Mortalidade Infantil. A seguir podemos visualizar o gráfico
para essa situação:
10. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Outro importante elemento a ser considerado é o intervalo
de confiança do modelo, com os resultados fornecidos já é
possível construí-lo com base na seguinte fórmula:
𝛽2 − 𝑡 𝛼
2
𝑒𝑝 𝛽2 ≤ 𝛽2 ≤ 𝛽2 + 𝑡 𝛼
2
𝑒𝑝( 𝛽2)
Com os valores informados verifica-se que:
−0,0056 − 2 0,002 ≤ 𝛽2 ≤ −0,0056 + 2 0,002
−0,0096 ≤ 𝛽2 ≤ −0,0016
Com isso, o intervalo acima incluirá o verdadeiro valor do
coeficiente 𝛽2 com um nível de confiança de 95%. Dessa forma, se
100 amostras de tamanho 64 forem selecionadas e 100 intervalos
de confiança como o de cima forem formulados, esperamos que
em 95 deles incluam o verdadeiro parâmetro populacional 𝛽2.
11. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
No tópico anterior foi calculado o teste de
Normalidade, e verificou-se que os resíduos atenderam a
hipótese de normalidade.
O teste de significância geral
Já foi retratado que devemos testar se os estimadores
𝛽2 e 𝛽3 são em conjunto iguais a zero, ou seja, devemos
verificar se 𝛽2 = 𝛽3 = 0, para realizar tal procedimento,
deveremos recorrer a estatística F.
Quando abordamos a regressão linear simples, fizemos
uma análise sobre a estatística F, sua forma de interpretação e
o cálculo de sua estatística a partir da tabela da ANOVA.
12. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Porém ficou claro que em modelos simples a medida da
F não possui muito sentido, haja vista que temos apenas uma
variável independente, no caso da regressão múltipla,
teremos duas ou mais variáveis independentes no modelo, o
que deixa o teste F com maior sentido.
Para tanto, vamos recorres a Tabela da ANOVA,
lembrando que essa tabela é composta pela Soma de
Quadrados, que para o modelo múltiplo foi verificado nas
aulas anteriores.
Assim:
13. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
𝑦𝑖
2
= 𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖 + 𝑢𝑖
2
𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅
Considerando a hipótese de normalidade temos:
𝐹 =
𝛽2 𝑦𝑖 𝑥2𝑖 + 𝛽3 𝑦𝑖 𝑥3𝑖
2
𝑢𝑖
2
𝑛 − 3
=
𝑆𝑄𝐸/𝑔𝑙
𝑆𝑄𝑅/𝑔𝑙
14. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Assim a nossa tabela da ANOVA é composta por:
No nosso exemplo temos:
15. Análise da Regressão Múltipla (Tópico 2):
O problema da Inferência
Como a partir dos dados da regressão podemos
encontrar toda a estrutura da ANOVA?
Na verdade a regressão solta dois valores pelos quais
podemos encontrar todos os dados da ANOVA, são a SQR e o
R2.
Vejamos no resultado do modelo de Mortalidade
Infantil
17. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaDevemos lembrar que:
𝑅2 = 1 −
𝑆𝑄𝑅
𝑆𝑄𝑇
E que:
𝑆𝑄𝑇 = 𝑆𝑄𝐸 + 𝑆𝑄𝑅
Se temos 𝑅2 e SQR podemos concluir então que:
𝑆𝑄𝑇 =
𝑆𝑄𝑅
1−𝑅2 logo: 𝑆𝑄𝑇 =
106.315,6
1−0,707665
= 363.677,3
𝑆𝑄𝐸 = 363.677,3 − 106.315,6 = 257.361,7
Considerando: (n-k)=61 e k-1=2 temos
18. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
257.361,7
2
106.315,6
61
=
128.680,8
1.742,879
= 73,8324
Portanto, apenas com duas informações é possível
encontrar todos os valores da tabela da ANOVA.
Considerando então um modelo com k variáveis:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + ⋯ + 𝛽 𝑘 𝑋 𝑘𝑖
Formula-se a hipótese:
𝐻0: 𝛽2 = 𝛽3 = ⋯ = 𝛽 𝑘 = 0
Considerando os resultados da F do modelo da
mortalidade infantil, rejeita-se a hipótese nula, conclui-se que
pelo menos um dos estimadores é diferente de zero.
19. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA importante relação entre o 𝑹 𝟐 e a estatística F
Verificamos que:
𝐹 =
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸
𝑆𝑄𝑅
=
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸
𝑆𝑄𝑇 − 𝑆𝑄𝐸
=
𝑛 − 𝑘
𝑘 − 1
×
𝑆𝑄𝐸/𝑆𝑄𝑇
1 −
𝑆𝑄𝐸
𝑆𝑄𝑇
=
𝑛 − 𝑘
𝑘 − 1
×
𝑅2
1 − 𝑅2
=
𝑅2
𝑘 − 1
1 − 𝑅2
𝑛 − 𝑘
20. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaOu seja, para realizar a estatística F, basta que
tenhamos o valor do R2.
Dessa forma, podemos encontrar a tabela ANOVA pela
seguinte maneira:
21. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA contribuição “incremental” ou “marginal” de uma
variável independente (explanatória)
No tópico anterior, fazendo uso das variáveis
padronizadas, podemos observar que a variável Taxa de
Mortalidade Infantil tinha um peso (impacto) maior na
redução da Taxa de Mortalidade Infantil.
Com o R2 é possível fazer uma outra análise,
verificamos que o R2 para o modelo foi de 0,7077, mas não
podemos informar qual parte desse valor deve-se à variável
PNBpc e qual deve-se a TAF, graças a possível correlação que
possa ocorrer entre as duas variáveis na amostra. Podemos
aplica a técnica da ANOVA para identificar isso.
22. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaProcederemos da seguinte forma: será feita uma
inclusão sequencial estimando um modelo linear tendo como
variáveis dependentes PNBpc e em seguida um modelo com
apenas a TAF. Aqui na verdade queremos verificar a
contribuição individual de cada variável, ou seja, queremos
saber se a inclusão da variável no modelo aumenta a SQE (e,
por conseguinte, o R2).
A regressão obtida considerando apenas MI e PNBpc
será:
23. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
A tabela ANOVA da Regressão será:
24. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaNesse caso o valor da estatística F já se encontra no modelo
(12,3598), mas a sua fórmula de cálculo será:
𝐹 =
60.449,5
4890,7822
= 12,3598
Pelo resultado do modelo, verifica-se que a estatística F é
significativa, observe que se pegarmos a razão t e elevarmos ao
quadrado (-3,5156)^2= 12,3594, que é um valor muito próximo a
estatística F obtida.
Então vamos para a próxima etapa com os seguintes
questionamentos:
1) Qual a contribuição marginal da TAF, sabendo que o PNBpc já
está no modelo e tem relação significativa com MI?
2) A contribuição incremental da TAF é estatisticamente
significativa?
3) Qual o critério para acrescentar variáveis no modelo?
25. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaPara responder a tais perguntas, devemos fazer uso da
ANOVA. Para isso vamos visualizar, em uma tabela, a
contribuição incremental de TAF no modelo, para fazer essa
avaliação devemos fazer o seguinte passo:
𝐹 =
𝑄2/1
𝑄4/61
=
𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 − 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜
𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑠𝑜𝑟𝑒𝑠
𝑆𝑄𝑅 𝑛𝑜𝑣𝑜
𝑔𝑙(= 𝑛 − 𝑛º 𝑑𝑒 𝑛𝑜𝑣𝑜𝑠 𝑝𝑎𝑟â𝑚𝑒𝑡𝑟𝑜𝑠 𝑛𝑜 𝑛𝑜𝑣𝑜 𝑚𝑜𝑑𝑒𝑙𝑜)
Logo usando 𝐹 =
𝑄2/1
𝑄4/61
26. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
Em que o 𝑆𝑄𝐸 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝐸 sob o novo modelo (ou seja, após
adicionar os novos regressores = 𝑄3), 𝑆𝑄𝐸 𝑣𝑒𝑙ℎ𝑜 = 𝑆𝑄𝐸 no
modelo velho (= 𝑄1) e 𝑆𝑄𝑅 𝑛𝑜𝑣𝑜 = 𝑆𝑄𝑅 no novo modelo (ou
seja, levando em conta todos os regressores = 𝑄4). Assim:
27.
28. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
196.912,9
1742,8786
= 112,9814
No entanto, a forma mais fácil de se fazer isso é
utilizando o R2, cuja expressão:
𝐹 =
(𝑅 𝑛𝑜𝑣𝑜
2 − 𝑅 𝑣𝑒𝑙ℎ𝑜
2
)/𝑔𝑙
(1 − 𝑅 𝑛𝑜𝑣𝑜
2
)/𝑔𝑙
𝐹 =
(0,7077 − 0,1662)/1
(1 − 0,7077)/61
= 113,05
A hipótese aqui testada no caso é:
𝐻0: 𝑇𝐴𝐹 𝑛ã𝑜 𝑐𝑜𝑛𝑡𝑟𝑖𝑏𝑢𝑖 𝑝𝑎𝑟𝑎 𝑜 𝑎𝑢𝑚𝑒𝑛𝑡𝑜 𝑑𝑜 𝑆𝑄𝐸
29. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAssim a tabela da ANOVA fica:
30. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaQuando acrescentar uma nova variável?
O procedimento que verificamos anteriormente na
estatística F induz à um método formal para decidir se
devemos adicionar uma variável ao modelo de regressão.
Frequentemente, os pesquisadores são confrontados com a
tarefa de escolher entre vários modelos que envolvem a
mesma variável dependente, mas diferentes variáveis
independentes. A se fazer uma escolha ad hoc (pois muitas
vezes o fundamento teórico é fraco), caímos na tentação de
escolher o modelo que reflete o maior R2 ajustado.
31. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTeste de igualdade para dois coeficientes de regressão
Uma das formas de verificarmos a inserção ou não de
novas variáveis no modelo e observar a restrição (ou
igualdade) dos estimadores de tais variáveis.
Suponha que estejamos trabalhando com a seguinte
regressão múltipla:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝛽4 𝑋4𝑖 + 𝑢𝑖
E que desejamos testar as seguintes hipóteses:
𝐻0: 𝛽3 = 𝛽4 ou 𝛽3 − 𝛽4 = 0
𝐻0: 𝛽3 ≠ 𝛽4 ou 𝛽3 − 𝛽4 ≠ 0
32. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaOu seja, com esse procedimento, passamos a verificar
se (ou testar) se os dois coeficientes angulares 𝛽3 e 𝛽4, são
iguais.
A hipótese nula tem importância prática. Imagine que o
modelo anterior remeta a uma função demanda de um bem,
onde Y= quantidade demandada do bem, X2 = o preço do
bem; X3 = renda do consumidor; X4 = riqueza do consumidor.
Neste caso, a hipótese nula significa que os coeficientes da
renda e da riqueza são os mesmos. Ou, se 𝑌𝑖 e os X forem
expressos em foram logarítmica, a hipótese nula implica que
as elasticidades renda e riqueza do consumo são iguais.
33. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaA hipótese nula com essas características pode ser testada a
partir da seguinte expressão:
𝑡 =
𝛽3 − 𝛽4 − 𝛽3 − 𝛽4
𝑒𝑝 𝛽3 − 𝛽4
Que segue uma distribuição t com (n-4) graus de liberdade.
O erro padrão pode ser obtido pela seguinte equação.
𝑒𝑝 𝛽3 − 𝛽4 = 𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4)
Logo:
𝑡 =
𝛽3 − 𝛽4 − 𝛽3 − 𝛽4
𝑣𝑎𝑟 𝛽3 + 𝑣𝑎𝑟 𝛽4 − 2𝑐𝑜𝑣( 𝛽3, 𝛽4)
34. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaNota
Podemos estabelecer a covariância como:
𝑐𝑜𝑣 𝛽3, 𝛽4 =
−𝜎2 𝑟34
2
𝑥3 𝑥4 − 𝑛 𝑋3 𝑋4 1 − 𝑟34
2
35. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaCom isso, o processo envolve os seguintes passos:
1) Estimados 𝛽3 e 𝛽4. Isso evidentemente pode ser feito pelo
programa de sua escolha, nesse caso estamos vendo o Gretl.
2) A maioria dos programas calcula de forma rotineira os erros
padrões de cada estimador.
3) Obtemos a razão t. Porém, devemos ter cuidado com a
hipótese nula que passa a ser 𝛽3 − 𝛽4 = 0.
4) Se a variável t calculada for maior que o valor crítico de t no
nível de significância proposto para dados graus de liberdade,
poderemos rejeitar a hipótese nula; caso contrário, não a
rejeitamos. Como alternativa, se o valor p da estatística t for
baixo, poderemos rejeitar a hipótese nula.
36. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaPelo resultado da função cúbica de custo total temos:
𝑌𝑖 = 141,7667 + 63,4777𝑋𝑖 − 12,9615𝑋𝑖
2
+ 0,9396𝑋𝑖
3
𝑒𝑝 = 6,3753 4,7786 0,9857 0,0591
𝑅2 = 0,9983 𝑐𝑜𝑣 𝛽3, 𝛽4 = −0,0576
𝑡 =
−12,9615 − 0,9396
0,9867 2 + 0,0591 2 − 2 −0,0576
= −
13,9011
1,0442
= −13,3130
Usando 6 graus de liberdade (10-4), o valor t observado é superior
ao valor tabelado, com isso, podemos concluir pela rejeição da
hipótese nula, ou seja, os valores dos coeficientes são diferentes.
37. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaMínimos Quadrados Restritos: testes de restrições de
igualdade linear.
Existem ocasiões em que a teoria econômica sugere
que os coeficientes de um modelo de regressão estão sujeitos
a algum tipo de restrição de igualdade linear. Por exemplo,
considere a função de produção Cobb-Douglas:
𝑌𝑖 = 𝛽1 𝑋2𝑖
𝛽2
𝑋3𝑖
𝛽3
𝑒 𝑢 𝑖
Na forma logarítmica já verificamos que:
ln 𝑌𝑖 = 𝛽0 + 𝛽2 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖
Vamos supor que queiramos fazer um teste para
verificar a existência de retorno constantes de escala, a teoria
econômica estabelece que: 𝛽2 + 𝛽3 = 1
38. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTrata-se, portanto, de um exemplo de restrição de
igualdade linear. Para descobrir se realmente existem
retornos constantes de escala podemos fazer uso de duas
abordagens.
Abordagem do teste t: A forma mais simples é verificar
pela expressão do teste t considerando agora as restrições,
nesse caso antes estávamos testando:
𝛽2 = 𝛽3 o que resultava em 𝛽2 − 𝛽3 = 0
Agora a situação seria:
𝛽2 + 𝛽3 = 1 o que resulta em 𝛽2 + 𝛽3 − 1 = 0
39. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaCom isso a fórmula estatística do teste t para a
explicitar a restrição, que antes por hipótese era zero,
tornando-se:
𝑡 =
𝛽2 + 𝛽3 − 1
𝑣𝑎𝑟 𝛽2 + 𝑣𝑎𝑟 𝛽3 + 2𝑐𝑜𝑣 𝛽2, 𝛽3
Logo a hipótese nula a ser testada é:
𝐻0: 𝛽2 + 𝛽3 − 1 = 0 , ou seja, a restrição existe, o
que implica que 𝛽2 + 𝛽3 = 1, concluindo-se pelos retornos
constantes a escala.
Rejeitar H0 é concluir pela existência ou de retornos
decrescentes ou retornos crescentes.
40. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaO que torna complicado o uso da t? O fato de calcular a
covariância torna a operação ou uso dessa estatística, apesar
de simples, mais demorado, pois teríamos que encontrar a
matriz var-cov dos estimadores.
Porém há outro método, que pelo uso de duas
regressões poderemos encontrar de forma mais rápida,
apesar de dar mais trabalho, o nosso teste.
41. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAbordagem do teste F: Mínimos Quadrados Restritos
Trata-se de uma abordagem mais direta seria a o teste
F, no entanto, para realizar tal procedimento teríamos que
mudar a nossa restrição, uma delas seria:
𝛽2 = 1 − 𝛽3 ou 𝛽3 = 1 − 𝛽2
Isso nos permite eliminar um dos coeficientes betas na
equação das elasticidades de produção e reescrever a função
Cobb-Douglas da seguinte forma:
ln 𝑌𝑖 = 𝛽0 + 1 − 𝛽3 ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 + 𝑢𝑖
= 𝛽0 + ln 𝑋2𝑖 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖
42. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaTal expressão resulta em:
ln 𝑌𝑖 − ln 𝑋2𝑖 = 𝛽0 + 𝛽3 ln 𝑋3𝑖 − ln 𝑋2𝑖 + 𝑢𝑖
Que pela propriedade do log fica
ln
𝑌𝑖
𝑋2𝑖
= 𝛽0 + 𝛽3 ln
𝑋3𝑖
𝑋2𝑖
+ 𝑢𝑖
Que nos dará a razão produção trabalho Y/X2 e a razão
capital trabalho X3/X2.
Com isso teríamos dois modelos, um com uma
restrição, que foi a modelo que acabamos de construir e
outro modelo sem restrição, que é o modelo sem a
transformação.
Quando formos analisar, o modelo com restrição será,
geralmente, aquele que possuir menor número de variáveis.
43. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAssim, podemos a partir dessa abordagem construir
uma estatística F considerando a SQR de cada um dos
modelos, onde:
𝑢 𝑆𝑅
2
= SQR da regressão sem restrições
𝑢 𝑅
2
= SQR da regressão com restrições
m = número de restrições lineares (no caso desse
exemplo 1)
k = número de parâmetros da regressão sem restrições;
n = número de observações.
Assim,
44. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência
𝐹 =
𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅
𝑚
𝑆𝑄𝑅 𝑆𝑅
𝑛 − 𝑘
=
𝑢 𝑅
2
− 𝑢 𝑆𝑅
2
𝑚
𝑢 𝑆𝑅
2
𝑛 − 𝑘
=
𝑅 𝑆𝑅
2
− 𝑅 𝑅
2
𝑚
1 − 𝑅 𝑆𝑅
2
𝑛 − 𝑘
Onde,
𝑅 𝑆𝑅
2
≥ 𝑅 𝑅
2
e
𝑢 𝑆𝑅
2
≤ 𝑢 𝑅
2
Vamos verificar no exemplo para a função Cobb-
Douglas no Gretl.
45. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaComo exercício reproduza no Gretl o exemplo 8.4 da
página 219, sobre demanda de frango nos EUA.
Teste da Estabilidade estrutural ou dos parâmetros
nos modelos de regressão: O teste de Chow.
Esse teste é aplicado principalmente em series de
tempo, e sua finalidade é a de verificar se, ao longo dos anos,
uma determinada economia teve uma mudança e sua
trajetória, ou seja, ele define se ocorreu alguma mudança no
coeficiente de inclinação de nossa variável de interesse.
46. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaAgora o que seriam essas mudanças estruturais?
Seriam mudança decorrentes de alguns aspectos como:
Decorrente de forças externas – Guerras, Embargos
econômicos, Copa do Mundo no Brasil, etc;
Decorrentes de mudanças na política Econômica:
Câmbio Fixo para Flutuante, Plano Real, etc
Decorrentes de tomadas de decisões: Mudanças
tributárias, Investimentos no Nordeste, Construção de usinas
hidreelétricas, etc.
47. Análise da Regressão Múltipla (Tópico
2):
O problema da InferênciaComo verificar se a mudança ocorreu ou não? É usado
no Gujarati o exemplo da tabela 8.9, que apresenta dados
sobre a renda pessoal disponível e a poupança pessoal, em bi
US$, nos EUA entre 1970-1995.
Sabe-se que em 1982, ocorreu uma forte recessão na
economia americana, fato que poderia influenciar na relação
poupança X renda.
A ideia e construir uma estrutura de modelo onde
possamos verificar se a partir do ano em que se verifica uma
mudança na economia, se a inclinação de nossa variável de
interesse mudou. Assim, pode-se construir 3 regressões
específicas:
48. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência1970-1981 = 𝑌𝑡 = 1 + 2 𝑋𝑡 + 𝑢1𝑡 𝑛1 = 12 (a)
1982-1995= 𝑌𝑡 = 𝛾1 + 𝛾2 𝑋𝑡 + 𝑢2𝑡 𝑛2 = 14 (b)
1970-1995= 𝑌𝑡 = 𝛼1 + 𝛼2 𝑋𝑡 + 𝑢 𝑡 𝑛 = 26 (c)
Como proceder com o teste de Chow?
1) Estima-se a regressão (c) que será adequada se não houver
instabilidade dos parâmetros estimados, obtém-se a SQR com
(n-k) gl. Nesse caso ele será a 𝑆𝑄𝑅 𝑅, nesse caso ela é restrita
pela imposição de 1 = 𝛾1 e 2 = 𝛾2, ou seja, as regressões
dos subperíodos são iguais.
2) Estima-se a equação (a) e obtemos a SQR1, com (𝑛1 − 𝑘) gl.
3) Estima-se a equação (b) e obtemos a SQR2, com (𝑛2 − 𝑘) gl.
49. Análise da Regressão Múltipla (Tópico
2):
O problema da Inferência4) Como estamos considerando que os dois conjuntos de
amostras são independentes, podemos somar SQR1+SQR2 e
dizer que essa soma seja a Soma de Quadrado dos Resíduos
sem restrições (𝑆𝑄𝑅 𝑆𝑅)
5) Aplicamos tudo na Fórmula da F, onde:
𝐹 =
𝑆𝑄𝑅 𝑅 − 𝑆𝑄𝑅 𝑆𝑅
𝑘
𝑆𝑄𝑅 𝑆𝑅
𝑛 − 2𝑘
Vamos fazer no Gretl