1) La relación entre la prueba F y el coeficiente de determinación R2 se expresa mediante una fórmula que indica que ambos varían directamente.
2) Se presentan diferentes modelos de regresión para predecir el precio utilizando diferentes variables.
3) Se discuten diversos estadísticos como el R2 ajustado y criterios de información que permiten seleccionar las mejores variables explicativas para un modelo.
1. LA RELACIÓN ENTRE LA F Y LA 𝑹 𝟐.
Econ. John Campuzano Vásquez. Mgs
Econometría II
Tomado del libro: Principios de econometría. Damodar N. Gujarati. Tercera Edición. Ed.
McGrawHill
2. ¿F Y 𝑹 𝟐 ?
• Utilizando ANOVA la relación es la siguiente:
F =
𝑹 𝟐/ 𝒌 −𝟏
𝟏 − 𝑹 𝟐 / 𝒏 −𝒌
Donde:
n = número de observaciones
k = número de variables explicativas, incluyendo el punto de corte
2Econ. John Campuzano V - Econometría II
Varían directamente
El test de la F, es una medida de la significatividad general de la línea de regresión estimada, también es
una test de significatividad del 𝑅2
.
F = 𝟎,𝟖𝟗𝟎𝟔/ 𝟑 −𝟏
𝟏 −𝟎,𝟖𝟗𝟎𝟔 / 𝟐𝟗 −𝟑
≈ 𝟏𝟏𝟖, 𝟏𝟐
3. INTRODUCCIÓN AL SESGO DE ESPECIFICACIÓN
• Error de especificación o sesgo de especificación (del modelo), concretamente, el
error de especificación consiste en omitir una variable relevante del modelo.
3Econ. John Campuzano V - Econometría II
Dependent Variable: PRECIO
Variable Coefficient Std. Error t-Statistic Prob.
C -191.6662 264.4393 -0.724802 0.4742
ANTIGUEDAD 10.48562 1.793729 5.845711 0.0000
R-squared 0.532509 F-statistic 34.1723
Dependent Variable: PRECIO
Variable Coefficient Std. Error t-Statistic Prob.
C 807.9501 231.0921 3.496226 0.0015
NUMERO_DE_POSTORES 54.57245 23.26605 2.345582 0.0258
R-squared 0.154971 F-statistic 5.501757
Utilizar teoría subyacente y/o de trabajos empíricos para desarrollar un modelo.
4. COMPARACIÓN DE DOS VALORES 𝑹 𝟐: 𝑬𝑳 𝑹 𝟐 𝑨𝑱𝑼𝑺𝑻𝑨𝑫𝑶
4Econ. John Campuzano V - Econometría II
Propiedad importante del , 𝑐𝑢𝑎𝑛𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 𝑠𝑒𝑟𝑎 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑡𝑖𝑣𝑎𝑠 𝑒𝑛 𝑢𝑛 𝑚𝑜𝑑𝑒𝑙𝑜, 𝑚𝑎𝑦𝑜𝑟 𝑠𝑒𝑟á 𝑒𝑛 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑅2
Se necesita una bondad de ajuste que esté ajustada al número de variables explicativas en el modelo, y esta medida se
conoce como 𝑹 𝟐
𝒂𝒋𝒖𝒔𝒕𝒂𝒅𝒐
𝑅2
= 1 −
𝑆𝑅
𝑆𝑇
𝑅2
= 1 −
𝑆𝑅/(n − k)
𝑆𝑇/(𝑛 − 1)
𝑅2 = 1 −
𝑆𝑅(n − 1)
𝑆𝑇(𝑛 − 𝑘)
𝑅2 = 1 − (1 − 𝑅2)
(n − 1)
(𝑛 − 𝑘)
5. TABLA ANOVA
Econ. John Campuzano V - Econometría II 5
Suma de cuadrados (SS)
Varianza explicada por las
variables independientes.
Varianza no explicada
por las variables
independientes
(error)
6. PROPIEDADES DEL 𝑹 𝟐 𝑨𝑱𝑼𝑺𝑻𝑨𝑫𝑶
6Econ. John Campuzano V - Econometría II
Si k ˃ 1, 𝑹 𝟐 ≤ 𝑹 𝟐 , es decir, a medida que aumenta el número de variables explicativas en el modelo, el
𝑹 𝟐
es cada vez más pequeño que el 𝑹 𝟐
sin ajustar. Penalización por añadir más variables explicativas al
modelo de regresión.
Aunque el 𝑅2 sin ajustar siempre es positivo, el 𝑅2 ajustado puede a veces ser negativo.
7. SELECCIÓN DE VARIABLES
• Los modelos de regresión tienen como finalidad la explicación del
comportamiento de una determinada variable:
Variable lado izquierdo.
Variable dependiente
Regresada
Variable a explicar
Endógena
Variables del lado derecho.
Variables independientes
Regresoras
Explicativas
Exógenas
Econ. John Campuzano V - Econometría II 7
8. SELECCIÓN DE VARIABLES
• La selección de variables explicativas se realiza sobre la base de
modelos teóricos estudiados por la Teoría Económica y en base,
también, a la información disponible y a los costos de obtención de la
información.
Econ. John Campuzano V - Econometría II 8
Selección de variables una tarea compleja
Más variables contribuyen a mejorar el
grado de explicación del modelo, pero
que criterios nos dicen si las variables
adicionadas son buenas, considerando el
coeficiente de determinación como la
reducción que sufren los grados de
libertad en el modelo estimado
9. SELECCIÓN DE VARIABLES
• Se plantean diferentes estadísticos que permiten seleccionar las
variables que deben ser explicativas en un modelo econométrico:
1. Coeficiente de determinación ajustado:𝑅2
2. Criterio PC de Amemiya: PC
3. Criterio de información de Akaike: AIC
4. Criterio de Schwarz: SBC
5. Criterio de razón de verosimilitud: RV
Econ. John Campuzano V - Econometría II 9
10. COEFICIENTE DE DETERMINACIÓN
AJUSTADO 𝑹 𝟐
• Se define de modo que penaliza la inclusión de nuevas variables explicativas en el
modelo, ya que, si bien el aumentar el número de regresoras aumenta también la
Suma de Cuadrados Explicados, la inclusión de nuevas variables explicativas
reduce los grados de libertad del modelo, por lo que no siempre resultará
adecuado incorporar nuevas variables al mismo.
Econ. John Campuzano V - Econometría II 10
𝑅2 = 1 −
𝑆𝐶𝑅
𝑛 −𝑘
𝑆𝐶𝑇
𝑛 −1
= 1 -
𝑛 −1
𝑛 −𝑘
1 − 𝑅2
Por lo tanto, este coeficiente
permite seleccionar modelos en
los que ha variado el número de
regresoras, seleccionándose
como mejor modelo aquel que
presente un mayor valor de dicho
coeficiente
11. CRITERIO PC DE AMEMIYA (1980)
• Amemiya introduce un criterio de selección de variables basado en la suma de
cuadrados de residuos y penalizando también la inclusión de regresores
irrelevantes en el modelo.
Econ. John Campuzano V - Econometría II 11
𝑃𝐶 =
𝑆𝐶𝑅
𝑛 − 𝑘
𝑛 + 𝑘
12. CRITERIO DE INFORMACIÓN DE
AKAIKE (1973)
• Es un estadístico que permite seleccionar variables en un modelo de regresión; su
cálculo se realiza a partir de la suma de los cuadrados de residuos del modelo de
regresión y, al igual que los coeficientes anteriores, también penaliza la inclusión
de nuevos regresores en el modelo, seleccionando como modelo más adecuado
aquel que presenta un menor valor de dicho coeficiente.
Econ. John Campuzano V - Econometría II 12
AIC = ln
𝑆𝐶𝑅
𝑛
+
2.𝑘
𝑛
13. CRITERIO DE INFORMACIÓN DE
SCHWARZ (1978)
• Es una alternativa más restrictiva al criterio de información de Akaike y permite,
por tanto, la selección de variables que deben ser incluidas en el modelo. Este
criterio penaliza en un grado mayor la inclusión de nuevos regresores en el
modelo. Al igual que en el caso anterior, se considerará mejor modelo aquel que
presente un menor valor del coeficiente.
Econ. John Campuzano V - Econometría II 13
SBC =
𝑘
𝑛
. ln 𝑛 + 𝑙𝑛
𝑆𝐶𝑅
𝑛
14. MÍNIMOS CUADRADOS
RESTRINGIDOS
• Restringir variables o ponerlas. La inclusión hace que se diga MCR o MCSR.
• ¿Cómo decidimos entre MCR y MCSR?
Econ. John Campuzano V - Econometría II 14
Mediante el test de la F
F =
𝑅 𝑢𝑟
2 −𝑅 𝑟
2 /𝑚
1 − 𝑅 𝑢𝑟
2 /(𝑛 −𝑘)
~𝐹 𝑚,𝑛−𝑘
𝑅 𝑟
2
= 𝑅2
𝑠𝑒 𝑜𝑏𝑡𝑖𝑒𝑛𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑟𝑒𝑠𝑡𝑟𝑖𝑛𝑔𝑖𝑑𝑎
𝑅 𝑢𝑟
2
= 𝑅2
𝑠𝑒 𝑜𝑏𝑡𝑖𝑒𝑛𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 sin 𝑟𝑒𝑠𝑡𝑟𝑖𝑛𝑔𝑖𝑟
m = número de restricciones impuestas por la regresión restringida
n = número de observaciones en la muestra
k = número de parámetros estimados en la regresión sin restringir (incluye el punto de corte)
F =
0,890 −0 /2
1 −0,890 /(32−3)
=
0,445
0,00379
= 117,414