1. MODELOS ECONOMETRICOS SIS – 3315 - A
MODELOS ECONOMETRICOS
EJEMPLOS DE REGRESION SIMPLE
EJEMPLO 1.- Se ha recogido datos de una localidad mediante sendas encuestas sobre el consumo (Y) de productos de hogar y de
la renta (X) de los consumidores consultados, obteniéndose los siguientes resultados:
Se pide:
Observación X Y a) Realizar el grafico correspondiente (diagrama de dispersión)
1 7.1 54.6 b) Encontrar los estimadores (coeficientes) de acuerdo a la tendencia
aproximada en a) para Y sobre X
2 3.4 44.7 c) Elabore la tabla de análisis de varianza (ANOVA)
3 5.5 51.0 d) Establezca un intervalo de confianza del 95% para los estimadores y
para la varianza de regresión.
4 4.3 49.7 e) Se rechazaría la hipótesis de que el verdadero coeficiente de la
5 3.7 47.2 pendiente es 0,3.
f) El modelo elegido tiene poder predictivo, usar ������ = 3% de
6 6.0 55.0
significancia
7 3.3 42.9 g) Halle los residuos (error) correspondiente
8 6.7 55.6 h) Proceda b) para X sobre Y (regresión inversa)
i) Pronostique Y para X=5 y obtenga un intervalo de confianza del 95%
9 5.1 47.6 para esta predicción.
10 4.5 49.5 j) Encontrar un intervalo para el coeficiente de correlación con el 97% de
seguridad.
11 2.7 44.6 k) Para los datos mostrados hallar un modelo que pase por el origen.
12 5.9 57.2 l) Encuentre un intervalo con el 98% de seguridad para la predicción
media de Y en x=6.6
SOLUCIÓN
a) DIAGRAMA DE DISPERSION Para emplear las deducciones mostradas
necesitamos elaborar la siguiente tabla:
Tabla Nº 1
Obs. X Y X² Y² XY
1 7,1 54,6 50,41 2981,16 387,66
2 3,4 44,7 11,56 1998,09 151,98
3 5,5 51.0 30,25 2601.00 280,5.0
4 4,3 49,7 18,49 2470,09 213,71
5 3,7 47,2 13,69 2227,84 174,64
6 6.0 55.0 36.00 3025.00 330.00
7 3,3 42,9 10,89 1840,41 141,57
8 6,7 55,6 44,89 3091,36 372,52
9 5,1 47,6 26,01 2265,76 242,76
10 4,5 49,5 20,25 2450,25 222,75
11 2,7 44,6 7,29 1989,16 120,42
Observando la grafica vemos una tendencia lineal que tendrá la forma: 12 5,9 57,2 34,81 3271,84 337,48
������������ = ������ + ������������������ + ������������ ∑ 58,2 599,6 304,54 30211,96 2975,99
b) CALCULO DE LOS ESTIMADORES Con las sumatorias de la tabla mostrada calculamos los
coeficientes:
Donde los coeficientes (estimadores) son determinados mediante:
Opción 1 Opción 2 Σx
������ = = 4.850
Σx Σy ������
������ = ������ = ∑ ������∑������ 2 − ∑������∑������������
������ ������ ������ = Σy
������ ∑ ������ 2 − (∑������)2 ������ = = 49.967
������
������������������ ∑������ ������ ������ ������ −������������ ������ ������ ∑ ������������ − ∑������∑������
������ = = 2 ������ = ������������������ = 2
∑������������ − ������������ 2 = 22.270
������������������ ∑������ ������ −������������ 2
������ ∑ ������ 2 − (∑������)2
������������������ = ∑������������2 − ������������ 2 = 251.9467
������ = ������ − ������������
������������������ = ∑������������ ������������ − ������������ ������ = 67.93
EDWIN CHAMBI CANAZA 1 de5
2. MODELOS ECONOMETRICOS SIS – 3315 - A
TABLA ANOVA (regresión simple)
Opción 1 Opción 2
Grados
������������������ 67.9298 12 ∗ 2975.99 − 58.2 ∗ 599.6 Fuente de Suma de Promedio de
de F
������ = = ������ = variación cuadrados los cuadrados
������������������ 22.270 12 ∗ 304.54 − 58.22 libertad
������ = 3.05029 ������ = 3.05029 Regresión
������ = ������ − ������������ 599.6 ∗ 304.54 − 58.2 ∗ 2975.99 ������ ������������������ 1 ������������������ = ������������������������
������ = (SSR) ������������������
������ = 49.967 − 3.05028 ∗ 4.85 12 ∗ 304.54 − 58.22 ������������������ ������ =
������ = 35.17275 Residuos ������ 2
������ = 35.17275
(SSE)
������������������ − ������ ������������������ ������ − 2 ������ 2 =
������ − 2
Total
Por lo tanto el modelo es: ������������ = ������������. ������������������������������ + ������. ������������������������������������������ ������������������ ������ − 1
(SST)
c) ANALISIS DE TABLA ANOVA Par nuestro ejemplo tenemos:
Tabla Nº 2
Suma de cuadrados residuales (SSE) ANÁLISIS DE VARIANZA (TABLA ANOVA)
������������ Fuente de Suma de Grados de Promedio de
������������������ = ∑������������ = ������������������ − ������������������
������ ������������ variación cuadrados libertad los cuadrados
F
67.9298 2
Regresión
������������������ = 251.9437 − = 44.74034 207.2051 1 207.2051
22.270 (SSR)
46.3152
Residuos
Suma explicada de cuadrados (SSR) 44.7386 10 4.4738
(SSE)
������������ 67.9298 2 Total
������������������ = ������������������ = = 207.20633 (SST)
251.9437 11
������������ 22.270
Suma total de cuadrados (SST)
������������������ = ������������������ = 251.9467 d) ANALISIS DEL ITERVALO DE
������������������ = ������������������ + ������������������ = 251.9467
CONFIANZA PARA ������ , ������ y (������������ )
Coeficiente de determinación (������������ ) Con 5% de significancia o el 95% de confianza y (n-k)= (12-2)=10
������������
grados de libertad de tablas (Distribución t de Student) encontramos
������������������ ������������
������������ 67.9298 2 ������������ = 2.228
������������ =
������������ = = = 0.82242
������������������ ������������������ ������������������ 251 .9437 ∗22.270
Para ������ :
Coeficiente de correlación (������������������ ) ������ − ������
������ −������������ ≤ ≤ ������������ = ������ − ������
������������(������)
������������������ = 0,82243 = 0.90687
������ ������ − ������������ ������������ ������ ≤ ������ ≤ ������+������������ ∗ ������������(������ ) = 1 − ������
Varianza de la regresión
������ 35.1727 − 2.228 ∗ 2.2579 ≤ ������ ≤ 35.1727 + 2.228 ∗ 2.2579 = 0.95
������������������ 44.74034
������������ = = = 4.474034 ������ ������������. ������������������������ ≤ ������ ≤ ������������. ������������������������ = ������. ������������
������−������ 12−2
Error estándar de la regresión: ó ������ = ������������. ������������������������ ± ������. ������������������������
Para ������ :
������ = 4.474034 = 2.1152
������ − ������
Varianza y desviación estándar (error estándar o típica) ������ −������������ ≤ ≤ ������������ = ������ − ������
del estimador ������
������������(������)
������ ������ ������ − ������������ ������������ ������ ≤ ������ ≤ ������ +������������ ∗ ������������(������ ) = 1 − ������
������������������ ������ = ������������ ������
������
+ ������������������������ = 5.09849
������ 3.05029 − 2.228 ∗ 0.4482 ≤ ������ ≤ 3.05029 + 2.228 ∗ 0.4482 = 0.95
������������ ������ = ������������������ ������ = 2.25798 ������ ������. ������������������������������ ≤ ������ ≤ ������. ������������������������������ = ������. ������������
ó ������ = ������. ������������������������������ ± ������. ������������������������������
Varianza y desviación estándar (error estándar o típica) del
estimador ������ Para La Varianza (������������ ) :
������������ ������������
������������ ������ ������ − ������ ≤ ������������ ≤ (������ − ������) ������ = ������ − ������
������������������ ������ =
������������������
= 0.20089 ������������
������/������ ������������−������/������
Con (n-2)= (12-2)=10 g.l. y 5% de significancia o 95% de confianza
������������ ������ = ������������������ ������ = 0.4482 2
encontramos de tablas (ji-cuadrado) los siguientes valores ������������/2 =
2
20.4831 y ������1−������ /2 = 3.24697
Covarianza entre los estimadores: 4.4738 4.4738
������ 12 − 2 ≤ ������ 2 ≤ (12 − 2) = 0.95
������ 20.4831 3.24697
������
������������������ ������, ������ = −������ = −0.97436 ������
������ ������. ������������������������ ≤ ������ ≤ ������������. ������������������������ = ������. ������������
������������������
EDWIN CHAMBI CANAZA 2 de5
3. MODELOS ECONOMETRICOS SIS – 3315 - A
g) CALCULO DE LOS RESIDUOS
e) PRUEBAS DE HIPÓTESIS
Método 1: método de intervalos de confianza la cual se Análisis de los residuales
encontró en el inciso d) donde obtuvimos el siguiente
intervalo para la pendiente: Pronostico Residuos
Obs. X Y
������ = ������ + ������������ ������������ = ������ − ������
������. ������������������������������ ≤ ������ ≤ ������. ������������������������������ 1 7.1 54.6 56,830 -2,230
Por lo tanto rechazamos la hipótesis de que ������ = 0.3 ya que 2 3.4 44.7 45,544 -0,844
este valor no se encuentra en el intervalo encontrado. 3 5.5 51.0 51,949 -0,949
4 4.3 49.7 48,289 1,411
Método 2: prueba bilateral (dos lados o dos colas) 5 3.7 47.2 46,459 0,741
������������ : ������ = 0.3 ; ������������ : ������ ≠ 0.3 6 6.0 55.0 53,475 1,525
Escogemos un nivel de significancia de ������ = 5% o lo que 7 3.3 42.9 45,239 -2,339
es lo mismo una confianza del 1 − ������ = 95% , Calculamos 8 6.7 55.6 55,610 -0,010
������ −������
������ = que tiene una distribución t-Student entonces de 9 5.1 47.6 50,729 -3,129
������������(������ )
tablas con ������ − 2 = 12 − 2 = 10 g.l. y 1 − ������/2 = 0.975 10 4.5 49.5 48,899 0,601
Encontrando así ������������/2 = 2.228 con la cual definimos la 11 2.7 44.6 43,409 1,191
región critica ������. ������. = −������������/2 ; ������������/2 12 5.9 57.2 53,169 4,031
������. ������. = −2.228; 2.228
Con nuestros datos calculamos:
������ −������ 3.05028 −0.3
h) REGRESION INVERSA
������ = = El modelo para una regresión inversa es:
������������(������ ) 0.4482
������ = 6.1363 ������������ = ������` + ������`������������ + ������������
Como ������ = 6.1363 ∉ ������. ������. = −2.228; 2.228
Rechazamos ������������ , es decir se rechaza la hipótesis de que el Utilizando la tabla Nº 1 se calculo:
verdadero coeficiente de la pendiente es 0.3. Σx
������ = = 4.850
������
Método 3: De la misma forma que el método 2, pero se Σy
������ = = 49.967
������
toma el valor absoluto el valor de ������
������������������ = ∑������������2 − ������������ 2 = 22.270
������ −������ 3.05028 −0.3
������ = = ������������������ = ∑������������2 − ������������ 2 = 251.9437
������������(������ ) 0.4482
������ = 6.1363 = 6.1363 ������������������ = ∑������������ ������������ − ������������ ������ = 67.9298
Además conocemos ������������ /2 = 2.228 por lo tanto como:
������ > ������������ Donde Los estimadores son:
2
������������������ 67.9298
������. ������������������������ > 2.228 Rechazamos ������������ ������` = = = 0.2696
������������������ 251.9437
������` = ������ − ������`������
f) De la tabla de análisis de varianza (ANOVA):
������0 : ������ = 0 ������1 : ������ ≠ 0 ������` = 4.850 − 0.2696 ∗ 49.967
������������������ ������` = −8.6211
������ = ������������ ~ ������������ ,������−������
������������������ Por lo tanto el modelo es:
������ = ������ 2
= 46.3152
Donde con ������ = 3% de significancia o el 97% de confianza, 1 g.l. ������������ = −������. ������������������������ + ������. ������������������������������������
en el numerador y ������ − 2 = 12 − 2 = 10 g. l. en el denominador. Cuya suma de cuadrados residuales (SSE) es:
������1 ,������−2 = ������1,10 = 4.96 ������������
������������������ = ������������������ − ������������������ = 3.954567
������������
Cuya ������������������������������ = ������ = 4.7094 ∗ 10−4
Por lo tanto como:
������ > ������1,10
46.3152 > 4.96
Rechazamos ������0 : ������ = 0
Es decir ������ ≠ 0
Por lo tanto el modelo tiene poder predictivo.
EDWIN CHAMBI CANAZA 3 de5
4. MODELOS ECONOMETRICOS SIS – 3315 - A
i) Para calcular directamente usamos el modelo encontrado
l) Para calcular directamente usamos el modelo encontrado en
en b), así reemplazamos X=5 en:
b), así reemplazamos X=6.6 en:
������������ = 35.17283 + 3.05028������������
������������ = 35.17283 + 3.05028������������
������������ = 35.17283 + 3.05028 5
������������ = 35.17283 + 3.05028 6.6
y obtenemos ������������ = ������������. ������������������������������
y obtenemos ������������ = ������������. ������������������������
Con 5% de significancia o el 95% de confianza y (n-k)=
(12-2)=10 grados de libertad de tablas (Distribución t Con 2% de significancia o el 98% de confianza y (n-k)= (12-2)=10
de Student) encontramos ������������ = ������. ������������������ grados de libertad de tablas (Distribución t de Student)
encontramos ������������ = ������. ������������������
������ ������������ −������ ������
������������������ = ������ ������ + + = ������. ������������������������������ ������ ������������ −������ ������
������ ������������������ ������������������ = ������ + = ������. ������������������������������
������ ������������������
������������ −������������
������ −������������ ≤ ≤ ������������ = ������ − ������ ������������ −������ ������������
������������
������ ������ −������������ ≤ ≤ ������������ = ������ − ������
������������������
������ ������0 − ������������ ∗ ������������0 ≤ ������0 ≤ ������0 +������������ ∗ ������������0 = 1 − ������
������ ������0 − ������������ ∗ ������������0 ≤ ������ ������0 ≤ ������0 +������������ ∗ ������������0 = 1 − ������
������ 50.4242 − 2.228 ∗ 2.0258 ≤ ������0 ≤ 50.4242 + 2.228 ∗ 2.0258
= 0.95 ������ 55.3046 − 2.764 ∗ 0.99403 ≤ ������ ������0 ≤ 55.3046 + 2.764 ∗ 0.99403 =
0.95
������ ������������. ������������������������ ≤ ������������ ≤ ������������. ������������������������������ = ������. ������������
������ ������������. ������������������������������ ≤ ������ ������������ ≤ ������������. ������������������������������ = ������. ������������
j) Con 3% de significancia o el 97% de confianza, de tablas
(Distribución Normal) encontramos con EJEMPLO 2.-Un investigador ha estimado el siguiente
������ = 1 − 0.03/2 = 0.985 el valor ������������ = ������. ������������ donde modelo con una muestra de 5 observaciones :
conocemos ������������������ = 0.90687
������ 1 ������������ = ������1 + ������2 ������������ + ������������
������������ = = = 0.333
������−������ 12−3 Una vez realizada la estimación extravía toda la
������ ������+������ 1 1+0.90687 Información de que disponía excepto la que aparece
������ = ������������ = ln = 1.5096 en la siguiente tabla:
������ ������−������ 2 1−0.90687
Donde el intervalo de confianza de ������ es : Obs. 1 2 3 4 5
������ ������+������ ������������ 1 3 4 5 6
������ − ������������ ∗ ������������ ≤ ������������ ≤ ������ + ������������ ∗ ������������
������ ������−������
������������ 2 -3 0 ¿? ¿?
1 1+������
1.5096 − 2.17 ∗ 0.333 ≤ ln ≤ 1.5096 + 2.17 ∗
2 1−������ Con esta información el investigador debe calcular una
0.333 estimación de la varianza de las perturbaciones aleatorias
¿Cómo debe proceder?
������. ������������������������ ≤ ������ ≤ ������. ������������������������
SOLUCION
k) El modelo que pasa por el origen es: El primer problema que tenemos que resolver es hallar los
Método de los mínimos cuadrados valores de los residuos para las observaciones número 4 y 5.
Para ello, tenemos en cuenta que las dos ecuaciones normales
������������ = ������ ������������ + ������������ de los coeficientes imponen restricciones sobre los
residuos, ya que
������ = ∑ ������������2 = ∑ ������������ − ������ ������������ ������
������������ ������������ = ������
= ∑ ������������ − ������ ������������ −������������
������������ ������=������
������
∑ ������������ ������������ − ������ ������������2 = 0 ������������ ������������ = ������
∑ ������������ ������������ − ������ ∑ ������������2 =0 ������=������
Por lo tanto, en nuestro caso concreto se verificará que
∑ ������������ ������������
������ = ∑ ������������ ������������ + ������������ + ������������ + ������������ + ������������ = ������
������
2975 .99 ������������ ������������ + ������������ ������������ + ������������ ������������ + ������������ ������������ + ������������ ������������ = ������
������ = = 9.77208
304 .54
������������ = ������. ������������������������������������������
EDWIN CHAMBI CANAZA 4 de5
5. MODELOS ECONOMETRICOS SIS – 3315 - A
Sustituyendo los valores de la tabla se obtiene que
2 − 3 + 0 + ������4 + ������5 = 0 2
������������������ ������������������ = ∑������������2 − ������������ 2
2
2 ∗ 1 − 3 ∗ 3 + 0 ∗ 4 + 5������4 + 6������5 = 0 Sabemos que: ������������������ =
������������������ ������������������ ������������������ = ∑������������2 − ������������ 2
es decir ������������������ = ∑������������ ������������ − ������������ ������
������4 + ������5 = 1
5������4 + 6������5 = 7
La tendencia tiene la forma:
Resolviendo, el sistema anterior, se obtiene que
������������ = ������ + ������������������ + ������������
������������ = −������
������������ =2 Donde conocemos:
������������������
El estimador insesgado de la varianza de las perturbaciones viene ������ =
������������������
dado por:
∑������ ������������
������=������ ������
������ = ������ − ������������
������������ =
������ − ������ Realizando los cálculos correspondientes con los
Aplicando la fórmula nuestro caso se obtiene que datos corregidos tenemos:
∑������ ������������
2 ������= 172
������=������
������������ = ������= 111
������ − ������ ������������������ = 32760
������������ + (−������)������ + ������������ + (−������)������ + ������������ ������������������ = 7690
������������ = = ������
������ − ������ ������������������ = 15880
Obsérvese que en el denominador de la fórmula figura T-2 ������ = 0.484737
(en lugar de T), debido precisamente a que se pierden 2 grados ������= 27.62515
de libertad por las restricciones que imponen las ecuaciones
normales. ������������ = ������������. ������������������������������ + ������. ������������������������������������������������
2
2
������������������
EJEMPLO 3.- Basado en una muestra de 10 observaciones se ������������������ =
������������������ ������������������
obtuvieron los siguientes resultados:
158802
∑Yi = 1110 ∑Xi = 1700 ∑Xi Yi = 205500 ������������2 =
������ =1
32760 ∗ 7690
∑Xi2 = 322000 ∑Yi2 = 132100
������������ = ������
������������
Con el coeficiente de correlación ������ = 0.9758. Pero al verificar por
Por lo tanto el efecto es:
segunda vez estos cálculos, se encontró que se habían registrado
dos pares de observaciones
Y X Y X error 1 0.9758 0.0242
90 120 En lugar de 80 110
140 220 150 210 Por tanto la r correcta es: ������������������ = ������ la cual nos indica
una perfecta correlación de los datos tomados por
Cuál será el efecto de este error en r? obténgase la r correcta. segunda vez.
Llevando a una tabla los datos:
Y X Y² X² XY
ANTES 80 110 6400 12100 8800
150 210 22500 44100 31500
AHORA 90 120 8100 14400 10800
140 220 19600 48400 30800
Donde los nuevos valores se calculan a continuación:
Y 1110 (80 150) (90 140) 1110
i
X 1700 (110 210) (120 220) 1720
i
X 322000 (12100 44100) (14400 48400) 328600
i
2
Y 132100 (6400 22500) (8100 19600) 130900
i
2
X Y 205500 (8800 31500) (10800 30800) 206800
i i
EDWIN CHAMBI CANAZA 5 de5