Ejemplo De Sis 3315

MODELOS ECONOMETRICOS SIS – 3315 - A

MODELOS ECONOMETRICOS
EJEMPLOS DE REGRESION SIMPLE
EJEMPLO 1.- Se ha recogido datos de una localidad mediante sendas encuestas sobre el consumo (Y) de productos de hogar y de
la renta (X) de los consumidores consultados, obteniéndose los siguientes resultados:
Se pide:
Observación X Y a) Realizar el grafico correspondiente (diagrama de dispersión)
1 7.1 54.6 b) Encontrar los estimadores (coeficientes) de acuerdo a la tendencia
aproximada en a) para Y sobre X
2 3.4 44.7 c) Elabore la tabla de análisis de varianza (ANOVA)
3 5.5 51.0 d) Establezca un intervalo de confianza del 95% para los estimadores y
para la varianza de regresión.
4 4.3 49.7 e) Se rechazaría la hipótesis de que el verdadero coeficiente de la
5 3.7 47.2 pendiente es 0,3.
f) El modelo elegido tiene poder predictivo, usar �� = 3% de
6 6.0 55.0
significancia
7 3.3 42.9 g) Halle los residuos (error) correspondiente
8 6.7 55.6 h) Proceda b) para X sobre Y (regresión inversa)
i) Pronostique Y para X=5 y obtenga un intervalo de confianza del 95%
9 5.1 47.6 para esta predicción.
10 4.5 49.5 j) Encontrar un intervalo para el coeficiente de correlación con el 97% de
seguridad.
11 2.7 44.6 k) Para los datos mostrados hallar un modelo que pase por el origen.
12 5.9 57.2 l) Encuentre un intervalo con el 98% de seguridad para la predicción
media de Y en x=6.6

SOLUCIÓN

a) DIAGRAMA DE DISPERSION Para emplear las deducciones mostradas
necesitamos elaborar la siguiente tabla:
Tabla Nº 1
Obs. X Y X² Y² XY
1 7,1 54,6 50,41 2981,16 387,66
2 3,4 44,7 11,56 1998,09 151,98
3 5,5 51.0 30,25 2601.00 280,5.0
4 4,3 49,7 18,49 2470,09 213,71
5 3,7 47,2 13,69 2227,84 174,64
6 6.0 55.0 36.00 3025.00 330.00
7 3,3 42,9 10,89 1840,41 141,57
8 6,7 55,6 44,89 3091,36 372,52
9 5,1 47,6 26,01 2265,76 242,76
10 4,5 49,5 20,25 2450,25 222,75
11 2,7 44,6 7,29 1989,16 120,42
Observando la grafica vemos una tendencia lineal que tendrá la forma: 12 5,9 57,2 34,81 3271,84 337,48
�� = �� + �� + �� ∑ 58,2 599,6 304,54 30211,96 2975,99

b) CALCULO DE LOS ESTIMADORES Con las sumatorias de la tabla mostrada calculamos los
coeficientes:
Donde los coeficientes (estimadores) son determinados mediante:
Opción 1 Opción 2 Σx
�� = = 4.850
Σx Σy ��
�� = �� = ∑ ��∑�� 2 − ∑��∑��
�� = Σy
�� ∑ �� 2 − (∑��)2 �� = = 49.967
��
�� ∑�� −�� ∑ �� − ∑��∑��
�� = = 2 �� = �� = 2
∑�� − �� 2 = 22.270
�� ∑�� −�� 2
�� ∑ �� 2 − (∑��)2
�� = ∑��2 − �� 2 = 251.9467
�� = �� − ��
�� = ∑�� − �� = 67.93

EDWIN CHAMBI CANAZA 1 de5


TABLA ANOVA (regresión simple)
Opción 1 Opción 2
Grados
�� 67.9298 12 ∗ 2975.99 − 58.2 ∗ 599.6 Fuente de Suma de Promedio de
de F
�� = = �� = variación cuadrados los cuadrados
�� 22.270 12 ∗ 304.54 − 58.22 libertad
�� = 3.05029 �� = 3.05029 Regresión
�� = �� − �� 599.6 ∗ 304.54 − 58.2 ∗ 2975.99 �� 1 �� = ��
�� = (SSR) ��
�� = 49.967 − 3.05028 ∗ 4.85 12 ∗ 304.54 − 58.22 �� =
�� = 35.17275 Residuos �� 2
�� = 35.17275
(SSE)
�� − �� − 2 �� 2 =
�� − 2
Total
Por lo tanto el modelo es: �� = ��. �� + ��. �� − 1
(SST)

c) ANALISIS DE TABLA ANOVA Par nuestro ejemplo tenemos:
Tabla Nº 2
Suma de cuadrados residuales (SSE) ANÁLISIS DE VARIANZA (TABLA ANOVA)
�� Fuente de Suma de Grados de Promedio de
�� = ∑�� = �� − ��
�� variación cuadrados libertad los cuadrados
F

67.9298 2
Regresión
�� = 251.9437 − = 44.74034 207.2051 1 207.2051
22.270 (SSR)
46.3152
Residuos
Suma explicada de cuadrados (SSR) 44.7386 10 4.4738
(SSE)
�� 67.9298 2 Total
�� = �� = = 207.20633 (SST)
251.9437 11
�� 22.270

Suma total de cuadrados (SST)
�� = �� = 251.9467 d) ANALISIS DEL ITERVALO DE
�� = �� + �� = 251.9467
CONFIANZA PARA �� , �� y (�� )
Coeficiente de determinación (�� ) Con 5% de significancia o el 95% de confianza y (n-k)= (12-2)=10
��
grados de libertad de tablas (Distribución t de Student) encontramos
��
�� 67.9298 2 �� = 2.228
�� =
�� = = = 0.82242
�� 251 .9437 ∗22.270
Para �� :
Coeficiente de correlación (�� ) �� − ��
�� −�� ≤ ≤ �� = �� − ��
��(��)
�� = 0,82243 = 0.90687
�� − �� ≤ �� ≤ ��+�� ∗ ��(�� ) = 1 − ��
Varianza de la regresión
�� 35.1727 − 2.228 ∗ 2.2579 ≤ �� ≤ 35.1727 + 2.228 ∗ 2.2579 = 0.95
�� 44.74034
�� = = = 4.474034 �� . �� ≤ �� ≤ ��. �� = ��. ��
��−�� 12−2

Error estándar de la regresión: ó �� = ��. �� ± ��. ��
Para �� :
�� = 4.474034 = 2.1152
�� − ��
Varianza y desviación estándar (error estándar o típica) �� −�� ≤ ≤ �� = �� − ��
del estimador ��
��(��)
�� − �� ≤ �� ≤ �� +�� ∗ ��(�� ) = 1 − ��
�� = ��
��
+ �� = 5.09849
�� 3.05029 − 2.228 ∗ 0.4482 ≤ �� ≤ 3.05029 + 2.228 ∗ 0.4482 = 0.95
�� = �� = 2.25798 �� . �� ≤ �� ≤ ��. �� = ��. ��
ó �� = ��. �� ± ��. ��
Varianza y desviación estándar (error estándar o típica) del
estimador �� Para La Varianza (�� ) :
��
�� − �� ≤ �� ≤ (�� − ��) �� = �� − ��
�� =
��
= 0.20089 ��
��/�� −��/��
Con (n-2)= (12-2)=10 g.l. y 5% de significancia o 95% de confianza
�� = �� = 0.4482 2
encontramos de tablas (ji-cuadrado) los siguientes valores ��/2 =
2
20.4831 y ��1−�� /2 = 3.24697
Covarianza entre los estimadores: 4.4738 4.4738
�� 12 − 2 ≤ �� 2 ≤ (12 − 2) = 0.95
�� 20.4831 3.24697
��
�� , �� = −�� = −0.97436 ��
�� . �� ≤ �� ≤ ��. �� = ��. ��
��



g) CALCULO DE LOS RESIDUOS
e) PRUEBAS DE HIPÓTESIS
Método 1: método de intervalos de confianza la cual se Análisis de los residuales
encontró en el inciso d) donde obtuvimos el siguiente
intervalo para la pendiente: Pronostico Residuos
Obs. X Y
�� = �� + �� = �� − ��
��. �� ≤ �� ≤ ��. �� 1 7.1 54.6 56,830 -2,230
Por lo tanto rechazamos la hipótesis de que �� = 0.3 ya que 2 3.4 44.7 45,544 -0,844
este valor no se encuentra en el intervalo encontrado. 3 5.5 51.0 51,949 -0,949
4 4.3 49.7 48,289 1,411
Método 2: prueba bilateral (dos lados o dos colas) 5 3.7 47.2 46,459 0,741
�� : �� = 0.3 ; �� : �� ≠ 0.3 6 6.0 55.0 53,475 1,525
Escogemos un nivel de significancia de �� = 5% o lo que 7 3.3 42.9 45,239 -2,339
es lo mismo una confianza del 1 − �� = 95% , Calculamos 8 6.7 55.6 55,610 -0,010
�� −��
�� = que tiene una distribución t-Student entonces de 9 5.1 47.6 50,729 -3,129
��(�� )
tablas con �� − 2 = 12 − 2 = 10 g.l. y 1 − ��/2 = 0.975 10 4.5 49.5 48,899 0,601
Encontrando así ��/2 = 2.228 con la cual definimos la 11 2.7 44.6 43,409 1,191
región critica ��. ��. = −��/2 ; ��/2 12 5.9 57.2 53,169 4,031
��. ��. = −2.228; 2.228
Con nuestros datos calculamos:
�� −�� 3.05028 −0.3
h) REGRESION INVERSA
�� = = El modelo para una regresión inversa es:
��(�� ) 0.4482
�� = 6.1363 �� = ��` + ��`�� + ��
Como �� = 6.1363 ∉ ��. ��. = −2.228; 2.228
Rechazamos �� , es decir se rechaza la hipótesis de que el Utilizando la tabla Nº 1 se calculo:
verdadero coeficiente de la pendiente es 0.3. Σx
�� = = 4.850
��
Método 3: De la misma forma que el método 2, pero se Σy
�� = = 49.967
��
toma el valor absoluto el valor de ��
�� = ∑��2 − �� 2 = 22.270
�� −�� 3.05028 −0.3
�� = = �� = ∑��2 − �� 2 = 251.9437
��(�� ) 0.4482
�� = 6.1363 = 6.1363 �� = ∑�� − �� = 67.9298
Además conocemos �� /2 = 2.228 por lo tanto como:
�� > �� Donde Los estimadores son:
2
�� 67.9298
��. �� > 2.228 Rechazamos �� ` = = = 0.2696
�� 251.9437

��` = �� − ��`��
f) De la tabla de análisis de varianza (ANOVA):
��0 : �� = 0 ��1 : �� ≠ 0 ��` = 4.850 − 0.2696 ∗ 49.967
�� ` = −8.6211
�� = �� ~ �� ,��−��
�� Por lo tanto el modelo es:
�� = �� 2
= 46.3152
Donde con �� = 3% de significancia o el 97% de confianza, 1 g.l. �� = −��. �� + ��. ��
en el numerador y �� − 2 = 12 − 2 = 10 g. l. en el denominador. Cuya suma de cuadrados residuales (SSE) es:
��1 ,��−2 = ��1,10 = 4.96 ��
�� = �� − �� = 3.954567
��
Cuya �� = �� = 4.7094 ∗ 10−4
Por lo tanto como:
�� > ��1,10
46.3152 > 4.96
Rechazamos ��0 : �� = 0
Es decir �� ≠ 0
Por lo tanto el modelo tiene poder predictivo.



i) Para calcular directamente usamos el modelo encontrado
l) Para calcular directamente usamos el modelo encontrado en
en b), así reemplazamos X=5 en:
b), así reemplazamos X=6.6 en:
�� = 35.17283 + 3.05028��
�� = 35.17283 + 3.05028��
�� = 35.17283 + 3.05028 5
�� = 35.17283 + 3.05028 6.6
y obtenemos �� = ��. ��
y obtenemos �� = ��. ��
Con 5% de significancia o el 95% de confianza y (n-k)=
(12-2)=10 grados de libertad de tablas (Distribución t Con 2% de significancia o el 98% de confianza y (n-k)= (12-2)=10
de Student) encontramos �� = ��. �� grados de libertad de tablas (Distribución t de Student)
encontramos �� = ��. ��
�� −��
�� = �� + + = ��. �� −��
�� = �� + = ��. ��
��
�� −��
�� −�� ≤ ≤ �� = �� − �� −��
��
�� −�� ≤ ≤ �� = �� − ��
��
�� 0 − �� ∗ ��0 ≤ ��0 ≤ ��0 +�� ∗ ��0 = 1 − ��
�� 0 − �� ∗ ��0 ≤ �� 0 ≤ ��0 +�� ∗ ��0 = 1 − ��
�� 50.4242 − 2.228 ∗ 2.0258 ≤ ��0 ≤ 50.4242 + 2.228 ∗ 2.0258
= 0.95 �� 55.3046 − 2.764 ∗ 0.99403 ≤ �� 0 ≤ 55.3046 + 2.764 ∗ 0.99403 =
0.95
�� . �� ≤ �� ≤ ��. �� = ��. ��
�� . �� ≤ �� ≤ ��. �� = ��. ��
j) Con 3% de significancia o el 97% de confianza, de tablas
(Distribución Normal) encontramos con EJEMPLO 2.-Un investigador ha estimado el siguiente
�� = 1 − 0.03/2 = 0.985 el valor �� = ��. �� donde modelo con una muestra de 5 observaciones :
conocemos �� = 0.90687
�� 1 �� = ��1 + ��2 �� + ��
�� = = = 0.333
��−�� 12−3 Una vez realizada la estimación extravía toda la
�� +�� 1 1+0.90687 Información de que disponía excepto la que aparece
�� = �� = ln = 1.5096 en la siguiente tabla:
�� −�� 2 1−0.90687

Donde el intervalo de confianza de �� es : Obs. 1 2 3 4 5
�� +�� 1 3 4 5 6
�� − �� ∗ �� ≤ �� ≤ �� + �� ∗ ��
�� −��
�� 2 -3 0 ¿? ¿?
1 1+��
1.5096 − 2.17 ∗ 0.333 ≤ ln ≤ 1.5096 + 2.17 ∗
2 1−�� Con esta información el investigador debe calcular una
0.333 estimación de la varianza de las perturbaciones aleatorias
¿Cómo debe proceder?
��. �� ≤ �� ≤ ��. ��
SOLUCION
k) El modelo que pasa por el origen es: El primer problema que tenemos que resolver es hallar los
Método de los mínimos cuadrados valores de los residuos para las observaciones número 4 y 5.
Para ello, tenemos en cuenta que las dos ecuaciones normales
�� = �� + �� de los coeficientes imponen restricciones sobre los
residuos, ya que
�� = ∑ ��2 = ∑ �� − ��

�� = ��
= ∑ �� − �� −��
�� =��
��
∑ �� − �� 2 = 0 �� = ��
∑ �� − �� ∑ ��2 =0 ��=��

Por lo tanto, en nuestro caso concreto se verificará que
∑ ��
�� = ∑ �� + �� + �� + �� + �� = ��
��
2975 .99 �� + �� + �� + �� + �� = ��
�� = = 9.77208
304 .54

�� = ��. ��



Sustituyendo los valores de la tabla se obtiene que
2 − 3 + 0 + ��4 + ��5 = 0 2
�� = ∑��2 − �� 2
2
2 ∗ 1 − 3 ∗ 3 + 0 ∗ 4 + 5��4 + 6��5 = 0 Sabemos que: �� =
�� = ∑��2 − �� 2
es decir �� = ∑�� − ��
��4 + ��5 = 1
5��4 + 6��5 = 7
La tendencia tiene la forma:
Resolviendo, el sistema anterior, se obtiene que
�� = �� + �� + ��
�� = −��
�� =2 Donde conocemos:
��
El estimador insesgado de la varianza de las perturbaciones viene �� =
��
dado por:
∑��
��=��
�� = �� − ��
�� =
�� − �� Realizando los cálculos correspondientes con los
Aplicando la fórmula nuestro caso se obtiene que datos corregidos tenemos:

∑��
2 ��= 172
��=��
�� = ��= 111
�� − �� = 32760
�� + (−��)�� + �� + (−��)�� + �� = 7690
�� = = ��
�� − �� = 15880
Obsérvese que en el denominador de la fórmula figura T-2 �� = 0.484737
(en lugar de T), debido precisamente a que se pierden 2 grados ��= 27.62515
de libertad por las restricciones que imponen las ecuaciones
normales. �� = ��. �� + ��. ��
2
2
��
EJEMPLO 3.- Basado en una muestra de 10 observaciones se �� =
��
obtuvieron los siguientes resultados:
158802
∑Yi = 1110 ∑Xi = 1700 ∑Xi Yi = 205500 ��2 =
�� =1
32760 ∗ 7690
∑Xi2 = 322000 ∑Yi2 = 132100
�� = ��
��
Con el coeficiente de correlación �� = 0.9758. Pero al verificar por
Por lo tanto el efecto es:
segunda vez estos cálculos, se encontró que se habían registrado
dos pares de observaciones
Y X Y X error  1  0.9758  0.0242
90 120 En lugar de 80 110
140 220 150 210 Por tanto la r correcta es: �� = �� la cual nos indica
una perfecta correlación de los datos tomados por
Cuál será el efecto de este error en r? obténgase la r correcta. segunda vez.
Llevando a una tabla los datos:
Y X Y² X² XY
ANTES 80 110 6400 12100 8800
150 210 22500 44100 31500
AHORA 90 120 8100 14400 10800
140 220 19600 48400 30800
Donde los nuevos valores se calculan a continuación:

 Y  1110  (80  150)  (90  140)  1110
i

 X  1700  (110  210)  (120  220)  1720
i

 X 322000  (12100  44100)  (14400  48400)  328600
i
2

 Y  132100  (6400  22500)  (8100  19600)  130900
i
2

 X Y  205500  (8800  31500)  (10800  30800)  206800
i i


Ejemplo De Sis 3315

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (18)

Similar a Ejemplo De Sis 3315

Similar a Ejemplo De Sis 3315 (20)

Ejemplo De Sis 3315