Curso i.modulo 2.modelo de regresion dos variables.2012
1. MODULO 2. EL MODELO DE REGRESION DE DOS VARIABLES
(ESTIMACIÓN UNIECUACIONAL)
2. UNIDAD 2. EL MODELO DE REGRESIÓN DE DOS VARIABLES
Objetivos Particulares
•Podrá constituir modelos económicos simples de relaciones entre variables económicas
. Aplicará la metodología para evaluar modelos de regresión simple
Contenido
2.1. Antecedentes
2.2. El problema de la estimación
2.3. Planteamiento del modelo
2.4. Estimación de la media
2.5. El método de los mínimos cuadrados
2.6. Propiedades de los estimadores mínimo-cuadráticos
2.7. El teorema de Gauss-Markov
2.8. Estimación de la varianza. Coeficiente de determinación
3. EL MODELO DE REGRESION DE DOS VARIABLES
(ESTIMACIÓN UNIECUACIONAL)
ANTECEDENTES
El modelo de regresión.
Origen histórico del término regresión: Este término fue
introducido por Francis Galton en un estudio donde se analiza la
estatura de los hijos en base a la estatura de los padres obteniendo
lo que le denomina él una Regresión a la mediocridad.
Ley de regresión Universal de Galton
Karl Pearson comprueba dicho estudio posteriormente con un
trabajo parecido.
4. x
x x
Estatura de los hijos en75 x x
Pulgadas. x x x
70 x x x x
x x x x
65- x x x x
x x
60 x
60 65 70 75
Estatura de los padres, en pulgadas
Distribución hipotética de las estaturas de los hijos correspondientes a estaturas dadas de
los padres.
5. Interpretación moderna del término regresión
El análisis de regresión está relacionado con el estudio de la
dependencia de una variable, con una o más variables adicionales
(denominadas como variables independientes o explicativas) con la
perspectiva de estimar y/o predecir el valor (poblacional) medio o
promedio de la primera en términos de valores conocidos y fijos (en
muestras repetidas) de las segundas.
7. El modelo de regresión de dos variables
El estudio de este modelo, no es por su
importacia práctica o de aplicación, sino
porque sirve para expresar en forma simple las
ideas básicas del análisis de regresión
8. Planteamiento del modelo. Partiendo de un modelo teórico
o económico donde el consumo (C) está en función del ingreso (Ing)
C = f( Ing )
Que matemáticamente queda expresado como C =β o +β 1 Ing si
sustituimos variables como C=Y e Ing= Xi; este se puede expresar
como sigue:
Y= β o + β1 X .........( 1)
Que graficamente se plantea como sigue.
9. GRAFICO 1. PLANTEAMIENTO MATEMÁTICO DE LA
EXPRESIÓN C=Bo + B1 Ing
Si C= Y Ing= Xi
Y
B1
Consumo
1
Bo
X
Ingreso
la expresión anterior alquedar como sigue: Y= β o + β1 X .........( 1) el cual
es ahora un modelo mas general.
10. Como el análisis de regresión relaciona una variable dependiente, con
una o más independientes , con la perspectiva de estimar y/o predecir
el valor medio o promedio de la primera en términos de valores
conocidos o fijos de las segundas, matemáticamente el modelo (1) se
puede expresar como sigue al aplicar la definición de regresión
E (Y | Xi) = β o + β1 Xi ...........( 2) a esta se le llama como FUNCIÓN DE
REGRESIÓN POBLACIONAL (FRP).
Que graficamente es:
11. GRAFICO 2: PLANTEAMIENTO GRÁFICO DE LA FUNCIÓN DE
REGRESIÓN POBLACIONAL (FRP).
Y
FRP
CONSUMO
E(Y | Xi)
X
INGRESO
12. La misma ecuación dos expresada en forma estocástica se
plantea de la siguiente forma:
Y = β o + β1 Xi + u i ...........( 3)
donde como sabemos β o + β1 Xi = E (Y| Xi ) y u i es una
variable aleatoria o término de error estocástico, por
tanto ( 3) se expresa así
Y= E (Y| Xi) + u i .
Pero como en la práctica no esta a nuestro alcance toda la
información de una población para analizarla o estudiarla, se toma
una o unas muestras de esta población de valores de Y y de valores
fijos de X, quedando expresada como:
Λ Λ Λ
Y = β 0 + β1 X i
.........( 4 ) donde
Ŷ = estimador de E (Y | Xi) .
β o = estimador de βо
ˆ
β = estimador de βı
ˆ1
A la ecuación ( 4 ) se le denomina Función de Regresión Muestral
(FRM)
13. Yi Yi
Λ Λ Λ
FRM: Yi = β 0 + β1 X i
ei
Ui
ˆ
Yi
CONSUMO FRP:E (Y| Xi)=
E( Y| βο+βıXi
A Xi)
Λ
Yi= Yi + ei : FRM
Yi= E(Y | Xi) +ui :FRP
INGRESO X
GRAFICO 3. REPRESENTACIÓN GRAFICA DE LAS ECUACIONES DE
REGRESIÓN POBLACIONAL Y MUESTRAL
14. EL MÉTODO DE MÍNIMOS CUADRADOS ORDINARIOS (MCO)
El método de mínimos cuadrados ordinarios o mínimos cuadrados es atribuible a
Carl Friedrich Gauss, matemático alemán , quien lo desarrollado en 1821.
Mínimos cuadrados permite obtener una FRM con buenas características para
explicar una población, si cumple con ciertos supuestos.
MCO ofrece bajo ciertos supuestos algunas propiedades estadísticas muy
atractivas en sus resultados, pero veamos en que consiste y por que se utiliza.
Si partimos de la expresión ( 5) que es la Función de Regresión Muestral (FRM)
ˆ ˆ
Yi = β o + β1 Xi + ei como sabemos que parte de (5) se puede expresar como sigue:
Λ Λ Λ
Yi = β 0 + β1 X i que es la expresión (4) por lo tanto Yi = Ŷi + ei ......( 6 )
donde Ŷi es el valor estimado Yi poblacional.
15. Al expresar la función de regresión muestral en su forma estocástica de la siguiente
manera tendremos:
ei = Yi – Ŷi .....................................( 7 )
ei = Yi - β o - β1 Xi esta última nos expresa que los ei (los residuales) son simplemente la
ˆ ˆ
diferencia entre los valores reales y los estimados de Y (ver grafica 4 )
De aquí se tiene que una función de regresión que esta bién ajustada tendrá una
diferencia entre el valor observado y calculado pequeña, como lo muestra el grafico 4.
Pero como se está trabajando con una serie de información como lo denota el subíndice
“i”, se tendrá a ( 7 ) como:
Σei = Σ (Yi – Ŷi ) ...........( 8 )
16. Yi Yi
Λ Λ Λ
e3 Ŷi
FRM:Yi = β 0 + β1 X i
e1 Ŷi
Ŷi
Ŷi e4
e2
Yi Yi
GRAFICO 4. EL CRITERIO DE MÍNIMOS CUADRADOS
17. En este caso una función de regresión que este bien ajustada tendrá una diferencia entre los
valores observados y calculados mínima, es decir, que la Σei debe ser la más pequeña
posible. Sin embargo al hacer la suma algebráica esta puede ser pequeña o aun cero, lo cual
nos indicaría un buen ajuste en el modelo pero, al analizar los datos nos podemos dar
cuenta que esto no es así es decir estos estan muy dispersos.
Una forma de solucionar esto es mediante lo siguiente:
18. El Método de Mínimos Cuadrados Ordinarios (MCO) elimina la
posibilidad planteada con anterioridad al realizar lo siguiente:
Σe2i = Σ (Yi – Ŷi)2 …………………….. ( 9 ) haciendo por lo tanto que
todos los ei, sean positivos.
Si se sustituye a Ŷi por su equivalente ( 9 ) puede expresarse como
β o β1
ˆ ˆ
sigue:
la expresión–anterior se …………….. ( 10) también como sigue:
Σe2i = Σ (Yi - Xi )2 puede plantear
ˆ ˆ
β o β1
Σe2i = Q ( ) …………………….. (11 )
¿qué implica esto?
Que se le asigna un mayor peso a los residuales que son más grandes
como es el caso de e1 y e4 , que a los que están más cerca (ver grafico),
debido a que cuanto más grandes sean los ei (en valores absolutos),
mayor será Σe2i Una justificación adicional para usar el método de MCO
es el hecho de que los estimadores obtenidos tienen propiedades
deseables desde el punto de vista estadística.
19. ¿Qué es lo que hace mínimos cuadrados?
ˆ ˆ
El principio de MCO es seleccionar el valor de β 0 y β1 de forma que para un conjunto
muestral de información la Σe2i sea la mas pequeña posible, es decir, que para una
muestra dada, el método de MCO arroja estimadores únicos de βο y βı que producen el
valor más pequeño posible de la Σe2i . Lo anterior se obtiene mediante un ejercicio
sencillo de cálculo diferencial.
Hay que recordar que existen dos condiciones para que se obtengan valores mínimos de
los parámetros o β´s en una función cualquiera.
21. CONDICIONES PARA MÍNIMIZAR UNA FUNCIÓN
1er. Condición Necesaria pero no suficiente para alcanzar un
mínimo.
Para que ocurra un mínimo de una función Q, las derivadas
parciales que se obtienen de sus parámetros
ˆ
β
0
ˆ
β 1 y deben de
igualarse a cero, con el fin de asegurar la obtención de un valor
extremo.
2da. Condición Necesaria y Suficiente para que “Q” sea un mínimo.
Esta se demuestra cuando a la función “Q” se le obtienen sus
ˆ
β ˆ
β
0 1
segundas derivadas con respecto a y ( de las ecuaciones
normales) y se comprueba a partir de estos resultados que es
positivamente definida ”Q”, al evaluar sus hesianos o menores y
todos son positivos.
NOTA: TODO EL PROCESO DEMOSTRATIVO PARA OBTENER
LOS ESTIMADORES MÍNIMO CUADRÁTICOS Y
DEMOSTRACIÓN DE QUE CUMPLEN CON LAS ANTERIORES
22. La empresa Nielsen Media research reúne datos sobre cuales
publicistas captan las mayores audiencias durante las horas
preferentes en varias cadenas de TV. A continuación vemos los
datos que muestran la cantidad de familias espectadoras, en
millones, y la cantidad de veces que el anuncio salió al aire durante
la semana del 28 de abril al 4 de mayo de 1997 (USA Today, 5 de
mayo de 1997).
•Determine la ecuación de regresión estimada que indique como se
relaciona la cantidad de veces que apareció el anuncio con la
cantidad de familias espectadoras, explique los resultados
Veces que salió al Familias
Marca anunciada aire espectadoras
Burger King 86 616.7
McDonald's 54 439.2
Sears 33 338
Wendy's 28 191.7
Ford Escort 20 174.6
Austin Power movie 14 161.3
Nissan 16 161.1
Pizza Hut 16 147.7
Saturn 16 146.3
Father's Day movie 11 138.2