Modelo de regresión lineal múltiple

Motivación
Asociación entre variables
MODELO DE REGRESIÓN LINEAL MÚLTIPLE
Andrey Mauricio Montoya Jurado
ASOCIACIÓN ENTRE VARIABLES
Estadística y Probabilidad
Universidad del Quindío
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple

Motivación
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM

Motivación
Regresión
Contenido
1 Motivación
Regresión

Motivación
Regresión
Regresión
La historia dice que Sir Francis Galton a ﬁnales del siglo XIX
estaba interesado en predecir la altura de los hijos a partir de la
altura de los padres.
Despues de reunir las alturas de padres e hijos, veriﬁcó que
padres altos tenían hijos altos y padres bajos tenían hijos bajos.
Esto lo hizo pensar que existía una regresión entre las alturas
de padres e hijos, desde entonces se usa el término Regresión
para asociar variables.

Motivación
Regresión
Motivación
Una de las características del alambre para amarres es su resistencia
a tracción (Y ). Se desea estimar la resistencia a la tracción (Y ) con
la información que proporcionan las variables: altura del amarre (X1),
altura del poste (X2) y longitud del alambre(X3).

Motivación
Contenido
1 Motivación
Regresión

Motivación
Modelo Poblacional del MRLM
Se tiene el interés de relacionar la variable Y con las variables expli-
cativas X1 y X2 utilizando la regresión lineal, se trataría de analizar
un modelo de la forma
Y = b0 +b1X1 +b2X2 +e
Si se dispone de un conjunto de n observaciones (x1i , x2i , yi ), i =
1,...,n
X1 X2 Y
x11 x21 y1
x12 x22 y2
x13 x22 y3
...
...
...
x1n x2n yn
Cuadro : Esquema de una Matriz de Datos con 3 variables

Motivación
Modelo Muestral del MRLM
El sistema de ecuaciones
yi = b0 +b1x1i +b2x2i +ei , i = 1,...,n
Supuestos del modelo:
ei ∼ N 0, σ2 .
ei son no correlacionados.
X1 y X2 son no correlacionadas.
En notación matricial queda expresado en la forma
Y = Xβ +e

Motivación
Modelo de Regresión Lineal Múltiple (MRLM)
donde Y =





y1
y2
...
yn





, X =





1 x11 x21
1 x12 x22
...
...
...
1 x1n x2n





,
β =


b0
b1
b2

, e =





e1
e2
...
en






Motivación
Estimación del modelo
Dado el modelo muestral
yi = b0 +b1x1i +b2x2i +ei , i = 1,...,n
¿Cómo estimar los parámetros b0, b1 b2?

Motivación
Método de mínimos cuadrados
La ecuación Y = Xβ +e puede también expresarse como
e = Y −Xβ
por lo tanto
e e =
n
∑
i=1
e2
i = (Y −Xβ) (Y −Xβ)
= Y Y −2(Xβ) Y +(Xβ) (Xβ)
= Y Y −2β X Y +β X Xβ
es una ecuación que expresa la suma de los cuadrados de los errores
en términos del vector de parámetros β.

Motivación
Método de mínimos cuadrados
El mínimo de esta función se obtiene derivando e e respecto a β e
igualando a cero, esto es
∂e e
∂β
= −2X Y +2X Xβ = 0
lo que conduce ﬁnalmente a la ecuación
X Xβ = X Y (1)
y el estimador de mínimos cuadrados de β esta dador por :
β = X X
−1
X Y (2)

Motivación
Caso General del MRLM
Cuando se desea relacionar p variables independientes X1,X2, X3, ,..., Xp
con una variable dependiente Y , el modelo de regresión toma la for-
ma
Y = b0 +b1X1 +b2X2 +···+bpXp +e
Si se dispone de n observaciones (x1i , ,x2i ,,..., ,xpi , yi ), i = 1,...,n
yi = b0 +b1x1i +b2x2i +···+bpxpi +ei , i = 1,...,n
Supuestos del modelo:
ei ∼ N 0, σ2 .
ei son no correlacionados.
X s sean no correlacionados entre ellas.

Motivación
En notación matricial el modelo queda expresado en la forma Y =
Xβ +e
donde Y =





y1
y2
...
yn





, X =





1 x11 x21 ··· xp1
1 x12 x22 ··· xp2
...
...
...
...
...
1 x1n x2n ··· xpn





,
β =





b0
b1
...
bp





, e =





e1
e2
...
en





de (2) tenemos:
β = X X
−1
X Y

Motivación
Con las matrices X X y X Y de la forma:
X X =







n ∑x1i ∑x2i ∑x3i ··· ∑xpi
∑x1i ∑x2
1i ∑x1i x2i ∑x1i x3i ··· ∑x1i xpi
∑x2i ∑x2i x1i ∑x2
2i ∑x2i x3i ··· ∑x2i xpi
...
...
...
...
...
...
∑xpi ∑xpi x1i ∑xpi x2i ∑xpi x3i ··· ∑x2
pi







X Y =







∑yi
∑x1i yi
∑x2i yi
...
∑xpi yi








Motivación
Una de las características del alambre para amarres es su resistencia
a tracción (Y ). En la tabla, está la información sobre esta variable,
altura del amarre (X1), altura del poste (X2) y longitud (X3) para
19 alambres.

Motivación
Datos de las variables de alambre para amarres.
Y X1 X2 X3
8,0 19,6 29,6 94,9
8,3 19,8 32,4 89,7
8,5 19,6 31 96,2
8,8 19,4 32,4 95,6
9,0 18,6 28,6 86,5
9,3 18,8 30,6 84,5
9,3 20,4 32,4 88,8
9,5 19,0 32,6 85,7
9,8 20,8 32,2 93,6
10,0 19,9 31,8 86,0
10,3 18,0 32,6 87,1
10,5 20,6 33,4 93,1
10,8 20,2 31,8 83,4
11,0 20,2 32,4 94,5
11,3 19,2 31,4 83,4
11,5 17,0 33,2 85,2
11,8 19,8 35,4 84,1
12,3 18,8 34 86,9
12,5 18,06 34,2 83,0
Cuadro : Datos de las variables de Alambre para amarres.

Motivación
Forma matricial del problema
La variable Y se puede relacionar con las variables X1, X2, y X3 a
través del modelo de regresión lineal múltiple
Y = b0 +b1X1 +b2X2 +b3X3 +e
En forma matricial
Y =







8
8,3
8,5
...
12,5







X =





1 19,6 29,6 94,9
1 19,8 32,4 89,7
...
...
...
...
1 18,6 34,2 83,0






Motivación
Utilizando R (lenguaje y entorno de programación para análisis es-
tadístico y gráﬁco) tenemos:
X X =




19 368,3 612 1682,2
368,3 7155,45 1186,22 32643,48
612 11863,22 19757,92 54154,88
1682,2 32643,48 54154,88 149323,1




X Y =




192,5
3725,66
6227,26
16980,18





Motivación
(X X)−1
=




61,834 −0,681 −0,867 −0,233
−0,681 0,078 −0,005 −0,007
−0,867 −0,005 0,024 0,002
−0,233 −0,007 0,002 0,003




ﬁnalmente
β =




b0
b1
b2
b3



 = (X X)−1
X Y =




5,6458
−0,1131
0,5187
−0,1133





Motivación
Modelo de regresión que relaciona las variables
Así el modelo que relaciona las variables: resistencia a la tracción
(Y ), altura del amarre (X1), altura del poste (X2), y longitud del
alambre (X3), para los datos de la tabla es
Y = 5,6458−0,1131X1 +0,5187X2 −0,1133X3 (3)

Motivación
Evaluación del modelo
Debemos probar la signiﬁcancia de los parámetros estimados
H0 : bi = 0 i = 0,1,2,3
H1 : bi = 0
Si p−valor > 0,05

Motivación
Conﬁrmación de los resultados utilizando STATGRAPHICS

Motivación
Mejor ajuste utilizando STATGRAPHICS

Motivación
Diagramas de dispersión para las variables explicativas
Para visualizar la no colinealidad entre las variables regresoras X1, X2
y X3 aparecen en la ﬁgura los diagramas de dispersión entre diferentes
pares de variables.
Figura : Diagramas de dispersión para las variables explicativas X1, X2 y X3.

Motivación
Matriz de correlación
La matriz de correlación entre las variables explicativas X1, X2 y X3
es
Corr(Xi ,Xj ) =
X1
X2
X3
X1 X2 X3
1,0000 0,0031 0,4463
0,0031 1,0000 −0,2248
0,4463 −0,2248 1,0000
y como puede observarse no existe correlación lineal alta entre ningún
par de variables, conﬁrmándose de nuevo la no colinelidad.

Motivación
La calidad del Modelo de Regresión Multiple
La evaluación del Modelo de Regresión Multiple se hace, a travez de
R2
=
ˆβ X Y −n(¯y)2
∑n
i=1 Y 2
i −n(¯y)2
Utilizando el paquete R tenemos
¯y = 10,13
n
∑
i=1
y2
i = 1983,55 ˆβ X Y = 1971,9
Finalmente se tiene que el coeﬁciente de determinación es
R2
=
1971,9−19(10,13)2
1983,55−19(10,13)2
= 0,65
lo cual signiﬁca que las tres variables independientes consideradas en
este ejemplo explican el 65% de la variación de la resistencia a la
tracción.

Motivación
MUCHAS GRACIAS

Bibliograﬁa Lecturas Complementarias
Lecturas Complementarias I
Hurtado, L. H., García, M. D., Galvis, D. M., & Salcedo, G. E.
(2006). Estadística Básica. Armenia.
Mendenhall, W., Beaver, R., & Beaver, B. (2003). Introducción
a la probabilidad y estadística. Mexico: Thomson Learning.
Ross, S. (2000). Probabilidad y Estadística para Ingenieros.
Mexico: McGRAW-HILL.
Draper, N. R., & Smith, H. (1966). Applied Regression
Analysis. New York: John Wiley & Sons, Inc.

Modelo de regresión lineal múltiple

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Modelo de regresión lineal múltiple

Similar a Modelo de regresión lineal múltiple (11)

Último

Último (20)

Modelo de regresión lineal múltiple