2. REGRESIÓN LINEAL
• Es la técnica matemático – estadística que analiza la
dependencia entre dos o más variables.
• Observa si las variaciones de una característica
provocan variaciones en la magnitud de otra
característica.
• Es la función matemática que, para un valor dado
de una variable, da el valor esperado de una
característica, con la cual está ligada.
2J. Felix Zuloeta Salazar
3. EJEMPLOS
• El precio de venta (VD; Y) depende del precio de costo de un artículo (VI;
X).
• El costo total (VD; Y) depende de la producción total (VD; X).
• El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VD;
X).
• El consumo familiar (VD; Y) está en función del ingreso familiar VD; X).
Donde:
VD; Y = variable dependiente, predictando, explicativa.
VI; X = variable independiente; predictor, explicativa.
Esta relación se expresa: Y = f(X), “Y depende de X” 3J. Felix Zuloeta Salazar
4. DIAGRAMA DE DISPERSIÓN O NUBE DE
PUNTOS
•
•
•
•
•
••
•
•
•
• •
• •
• •
•
•
•
•
•
• •
•
•
•
•
•
•
•
•
•
•
•
• ••
•
•
• •
•
•
•
••
•
•
•
•
•
•
•
•
•
• •
•
• •
•
• ••
••
••
•
•
••
(a) Lineal directa (b) Lineal inversa (c) Curvilínea directa
(d) Curvilínea inversa (e) Lineal inversa
con más dispersión
(d) Ninguna relación
Y
X
Y
X
Y
X
Y
X
Y
X
Y
X
4J. Felix Zuloeta Salazar
5. MÉTODO DE LOS MÍNIMOS CUADRADOS
RECTA DE LOS MÍNIMOS CUADRADOS:
Si el diagrama de dispersión muestra que los puntos se disponen
siguiendo el lugar geométrico de una recta:
Donde:
X = Variable independiente (estímulo, de influencia, causa).
Y = Variable dependiente (respuesta, criterio, efecto).Ŷ
b0 = Coeficiente autónomo (cantidad media).
b1 = Coeficiente de regresión (pendiente, proporción de cambio).
El modelo de estimación matemática, permite predecir, que valor asume
probablemente Y, cuando la variable X toma un valor determinado,
entonces la ecuación de estimación estará definida por:
, donde Ŷ es un Y estimado, esperado o calculado.
i 0 1 iY = b + b X
i 0 1 i= b + b XY
5J. Felix Zuloeta Salazar
7. CONDICIONES DEL MÉTODO
1. di = ei = (Yi – Ŷi) = dispersión o error.
2. Σdi = Σei = Σ (Yi – Ŷi) = 0
3.
4. Para estimar los coeficientes b0 y b1, en la expresión
sustituimos Ŷi = b0 + b1Xi; obteniendo Σ (Yi – b0 – b1 Xi)2; diferenciando
parcialmente con respecto al intercepto b0 y a la pendiente b1 e igualando a
cero se obtienen las ECUACIONES NORMALES:
De su solución se obtienen los parámetros b0 y b1
2
ii(Y - )
0 1
2
0 1
Y = n b +b X
XY = b X+ b X
2
0 2 2
X Y - X XY
b =
n X - ( X)
n XY - X Y
2
0 2 2
1 2 2
X Y - X XY
b =
n X - ( X)
n XY - X Y
b
n X - ( X)
Y
Y
7J. Felix Zuloeta Salazar
8. APLICACIÓN
• A continuación se muestran los datos observados correspondiente a la
función costo total (C = Yi) medida en millones de soles, con respecto a la
producción total (Q = Xi) medida en miles de soles.
PRODUCCIÓN (Xi) COSTO TOTAL (Yi)
10 30
20 36
30 40
40 48
50 54
60 58
70 66
80 68
8J. Felix Zuloeta Salazar
9. 1. DIAGRAMA DE DISPERSIÓN
REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN
TOTAL Y EL COSTO TOTAL
0
10
20
30
40
50
60
70
80
0 20 40 60 80 100
PRODUCCIÓN
COSTOTOTAL
9J. Felix Zuloeta Salazar
11. 3. PLANTEAR LA ECUACIÓN DE ESTIMACIÓN DE REGRESIÓN
LINEAL
Ŷi = 24,5 + 0,5666667Xi
COSTO TOTAL ESTIMADO = 24,5 + 0,5666667 * PRODUCCIÓN TOTAL
4. INTERPRETAR b0.
Por cada mil unidades que se incremente la producción, el costo
total se incrementará en 566 666,67 soles.
5. ESTIMAR O PREDECIR CUÁNTO SERÁ EL COSTO TOTAL SI SE
QUIERE PRODUCIR 85 000 ARTÍCULOS.
Ŷi = 24,5 + 0,5666667 * 85
Ŷi = 72,66666667 * 1 000 000
Ŷi = 72 666 666,95 SOLES.
i 0 1 i= b + b XY
11J. Felix Zuloeta Salazar
12. 6. GRAFICAR LA RECTA DE REGRESIÓN LINEAL
ESTIMADA
REGRESIÓN LINEAL ENTRE LAPRODUCCIÓN
TOTAL Y EL COSTO TOTAL
y = 0,5667x + 24,5
0
10
20
30
40
50
60
70
80
0 20 40 60 80 100
PRODUCCIÓN
COSTOTOTAL
12J. Felix Zuloeta Salazar
14. El análisis de correlación es la técnica estadística que permite describir el
grado hasta el cual una variable está linealmente relacionada o asociada
con otra.
El coeficiente de correlación (r) mide el grado de afinidad o asociación entre
dos variables.
Coeficiente de Pearson:
Coeficiente de Determinación: CD = r2 * 100
Propiedades de r: -1 ≤ r ≤ +1
a) Si r > 0, existe “correlación directa positiva”.
b) Si r < 0, existe una “correlación inversa negativa”.
c) Si r2 = 1, los datos forman una línea recta.
d) Si r = +1, entonce hay una correlación perfecta positiva.
e) Si r = -1, Existe una correlación perfecta negativa.
f) Si r = 0, las variables son independientes; no están correlacionadas.
2 2 2 2
n XY - X Y
r =
[n X - ( X) ] [n Y - ( Y) ]
14J. Felix Zuloeta Salazar
15. GRADO DE ASOCIACIÓN O INTERRELACIÓN
COEFICIENTE r GRADO DE ASOCIACIÓN
0,0 ± 0,2 NULA
± 0,2 ± 0,4 POCA SIGNIFICATIVA
±0,4 ± 0,7 SIGNIFICATIVA
± 0,7 ± 0,9
BASTANTE
SIGNIFICATIVA
± 0,9 ± 1,0 MUY SIGNIFICATIVA
15J. Felix Zuloeta Salazar
16. APLICACIÓN
Calcule el coeficiente de correlación y el coeficiente
de determinación del ejemplo anterior e interprete.
r = 0,9958246
Interpretación: Entre la producción total y el costo
total existe una correlación o grado de asociación
muy significativa, es decir se acepta que el costo
total esta influenciado por la producción total.
CD =99,17%
Interpretación: El 99,17% de la variación del costo es
explicada por la variación en la producción.
16J. Felix Zuloeta Salazar