Este documento introduce el análisis de correlación y regresión lineal. Explica que estas técnicas estadísticas se usan para analizar la relación entre dos o más variables. Luego presenta ejemplos como la relación entre precios de acciones y política de dividendos, y ventas y gasto en publicidad. Finalmente, describe brevemente la regresión lineal simple y múltiple.
2. Correlacióny Regresión lineal
Se dan situaciones donde el análisis involucra
considerar la relación de dos o más variables…..
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
3. Ejemplos
Un analista financiero podría estar interesado en la relación entre
el comportamiento de los precios de las acciones y la política de
dividendos de las compañías del mercado de valores.
Un gerente de ventas puede estar interesado en examinar la
relación entre las ventas y el gasto en publicidad.
El gerente de créditos de un banco podría estar interesado en la
relación entre el precio de una casa y diversos factores, como su
área, antigüedad, etc.
El análisis de correlación y el de regresión lineal son técnicas
estadísticas de aplicación difundida para estas situaciones.
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
4. Regresión Lineal Simple
Suponga que se ha calculado y validado la correlación entre los años
de venta de los vendedores y su volumen de ventas, se quiere
analizar esa relación. El método estadístico para este fin es el
Análisis de Regresión.
Si solo se tienen dos variables la técnica se refiere como Análisis de
Regresión Lineal Simple, el cual se ve en esta sesión. La siguiente
sesión considerará el caso del Análisis de Regresión Lineal Múltiple.
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
5. Regresión Lineal
X, Y Análisis
X, Y
Correlacionadas
Regresión Lineal
y = β0 + β1x + ε
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
6. Introducciónal Análisisde Regresión
El análisis de regresión es usado para:
Predecir el valor de una variable dependiente (y)
basado en el valor de al menos una variable
independiente (x).
Explicar el impacto de cambios de una variable
independiente sobre la variable dependiente.
Variable dependiente: Variable que se desea
explicar.
Variable independiente: Variable usada para
explicar la variable dependiente.
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
7. Modelode Regresión Lineal Simple
Sólo una variable independiente, x.
La relación entre x e y es descrita por
una función lineal.
Se asume que los cambios en y son
causados por cambios en x.
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
8. Tiposde RegresiónLineal
Relación Lineal Positiva
Relación Lineal Negativa
Relación NO Lineal
No Hay Relación
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
10. Regresión Lineal Poblacional
Error aleatorio para
este valor de x
y
x
Valor observado
de y para xi
Valor estimado
de y para xi
xi
Pendiente = β1
Intercepto = β0
εi
0
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
11. Coeficientesdel Modelo Poblacional
Pendiente β1
Cambio promedio en la variable dependiente (y) ante
una variación unitaria de la variable independiente (x).
Cambio en μy/x ante una variación unitaria de x.
Intercepto β0
Valor promedio de la variable dependiente (y) cuando
la variable independiente (x) es cero. Interpretación
válida si x puede asumir el valor 0, caso contrario, no
se tiene una interpretación válida.
14-11
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
12. La línea de regresión muestral proporciona un
estimado de la línea de regresión poblacional
Regresión LinealEstimada
Estimado del
intercepto de
regresión
Estimado de la
pendiente de
regresión
Valor
predecido
de y
Variable
independiente
Los términos de errores individuales (ei) tienen una media de cero
𝑦 = 𝑏0 + 𝑏1𝑥
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
13. b0 es el estimado del valor promedio de y cuando
el valor de x es cero.
b1 es el estimado del cambio en el valor promedio
de y que resulta de un cambio de una unidad en
x.
Interpretaciónde la Pendiente y del Intercepto
Regresión lineal muestral:
Modelo regresión lineal muestral:
𝑦 = 𝑏0 + 𝑏1𝑥
y = 𝑏0 + 𝑏1𝑥 + 𝑒
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
14. Criteriode MínimosCuadrados
b0 y b1 son obtenidos hallando los valores
que minimizan la suma de cuadrados de los
residuales (error)
Las ecuaciones para b1 y b0 son:
𝒃𝟎 = 𝒚 − 𝒃𝟏𝒙
𝒃𝟏 =
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
15. Regresión de MínimosCuadrados:Propiedades
La suma de los residuales de la línea de
regresión de mínimos cuadrados es siempre
cero.
La suma de los cuadrados de los residuales es
la mínima.
La línea de regresión siempre pasa a través del
punto ( x , y ).
Los coeficientes de mínimos cuadrados son
estimados insesgados de b0 y b1
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
16. Regresión Lineal Simple: Pasos
1. Especificar la variable independiente (x) y la
dependiente (y)
2. Desarrollar un gráfico de dispersión
3. Calcular el coeficiente de correlación
4. Determinar la ecuación de regresión lineal
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
17. Regresión Lineal Simple:Ejemplo
Un agente inmobilario desea examinar la relación
entre los precios de venta de casas y sus áreas
(pies cuadrados)
Una muestra al azar de 10 casas fue seleccionada
Variable dependiente (y) = Precio ($1000s)
Variable independiente (x) = Área (pies
cuadrados)
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
18. Datos Muestralespara el ModelodePrecios de Casas
Precio de casa, $1000s
(y)
Área, pies cuadrados
(x)
245 1400
312 1600
279 1700
308 1875
199 1100
219 1550
405 2350
324 2450
319 1425
255 1700
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
19. PresentaciónGráfica
Modelo de precio de casa: Gráfico de
dispersión y línea de regresión
Pendiente
= 0.10977
Intercepto
= 98.248
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
20. Interpretacióndel estimadodel intercepto b0
b0 es el estimado del valor promedio de y cuando el
valor de x es cero (si x = 0 está en el rango de los
valores observados de x)
Como no hay casas que tengan de área 0 pies cua-
drados, entonces b0 = 98.24833 indica que, para las casas
cuyas áreas estén dentro del rango observado, $98,248.33
es la porción del precio promedio de la casa no explicado
por el área.
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.
21. b1 mide el estimado del cambio en el
valor promedio de “y” que resulta de un
cambio de una unidad de “x”
b1 = 0.10977 indica que el valor promedio de una
casa se incrementa en 0.10977($1000) = $109.77,
por cada unidad de pie cuadrado adicional.
Interpretacióndel estimadode lapendiente, b1
ProbabilidadyEstadísticaDescriptivaeInferencial Profesora:PamelaSeguraS.