Este documento presenta un resumen de análisis de regresión lineal simple. Explica conceptos clave como correlación, diagrama de dispersión, coeficiente de correlación, y modelo de regresión lineal. El objetivo es estimar la relación entre dos variables cuantitativas mediante una línea recta de mejor ajuste usando el método de mínimos cuadrados.
Análisis de Regresión Lineal Simple: Correlación, Estimación de Parámetros y Coeficiente de Determinación
1. SEMANA 14
TEMA
Análisis de Regresión
• Correlación
• Regresión Lineal Simple
________________________________________
OBJETIVOS:
• Estimar la relación entre dos variables cuantitativas.
• Calcular la recta de regresión por el método de los
mínimos cuadrados.
• Predecir, estimar o pronosticar la variable de estudio.
,
2. CORRELACION:
Mide el grado de relación
Variables cuantitativas Variables cualitativas
Correlación momento –
Producto de Pearson
Correlación de rango o
Spearman
3. Relación
2 variables
>2 variables
Correlación
simple o bivariada
Correlación
Múltiple
• Número de horas de estudio y rendimiento
académico.
• Gastos en publicidad e ingreso total
• Precio de un producto y cantidad
demandada del mismo.
Ejemplos:
5. Coeficiente de correlación lineal
simple
• Población:
• Muestra
2222
)()(
))((
XXNYYN
YXXYN
r
n XY X Y
n Y Y n X X
( )( )
( ) ( )2 2 2 2
El rango (intervalo de variación) de ρ ò r, es:
-1 < ρ < 1
-1 0 1
Correlación lineal No hay relación Correlación lineal
negativa lineal positiva
6. Escalas de correlación
• Si, ρ ó r se encuentra en:
1.00 CORRELACION PERFECTA Y
POSITIVA
0.90 - 0.99 CORRELACION MUY ALTA
0.70 - 0.89 CORRELACION ALTA
0.40 - 0.69 CORRELACION MODERADA
0.20 - 0.39 CORRELACION BAJA
0.01 - 0.19 CORRELACION MUY BAJA
0 No existe correlación
-1 CORRELACION PERFECTA Y
NEGATIVA
7. Prueba de Hipótesis del
Coeficiente de correlación
• Prueba de hipótesis del coeficiente de correlación
poblacional Rho, (letra griega) se estima con “r” y
responde a la siguiente hipótesis:
• El estadístico de Contraste es una prueba “t” donde el:
• Esta prueba se hace con n-2 grados de libertad.
• Al interpretar los resultados, se debe evitar extraer
conclusiones de causa-efecto a partir de una correlación
significativa.
0:0 H 0:1 H
21
2
""
r
n
rtcalculado
8. Ejemplo:
En la empresa “PAVIRICOS S.R.L.” que se dedican a la comercialización
agrícola, se desea estudiar el efecto del número de horas por semana (X),
en el sueldo de los trabajadores obreros (Y) para 2007. La información de
los 10 trabajadores obreros da los siguientes resultados:
Realizar el diagrama de dispersión e interpretar.
Averiguar si existe relación entre las dos variables mencionadas.
9. Análisis de regresión lineal simple
• Si existe relación →r≠0 →
Representar esta
relación mediante
una forma
matemática
2 variables
regresión simple
>2 variables
Regresión
múltiple
Línea recta Línea curva
Regresión Lineal Regresión No Lineal
10. Modelo Lineal Simple
• Definición.- Relación de dos variables a las cuales se ajusta a una línea recta.
Y = f ( X )
Y = βo + β1 X
• Entones el modelo de regresión lineal simple que sirva para predecir el comportamiento de
Y usando X será de la forma:
Y = a + b X + e
Donde: Y = variable dependiente
a = constante, parámetro de posición.
b = pendiente de la recta, “coeficiente de regresión”
X = variable independiente
e = error aleatorio, el cual se supone que tiene media 0
y varianza constante 2.
• β1 Coeficiente de regresión.
Es el cambio (incremento o disminución según el signo de β1) promedio en la variable de
respuesta Y cuando X se incrementa en una unidad.
Las unidades de β1 son las mismas unidades de la variable dependiente Y.
11. ESTIMACION DE PARAMETROS
DE LA REGRESION
• Para que dicha ecuación esté definida es necesario que se conozca “βo” y “β1”.
Dichos parámetros se calcula utilizando el método de mínimos cuadrados.
• El “Método de Mínimos cuadrados” busca o fija los datos de la muestra o
población a una línea recta de modo que las diferencias de cada observación a la
línea de regresión sea lo menos posible.
, n = nº de observaciones (tamaño de la muestra)
• Luego de minimizar cada valor de ei, se obtienen las fórmulas de “a” y “b”.
donde:
βo = Intercepto de la ecuación de regresión con el eje Y
β1 = coeficiente de regresión.
Xi = valores de la variable independiente
Yi = valores de la variable dependiente
X = Promedio de los valores de la variable independiente
Y = Promedio de los valores de la variable dependiente.
e minimoi
i
n
1
221
)(
))((
XXn
YXXYn
XbYo
12. El Coeficiente de Determinación:
R²
• Es una medida de la bondad de ajuste del
modelo de regresión hallado. Indica qué
porcentaje de la variabilidad de la variable
de respuesta Y es explicada por su
relación lineal con X.
• El valor estadístico de R² varía de cero a
uno.