3. CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE (ASOCIACIÓN ENTRE DOS VARIABLES)
Frecuentemente se desea verificar la existencia de la asociación entre dos o más
variables. Por ejemplo:
El peso puede estar asociado con la altura de las personas.
Los gastos médicos de las familias pueden estar relacionados con su ingreso.
La presión sanguínea de una persona y su edad pueden estar relacionadas.
La concentración de un medicamento suministrado y la frecuencia cardiaca, etc.
La naturaleza e intensidad de relaciones entre variables como las mencionadas son
examinadas por medio del análisis de regresión y correlación.
4. CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE (ASOCIACIÓN ENTRE DOS VARIABLES)
La verificación de la intensidad de la relación entre variables, si existe relación, es
el objetivo de la correlación.
Una vez caracterizada la correlación se busca descubrir una función matemática
que pueda representar la relación.La estimación de los parámetros de esta
función es el objetivo de la regresión.
Con el análisis de regresión es posible hacer previsiones o estimaciones de una
variable a partir del conocimiento de los valores de la otra variable.
5. CORRELACIÓN LINEAL SIMPLE
El estudio de la correlación lineal simple tiene por objetivo medir y evaluar el
grado de asociación lineal entre dos variables numéricas (por ejemplo,
podemos medir sí la relación entre el nivel de consumo de algunos
nutrientes y la ganancia de peso es fuerte, débil o nula).
Una manera de visualizar la (posible) correlación entre las observaciones de
dos variables X e Y, es a través del diagrama de dispersión, en el cual los
valores de estas variables son representados por puntos, en un sistema
cartesiano.
6. Los diagramas (a) y (b) muestran dos situaciones donde los puntos están en torno de una recta
imaginaria ascendente. Valores pequeños de X están asociados a valores pequeños de Y, ocurriendo lo
mismo para valores grandes. Estos dos casos indican una correlación lineal positiva entre X e Y.
En (b) los datos están más próximos de la recta imaginaria caracterizando una correlación más fuerte
de la que se da en (a).
7. La figura (c) muestra que los puntos de
X e Y están en torno de una recta
imaginaria descendente que indica una
correlación lineal negativa.
Los puntos en (d) se aproximan más
a una parábola que a una recta,
ilustrando un caso de correlación no
lineal.
8. Los valores de X e Y en (e) no sugieren una asociación entre estas dos variables puesto
que valores pequeños (o grandes) de X están asociados tanto a valores pequeños como
a valores grandes de Y. Los puntos del diagrama no se ubican en torno de una línea
ascendente o descendente.
9. LA MEDIDA DE CORRELACIÓN LINEAL
Una manera de medir la correlación lineal (si es fuerte o débil) es a través del
coeficiente de correlación lineal de Pearson (r). Este coeficiente, puede tomar
cualquier valor en el intervalo [– 1 ,1].
Si r =1 indica una correlación lineal directa perfecta entre las dos variables.
Si r = – 1 indica una correlación lineal inversa perfecta.
Si r =0, las dos variables no están correlacionadas.
±0.00 ±0.09 Correlación nula
±0.10 ±0.19 Correlación muy débil
±0.20 ±0.49 Correlación débil
±0.50 ±0.69 Correlación moderada
±0.70 ±0.84 Correlación significativa
±0.85 ±0.95 Correlación fuerte
±0.96 ±1.0 Correlación perfecta
10. El coeficiente de correlación de la muestra, denotado por r, describe la relación entre las
observaciones de la muestra, fórmulas para su cálculo son:
donde Xi e Yi son los valores observados de X e Y respectivamente; i = 1, 2 ,..., n
y n es el número de observaciones en cada variable.
11. EJEMPLO:
Los datos de la siguiente tabla representan las estaturas (X, cm.) y los pesos (Y,
Kg.) de una muestra de 12 hombres adultos.
X Y
152 50
155 61.5
152 54.5
155 57.5
157 63.5
152 59
157 61
165 72
162 66
178 72
183 84
178 82
Determinar el coeficiente de correlación:
14. REGRESIÓN LINEAL SIMPLE
Es el estudio de la relación funcional entre dos variables. Una variable X, llamada
independiente, explicativa o de predicción y una variable Y, llamada dependiente o
variable respuesta. La función entre las variables es una línea recta, dada por la
ecuación:
b0 es el valor estimado de la variable Y cuando la variable X=0
b1 es el coeficiente de regresión, está expresado en las mismas unidades de Y por
cada unidad de X. Indica el número de unidades en que varía Y cuando se
produce un cambio en una unidad en X (pendiente de la recta de regresión).
15. Ejemplo.
Los datos de la siguiente tabla representan las estaturas (X) y los pesos (Y) de una
muestra de 12 hombres adultos. Para cada estatura fijada previamente se observó el
peso de una persona seleccionada de entre el grupo con dicha estatura. Efectúe un
análisis de regresión.
X Y
152 50
155 61.5
152 54.5
155 57.5
157 63.5
152 59
157 61
165 72
162 66
178 72
183 84
178 82
19. Luego, la ecuación de regresión estimada será:
Ŷ = - 75.45 + 0.8676 X
El valor de b1 = 0.8676 indica el incremento en Kg., en promedio, por cada
centímetro de aumento en la altura de los hombres adultos.
Un valor negativo de b1 sería interpretado como la magnitud del decremento en
Y por cada unidad de aumento en X.
El valor de b0 en este ejemplo no tiene sentido, se interpretaría como el valor
obtenido, en promedio, para el peso Y, cuando la estatura es 0.
20. Utilizando la ecuación de regresión para estimar o predecir valores de la variable
Y es posible responder la interrogante:
¿Cuánto se espera que pese (en promedio) un hombre adulto que mide 1.60 m.?
Sustituyendo el valor de interés en la ecuación estimada, se obtiene:
Ŷ160 = – 75.446 + 0.8676 (160) = 63.37 Kg
22. Ejemplo
Calificaciones de un grupo de alumnos, con respecto al curso de Estadística y
Matemática.
Estadística (Xi) Matemática (Yi)
12 13
15 14
16 15
14 16
18 16
a) Determinar el coeficiente de
correlación
b) Efectúe un análisis de regresión y
responda la pregunta: ¿Cuánto se
esperaría que obtenga en su
examen de matemática, un
estudiante que obtuvo una nota de
20 en su examen de estadística?
23. Solución
Columna 1 Columna 2
Columna 1 1
Columna 2 0.68599434 1
Correlación moderada
Y = 8.8 + 0.4 X Respuesta/ = 16.8 en matemática
a)
b)