Este documento explica los conceptos de regresión y correlación lineal simple. Define el coeficiente de correlación de Pearson (r) y cómo medir la fuerza de la relación entre dos variables cuantitativas. También cubre el análisis de regresión lineal, incluyendo cómo estimar los parámetros a y b de la ecuación de la recta de regresión y cómo predecir valores de la variable dependiente. Finalmente, presenta un ejemplo numérico para ilustrar cómo aplicar estos conceptos estadísticos.
Plan Refuerzo Escolar 2024 para estudiantes con necesidades de Aprendizaje en...
Veter. 14 ava. regresión y correlación
1. Regresión y correlación
FACULTAD DE CIENCIAS DE LA SALUD – ESCUELA ACADÉMICO PROFESIONAL DE MEDICINA
VETERINARIA Y ZOOTECNIA
ESTADÍSTICA
Facultad de Ciencias de la Salud
Dr. Mayhuasca Salgado Ronald
Docente
3. Al término de la clase el estudiante será capaz de determinar el grado
de relación entre dos variables usando coeficientes y gráficos de
dispersion, contrastar si esa relación es significativa y predecir el
comportamiento de las mismas cuando varía una variable en función
de otra.
Propósito
4. Problema tipo
Un equipo de profesionales desea investigar el nivel de respuesta de 11
canes mediante dos programa de adiestramiento: nueva prueba (X), contra
la prueba estándar (Y) que están aplicando actualmente. Los resultados
fueron:
n = 11
𝑌 = 916
𝑋𝑌 = 71790
𝑋 = 825
𝑥2
= 64625
𝑦2
= 80076
1. Estime la recta de
regresión lineal simple.
2. Determine e interprete el
coeficiente de correlación
y de determinación
5. Es una técnica que permite medir la fuerza o intensidad de la
relación entre dos variables linealmente relacionadas, su grado
de relación y su sentido
Correlación lineal simple
Se logra a través del Coeficiente de Correlación de Pearson: r
Para estimar el parámetro ρ (rho) se recurre a una
muestra aleatoria de “n” unidades
6. Las variables de preferencia deben ser cuantitativas y aleatorias.
Correlación lineal simple
r2: es el coeficiente de determinación y se suele expresar en porcentaje, indica en
qué porcentaje es explicada la variabilidad total de Y por la relación lineal entre
ambas variables.
El estimador del parámetro Rho está dado por
el coeficiente de correlación muestral “r”
7. Correlación lineal simple
r: Coeficiente de Correlación de Pearson
r =
𝑛 ( 𝑥𝑦) −( 𝑥) ( 𝑦)
𝑛 ( 𝑥2) −( 𝑥)2 𝑛( 𝑦2
)−( 𝑦)2
8. Coeficiente de correlación lineal simple
Guía para la interpretación de r
Valor de r Interpretación
0,00 Ausencia de correlación lineal
± 0,10 a ±0,19 Correlación lineal insignificante
± 0,20 a ±0,39 Correlación lineal baja-leve
± 0,40 a ±0,69 Correlación lineal moderada
± 0,70 a ±0,99 Correlación lineal alta a muy alta
± 1,00 Función lineal perfecta
El recorrido del
coeficiente de
correlación muestral
r está en el intervalo:
-1 ≤ r ≤ 1
9. Es la representación gráfica de la
relación entre variables
cuantitativas. Es el primer indicio de
la forma o naturaleza de la relación
entre variables .
Diagrama de dispersión de puntos
r=+0,96
r=- 0,96
r=+0,34
r=0
Correlación alta (aceptable) e
inversa
Se representan los datos en una
gráfica para verificar la linealidad y
dirección
10. Prueba de hipótesis sobre el parámetro ρ (rho)
Supuesto
¿X e Y están correlacionadas lineal y significativamente?
Para determinar la significación estadística de r
Ho : ρ = 0 (X e Y no están ni lineal, ni
significativamente correlacionadas)
H1 : ρ ≠ 0 (X e Y están lineal y
significativamente correlacionadas)
Planteamiento de hipótesis
11. Prueba de hipótesis sobre el parámetro ρ (rho)
Prueba estadística
Para determinar la significación estadística de r
t n-2 = 𝑟.
𝑛−2
1 −𝑟2
Grado de libertad (gl) de la distribución t = n-2
“t” sigue una distribución t de
Student con (n-2) grados de
libertad si Ho es verdadera
Decisión estadística
Considerando el valor de “t” se calcula en la tabla la probabilidad de
cometer el error tipo I (denotado por p), estableciendo la regla de decisión:
Si, p < 0,05 se rechaza Ho
Si, p ≥ 0,05 NO se rechaza Ho
12. Correlación lineal simple
Se realizaron mediciones de la presión sanguínea sistólica (mmHg) mediante dos
métodos en 25 potros con hipertensión arterial. Se desea saber si existe relación
directa entre las medidas de presión obtenidas y los dos métodos de obtención.
N.C: 99,95%
Paciente Método I Método II X2 Y2 XY
1
2
3
4
.
25
132
138
144
146
220
130
134
132
140
202
17424
19044
20736
21316
48400
16900
17956
17424
19600
40804
17160
18492
19008
20440
44440
Total 4440 4172 808408 710952 757276
Ejemplo
13. Primero calculemos el valor de r:
r =
𝑛 ( 𝑥𝑦) −( 𝑥) ( 𝑦)
𝑛 ( 𝑥2) −( 𝑥)2 𝑛( 𝑦2
)−( 𝑦)2
r =
25 757276 −(4440)(4172)
25 808408 − 4440 2
25 710952 − 4172 2
r = 0,95
Correlación lineal alta a muy alta
14. Coeficiente de correlación lineal simple
Guía para la interpretación de r
Valor de r Interpretación
0,00 Ausencia de correlación lineal
± 0,10 a ±0,19 Correlación lineal insignificante
± 0,20 a ±0,39 Correlación lineal baja-leve
± 0,40 a ±0,69 Correlación lineal moderada
± 0,70 a ±0,99 Correlación lineal alta a muy alta
± 1,00 Función lineal perfecta
r = 0,95
15. Prueba de hipótesis sobre el parámetro ρ (rho)
Prueba estadística
Para determinar la significación estadística de r
t n-2 = 𝑟.
𝑛−2
1 −𝑟2
Nivel de significación: 0,05
Planteamiento de hipótesis Ho : ρ = 0
H1 : ρ ≠ 0
t 25-2 = 𝑟.
25−2
1 −(0,95)2
t 23= 14,41
Existe correlación lineal significativa entre las
medidas de presión arterial obtenidas por los dos
métodos
No existe correlación significativa o es igual a 0
16. Prueba de hipótesis sobre el parámetro ρ (rho)
Para determinar la significación
estadística de r
t 23= 14,41
Ubicamos el valor 14,41 dentro de la
distribución T para determinar el valor de p
El valor p, se halla hacia la derecha
por debajo de un nivel de
significancia de 0,001.
O sea por encima de un N.C. de
confianza de 99,95%
Se
rechaza
Ho
No se
rechaza
Ho
17. Rechazar la Ho
Conclusión:
Decisión Valor de p: para una t de 14,41 con 23 g.l.:
p˂ 0,05
Existe alta correlación lineal y significativa entre las medidas de
presión arterial obtenidas por los dos métodos (p˂ 0,05)
Correlación lineal simple
18. Pregunta tipo
Una empresa farmacéutica conduce
un estudio para evaluar la relación
entre tres dosis de un nuevo agente
hipnótico y el tiempo de sueño.
Cuando la dosis del agente
hipnótico se incrementa en 1mg/kg
¿cuánto se incrementará la hora de
sueño inducido?
Análisis de regresión
19.
20. Análisis de regresión
Es una técnica que trata de predecir, estimar y/o
explicar el valor de una variable (v. dependiente),
cuando se tiene el valor de otras variables relacionadas
(v. independientes)
21. Las variables X e Y deben ser de naturaleza cuantitativa y de
preferencia continua.
Son estudios de la relación funcional entre dos variables relacionadas
Análisis de regresión
En otras palabras consiste en medir el grado de dependencia de una
variable dependiente denotada por (y) respecto a una variable
independiente (x) a través de una función matemática
22. En regresión lineal tenemos que ajustar una recta a los puntos
observados, a fin de usarla para predecir el valor de Y (variable
dependiente) para un valor dado de X (variable independiente).
No todos los puntos se hallarán sobre la recta, pero la recta ajustada se supone
que pasa lo más cerca posible de todos los puntos
Regresión lineal simple
23. A la recta obtenida se le llama
recta de regresión cuya ecuación
es la de la regresión lineal simple
Para cada valor de X prefijado, hay una
subpoblación de valores Y
Regresión lineal simple
Y = a + b . X
24. a: ordenada en el origen o intercepto, distancia entre el origen y el punto en que la recta
corta al eje Y, puede ser (+, -, 0)
b: Coeficiente de regresión, expresa la cantidad en la que varía Y cuando X aumenta en
una unidad, puede ser (+, -, 0)
Recta de regresión
Y = a + b.X
Variable dependiente
Intersección en Y
Pendiente de la línea
Variable independiente
25. Regresión lineal simple
Estimadores mínimo-cuadráticos
para hallar b
b=
( 𝑋.𝑌) − ( 𝑋)( 𝑌)
𝑛
( 𝑥2) − ( 𝑥)2
𝑛
a =
𝒀
𝒏
− 𝒃
𝑿
𝒏
a = 𝒚 − 𝐛 𝒙
𝒚 =a + 𝐛 𝒙
Relación para hallar a en
base a b
De esta relación lineal despejamos
la variable dependiente y
26. Supuestos para usar el modelo de regresión
lineal simple
1. Intervienen dos variables cuantitativas continuas, una de ellas es la variable
independiente (x), a las que el investigador puede asignarle valores:
investigaciones de tipo experimental). La otra variable es dependiente (y) por
que puede ser influida por diversos determinantes o factores
2. Para cada valor de X hay una subpoblación de Y. Cada una de ellas debe estar
normalmente distribuida
3. Las medias de las subpoblaciones de Y se hallan sobre una línea recta
(suposición de linealidad)
27. Regresión lineal simple
Una empresa farmacéutica conduce un estudio para
evaluar la relación entre tres dosis de un nuevo
agente hipnótico y tiempo de sueño. Cuando la dosis
del agente hipnótico se incrementa en 1mg/kg
¿cuánto se incrementará la hora de sueño
inducido?
Los resultados son presentados en la siguiente tabla:
Ejemplo
28. En el diagrama de puntos se
aprecia una relación lineal
positiva o directa entre ambas
variables
Diagrama de dispersión de puntos
Y = a + b.X
Dosis
Tiempodesueño
Modelo de regresión lineal
simple:
Primero verificamos si los datos se ajustan a
un modelo de regresión lineal y evaluar su
dirección
31. Obtención de la recta de regresión
Luego, el modelo de regresión
lineal estimado es:
a = 𝒚 − 𝐛 𝒙
𝒚 =a + 𝐛 𝒙
3,38 = 𝒚 − 𝟎, 𝟓 𝒙
𝒚 =3,38 + 𝟎, 𝟓 𝒙
Ecuación de la recta de regresión
32. Regresión lineal simple
Modelo de regresión lineal
𝒚 =3,38 + 𝟎, 𝟓 𝒙
Cuando la dosis del agente hipnótico se
incrementa en 1mg/kg, el tiempo de
sueño se incrementa en 0,5 horas
X= 1 mg
Pero cuando:
X=0 entonces y=3,38
X=1 entonces y= 3,38 + (0,5 x 1)
X=2 entonces y= 3,38 + (0,5 x 2)
X=3 entonces y= 3,38 + (0,5 x 3)
Respuesta
Representa cuando:
Operacionalicemos
Coeficiente de regresión
33. Coeficiente de determinación (r2)
Este coeficiente nos indica el porcentaje de la variabilidad total de los
valores de Y que están siendo explicadas por la regresión lineal simple
Toma valores entre 0 y 100%
Si por ejemplo el valor de r2= 78,39%
Se interpretará:
El 78,39% de la variabilidad existente …está siendo explicada
por la regresión
34. Conclusiones
- Los métodos de correlación permiten asignar un valor numérico al
nivel de relación existente entre dos variables y además verificar
su significancia
- Los gráficos de dispersión nos orientan a decidir el uso de los
métodos de regresión y correlación lineal
35. Problema tipo
Un equipo de profesionales desea investigar el nivel de respuesta de 11
canes mediante dos programa de adiestramiento: nueva prueba (X), contra
la prueba estándar (Y) que están aplicando actualmente. Los resultados
fueron:
n = 11
𝑌 = 916
𝑋𝑌 = 71790
𝑋 = 825
𝑥2
= 64625
𝑦2
= 80076
1. Estime la recta de
regresión lineal simple.
2. Determine e interprete el
coeficiente de correlación
y de determinación
36. Se llevó a cabo un experimento para estudiar
el efecto de cierta droga en la disminución del
ritmo cardiaco en macacos. Los resultados
fueron:
Pregunta 02
Dosis (mg) X Reducción del ritmo
cardiaco (lat/min) Y
0,50 10
0,75 8
1,00 12
1,25 12
1,50 14
1,75 12
2,00 16
2,25 18
37. 1. Elabore un diagrama de
dispersión de puntos
2. Realice valores predictivos (4) y
represéntelos en la recta
3. Estime la recta de regresión
lineal simple. Interprete el
coeficiente de regresión
Pregunta 02