1. Estadística Aplicada
Dra. Lila Virginia Lugo García
Santa Ana de Coro, Febrero 2021
UNIVERSIDAD NACIONAL EXPERIMENTAL
“FRANCISCO DE MIRANDA”
DECANATO DE POSTGRADO
PROGRAMA MAESTRIA EN GERENCIA PÚBLICA
Sesión de Clase Semana 3
LVLG
2. TEMA 6: CORRELACIÓN LINEAL
Puntos a tratar:
Teoría de Correlación
Análisis de Correlación
Tipos de Correlación
Ecuaciones de Regresión
Diagrama de Dispersión
Coeficiente de Correlación e Interpretación
Error Típico y Varianza
Representación de la recta de regresión
Ejercicios
LVLG Pág 2
3. Teoría de la Correlación
Correlación
Grado de Interconexión entre las
variables que intenta determinar con que
precisión se explica o se describe la
relación entre las variables por medio de
una ecuación lineal u otra
Permite construir un modelo que permita
predecir el comportamiento de una variable
dada.
Si las variables satisface la ecuación se dice que
están “Perfectamente Correlacionadas”
LVLG Pág 3
4. TEORÍA DE LA CORRELACIÓN
• Expresa la
dependencia
entre las
variables
CORRELACIÓN
• Describe el
comportamiento
analítico de las
variables
• Es la ecuación que
describe el mejor
comportamiento de
los puntos
ECUACIÓN
• Indica el grado
de conexión de
las variables, si
es alto o no, si es
directo o inverso
COEFICIENTE DE
CORRELACIÓN
LVLG Pág 4
5. ANÁLISIS DE LA CORRELACIÓN
• Cuando dos fenómenos sociales, físicos o biológicos crecen o
decrecen de forma simultánea y proporcional debido a factores
externos, se dice que los fenómenos están correlacionados.
• Si uno ambas variables crecen en la misma proporción se dicen
que la correlación es positiva
• Si uno crece en la proporción que el otro decrece, los dos
fenómenos están negativamente correlacionados.
• El grado de correlación se calcula aplicando un coeficiente de
correlación (r) a los datos de ambos fenómenos.
• Una correlación positiva perfecta tiene un coeficiente + 1, y para
una correlación negativa perfecta es -1. La ausencia de
correlación da como coeficiente 0. Por ejemplo, el coeficiente
0,89 indica una correlación positiva fuerte, -0,76 es una
correlación negativa fuerte y 0,13 es una correlación positiva
pequeña.
LVLG Pág 5
6. Correlación
Simple Dos Variables
Múltiple
Más de dos
Variables
Gráficamente Plano
Cartesiano
Diagrama de
Dispersión
LVLG Pág 6
Tipos de la Correlación
Puede
ser
Se
representa
Por
medio
7. ECUACIONES DE REGRESIÓN
REGRESIÓN ECUACIÓN
Lineal y = A + Bx
Logarítmica y = A + BLn(x)
Exponencial y = Ae(Bx)
Cuadrática y = A+ Bx +Cx2
LVLG Pág 7
El tipo de regresión va depender de la dependencia entre las variables,
la más usual es la regresión lineal que será la que abordaremos.
8. ECUACIÓN LINEAL
Regresión de x
sobre y
Regresión de y
sobre x
LVLG Pág 8
Explica la relación entre las variables
En esta caso la variable “Y”
depende de “X”
En esta caso la variable “X”
depende de “Y”
ECUACIÓN DE REGRESIÓN
10. DIAGRAMA DE DISPERSIÓN
LVLG Pág 10
Note como los puntos se
acercan a una recta que
este caso es creciente
Note como los
puntos no se
ajustan a ningún
comportamiento,
es decir a
ninguna función
Note como los
puntos se
acercan a una
función
exponencial
creciente
11. LVLG Pág 11
Correlación
Negativa
Correlación
Positiva
Observe como la recta no necesariamente pasa por los puntos sino es aquella recta que mejor
se ajusta al comportamiento. Dicha recta se conoce como Recta de regresión y se grafica
usando la ecuación de regresión correspondiente
12. • Coeficiente de Correlación: si los cambios en
una de las variables influyen en los valores de
la otra. Si ocurre esto decimos que las variables
están correlacionadas o bien que hay
correlación entre ellas.
• El rango “r” está comprendido entre:
• Se calcula por medio de la ecuación
LVLG Pág 12
COEFICIENTE DE CORRELACIÓN
13. CORRELACIÓN VALOR O RANGO
Perfecta |r| = 1
Fuerte 0.9 |r| < 1
Buena 0.8 |r| < 0.9
Aceptable 0.5 |r| <0.8
Bajo |r|< 0.5
Ninguna r= 0
El signo indicará si es Directa o Inversa
CLASIFICACIÓN DEL GRADO DE
CORRELACIÓN
LVLG Pág 13
Existen parámetros que indican que tan perfecta y
directa es la relación entre las variables, a continuación
se presenta:
14. También se puede calcular “r” usando la covarianza (xy)
por medio de la fórmula:
LVLG Pág 14
El Error Típico Estimado
En todo cálculo siempre existe un error, en esta caso se calcula por
medio de la ecuación:
CÁLCULO DEL COEFICIENTE DE CORRELACIÓN Y
DE ERROR TÍPICO
16. DIAGRAMA DE DISPERSIÓN SEGÚN EL GRADO DE
CORRELACIÓN
LVLG Pág 16
Las siguientes gráfica de dispersión muestra el comportamiento de los puntos en base a
su correlación. Observe como los puntos se encuentran más unidos o separados
dependiendo de la interrelación entre las variables descrita por “r”. Las gráficas de
dispersión se pueden realizar usando EXCEL
17. EJERCICIO 1
La siguiente tabla representa las nota obtenida por un grupo de
estudiantes en el pre-test y post-test de una práctica. Determine:
(x variable Independiente)
a) Ecuación de la Recta de Regresión
b) Coeficiente de Regresión y análisis.
c) Diagrama de Dispersión y recta de regresión
X (PRE-TEST) Y (POST-TEST)
A 45 80
B 39 76
C 37 52
D 25 50
E 23 33
LVLG Pág 17
18. X Y XY X2
Y2
A 45 80 3600 2025 6400
B 39 76 2964 1521 5776
C 37 52 1924 1369 2704
D 25 50 1250 625 2500
E 23 33 759 529 1089
Total
N=5
169 291 10497 6069 18469
r = 0,894 es
Directa y Buena
La Ecuación será:
Donde:
Al Calcularla queda:
A0 =-4,43609865
A1 =1,85313901
La Ecuación de
Regresión por
aproximación queda:
Y = -4,44 + 1,85 X
LVLG Pág 18
RESPUESTA DEL EJERCICIO 1
19. Recta de Regresión
(o de mínimos
cuadrados)
Diagrama de
Dispersión
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50
0
10
20
30
40
50
60
70
80
90
0 10 20 30 40 50
LVLG Pág 19
Puede realizar ambas gráficas usando EXCEL
RECTA DE REGRESIÓN Y DIAGRAMA DE
REGRESIÓN
20. A continuación se presentan las estaturas y pesos de 10
jugadores de baloncesto de un equipo son:
Determine :
• Ecuación de la recta de regresión de Y sobre X.
• El coeficiente de correlación.
• Covarianza y Error
• El peso estimado de un jugador que mide 208 cm.
EJERCICIO 2
LVLG Pág 20
Estatura
(X)
186 189 190 192 193 193 198 201 203 205
Pesos
(Y)
85 85 86 90 87 91 93 103 100 101
22. OBSERVACIÓN
LVLG Pág 22
A veces se presentan la correlación entre variables se presenta por
medio de una tabla de intervalos cuyo procedimiento es más
laborioso, al final se dejará un ejercicio planteado para que sepa
como realizarlo.
A pesar que la correlación lineal es la más utilizada veces las variables
se interrelacionan de forma no lineal por ello se requiere realizar la
representación gráfica para ver como es el comportamiento
Note que aunque
existe una
correlación
perfecta en cada
caso no es lineal
23. La siguiente tabla representa los años de servicio de un empleado
(xi) en la empresa “P” relacionado con su sueldo diario en $. (yi).
Determine :
a) Si existe una correlación adecuada y cuál será
b) Ajuste los datos a una recta de regresión
c) Calcule el error típico estimado
d) Si un empleado tiene 12,5 años de servicio, ¿qué sueldo se
estima que tiene sabiendo el trabajador pertenece a la
empresa?
EJERCICIO 3
LVLG Pág 23
A veces se presentan la correlación entre variables por medio de
una tabla de intervalos, por ello a continuación se presenta un
ejemplo adaptado a esto