3. ¿Qué son las medidas de asociación lineal?
Las medidas de asociación lineal, indican si
existe alguna relación proporcional entre
dos variables o atributos de una misma
muestra, es decir si una afecta a otra o
viceversa. Dichas medidas únicamente son
calculables para variables cuantitativas y son
la covarianza y el coeficiente de correlación.
3 de noviembre de 2012 | MINE José Alejandro López Rentería
4. Covarianza
Es una medida de variabilidad conjunta entre dos
variables (x(x11 , x, x22)) o bieno bien (x , y).(x , y).
La covarianza se calcula con la siguiente fórmula:La covarianza se calcula con la siguiente fórmula:
∑
=
−−=
n
i
ii )yy)(xx(
n
)y,xcov(
1
1
3 de noviembre de 2012 | MINE José Alejandro López Rentería
5. Covarianza
Si Cov(x,y) es positiva: la asociación entre x e y
es directamente proporcional, es decir que cuando x
aumenta y también aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociación entre x e y
es inversamente proporcional, es decir que cuando x
aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e
y.
3 de noviembre de 2012 | MINE José Alejandro López Rentería
6. Coeficiente de correlación
6
La correlación es el grado de asociación entre dos
variables (xx11 , x, x22)) o bieno bien (x , y).(x , y).
El coeficiente de correlación (El coeficiente de correlación (r de Pearsonr de Pearson) mide el) mide el
grado de asociación lineal entre dos variablesgrado de asociación lineal entre dos variables
cuantitativas. Se calcula de la siguiente forma:cuantitativas. Se calcula de la siguiente forma:
11 ≤≤− r
yxss
yx
r
),cov(
=
yx
n
i
ii
ssn
yxnyx
r
)1(
1
−
−
=
∑=
3 de noviembre de 2012 | MINE José Alejandro López Rentería
7. Coeficiente de correlación
7
SiSi rr es positivoes positivo: la asociación entre: la asociación entre xx ee yy es directamentees directamente
proporcional, es decir que cuandoproporcional, es decir que cuando xx aumentaaumenta yy también aumenta;también aumenta;
y viceversa.y viceversa. SiSi rr=1=1: la asociación lineal es perfecta.: la asociación lineal es perfecta.
SiSi rr es negativoes negativo: la asociación entre: la asociación entre xx ee yy es inversamentees inversamente
proporcional, es decir que cuandoproporcional, es decir que cuando xx aumentaaumenta yy disminuye; ydisminuye; y
viceversa.viceversa. SiSi rr=-1=-1: la asociación lineal es perfecta.: la asociación lineal es perfecta.
SiSi rr es ceroes cero: no existe asociación entre: no existe asociación entre xx ee yy..
3 de noviembre de 2012 | MINE José Alejandro López Rentería
10. Regresión lineal simple
10
En aquellos casos en que el coeficiente de regresión
lineal sea “cercano” a +1 o a –1, tiene sentido
considerar la ecuación de la recta que “mejor se
ajuste” a la nube de puntos, llamada recta de
mínimos cuadrados.
Uno de los principales usos de dicha recta será el de
predecir o estimar los valores de y que obtendríamos
para distintos valores de x. Para ello debe
presentarse un gráfico de dispersión.
3 de noviembre de 2012 | MINE José Alejandro López Rentería
12. Modelo de regresión lineal simple
12
iii exy ++= βα
Variable Respuesta: y
Variable Explicativa: x
Intercepto: α
Pendiente: β
Error: e
Variable Respuesta: y
Variable Explicativa: x
Intercepto: α
Pendiente: β
Error: e
3 de noviembre de 2012 | MINE José Alejandro López Rentería
13. Modelo estimado MCO
13
13
xbya −=
2
11
2
111
−
−
=
∑∑
∑∑∑
==
===
n
i
i
n
i
n
i
i
n
i
i
n
i
xxn
yxxyn
b
iii yye ˆ−=
Residuos o Errores
bxay +=ˆ
3 de noviembre de 2012 | MINE José Alejandro López Rentería
14. Modelo estimado MCO
14
Recta de ajuste
Errores o Residuos
bxay +=ˆ
3 de noviembre de 2012 | MINE José Alejandro López Rentería
15. Coeficiente de determinación R
15
El coeficiente de determinación indica el porcentaje del
ajuste que se ha conseguido con el modelo lineal, es decir
el porcentaje de la variación de y que se explica a través
del modelo lineal que se ha estimado, es decir a través del
comportamiento de x. A mayor porcentaje mejor es
nuestro modelo para predecir el comportamiento de la
variable y.
También se puede entender como el porcentaje de
varianza explicada por la recta de regresión y su valor
siempre estará entre 0 y 1 y siempre es igual al cuadrado
del coeficiente de correlación (r).
2
R
3 de noviembre de 2012 | MINE José Alejandro López Rentería
16. Interpretación de los valores estimados
16
Una vez obtenido el modelo, se deben interpretar los
valores de a y de b con el fin de hacer predicciones a
futuro sobre el comportamiento de las variables x e
y.
El coeficiente a señala qué valor toma y en el caso de
que x fuera nulo o cero.
El coeficiente b indica la forma en que varía y de
acuerdo con x, es decir, cuantas unidades de y
aumentan o disminuyen cuando aumentan las de x.
3 de noviembre de 2012 | MINE José Alejandro López Rentería