El documento habla sobre la correlación lineal y la regresión lineal simple. Explica que la correlación mide la intensidad de la asociación entre dos variables, mientras que la regresión calcula los coeficientes de una relación funcional entre una variable dependiente y una independiente. Describe los coeficientes de correlación de Pearson y Spearman, así como cómo calcular la ecuación de regresión lineal, el coeficiente de determinación y trazar el diagrama de dispersión para visualizar la relación entre las variables. También incluye un ejemplo numérico para ilustrar los c
2. CORRELACION Y REGRECION
LINEAL SIMPLE
CORRELACIÓN
Hay correlación entre dos variables cuando éstas cambian de
tal modo que los valores que toma una de ellas son, hasta
cierto punto, predecibles a partir de los que toma la otra.
El análisis de correlación es el conjunto de técnicas
estadísticas empleado para medir la intensidad de la asociación
entre dos variables. El principal objetivo del análisis de
correlación consiste en determinar que tan intensa es la
relación entre dos variables, estas pueden ser.
Variable Dependiente.- es la variable que se predice o
calcula. Cuya representación es "Y"
Variable Independiente.- es la o las variables que
proporcionan las bases para el calculo. Cuya representación es:
“X”. Esta o estas variables suelen ocurrir antes en el tiempo que
la variable dependiente.
ESTADÍSTICA
3. CORRELACION Y REGRECION
LINEAL SIMPLE
COEFICIENTE DE CORRELACIÓN.( r ; Pearson )
Este es un índice estadístico que mide la relación lineal entre dos variables cuantitativas, es
una forma de medir la intensidad de la relación lineal entre dos variables. El valor del
coeficiente de correlación puede tomar valores desde menos uno hasta uno, -1 ≤ r ≤ 1,
indicando que mientras más cercano a uno sea el valor del coeficiente de correlación, en
cualquier dirección, más fuerte será la asociación lineal entre las dos variables, .
Mientras más cercano a cero sea el coeficiente de correlación, este indicará que más débil es la
asociación entre ambas variables. Si es igual a cero se concluirá que no existe relación lineal
alguna entre ambas variables.
-1 10≤
FuerteFuerte
≤
Debil
ESTADÍSTICA
4. CORRELACION Y REGRECION
LINEAL SIMPLE
COEFICIENTE DE CORRELACIÓN.( Pearson )
Formula
Valor de r Nivel de Correlación
≤ 0.20 Insignificante
0.21 a 0.40 Baja
0.41 a 0.70 Moderada
0.71 a 0.90 Alta
0.91 a 1 Muy alta
n= Total de pares de datos
X= Variable independiente.
Y=Variable dependiente.
r= Coeficiente de correlación
ESTADÍSTICA
5. CORRELACION Y REGRECION
LINEAL SIMPLE
No hay
correlación
0r
Hay correlación no
lineal
0r
Correlación lineal
positiva
1r
Correlación lineal
negativa
1r
El coeficiente de correlación, r, presenta valores entre –1 y +1.
Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube de puntos está muy
dispersa o bien no forma una línea recta. No se puede trazar una recta de regresión.
Cuando r es cercano a +1, hay una buena correlación positiva entre las variables según un modelo
lineal y la recta de regresión que se determine tendrá pendiente positiva, será creciente.
Cuando r es cercano a -1, hay una buena correlación negativa entre las variables según un
modelo lineal y la recta de regresión que se determine tendrá pendiente negativa: es decreciente.
GRADO DE CORRELACIÓN
ESTADÍSTICA
6. CORRELACION Y REGRECION
LINEAL SIMPLE
COEFICIENTE DE DETERMINACIÓN, R
Se determina mediante la expresión siguiente:
Su valor oscila entre 0 y +1.
Cuando hay una buena correlación lineal, 𝑅 es muy cercano a +1. Normalmente se acepta
para valores de 𝑅 >= 0’99.
Cuando no hay correlación o bien ésta no es lineal, 𝑅 es bajo e incluso cercano a cero
La formula resumida es R=𝑟2
𝑥100%
Grado de dependencia de una
variable respecto a la otra
ESTADÍSTICA
7. CORRELACION Y REGRECION
LINEAL SIMPLE
Si solamente están involucradas dos variables, se dice que la técnica es una regresión o
correlación simple. Cuando están implicadas tres o más variables, se tratará de una
regresión o correlación múltiple.
Mientras que la correlación mide el grado de vinculación entre variables, la regresión se
encarga de calcular, a partir de las observaciones, el valor real de los coeficientes que
explican una relación funcional matemática.
En Estadística la regresión lineal o ajuste lineal es un método
matemático que modeliza la relación entre una variable dependiente Y, las variable
Independiente X y un término aleatorio
REGRESION LINEAL
ESTADÍSTICA
8. CORRELACION Y REGRECION
LINEAL SIMPLE
RECTA DE REGRESION
En el modelo de regresión lineal simple la función elegida para aproximar la relación entre
las variables es una recta, es decir y=a+bx, donde a,b son los parámetros.
A esta recta la llamaremos RECTA DE REGRESIÓN.
Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable
dependiente (Y) basado en la variable independiente (X).
Procedimiento:
Seleccionar una muestra de la población y enumerar los datos por pares para cada
observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la
ecuación de regresión.
La ecuación de regresión: Y’= a + bX, donde: Y’ es el valor promedio pronosticado de Y
para cualquier valor de X. a es la intercepción en Y, o el valor estimado de Y cuando X = 0
b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X
se usa el principio de mínimos cuadrados para obtener a y b
ESTADÍSTICA
9. CORRELACION Y REGRECION
LINEAL SIMPLE
Cuando la línea de regresión que mejor se ajusta a la nube de puntos es la recta, es un
problema de regresión lineal y distinguiremos dos casos:
Recta de regresión de Y sobre X: Se obtienen valores aproximados de la variable Y
conocidos los valores de la variable X
Recta de regresión de X sobre Y: Se obtienen valores aproximados de la variable X
conocidos los valores de la variable Y
El criterio de mínimos al cuadrado implica que la recta elegida para ajustar los puntos del
diagrama de dispersión sea tal que la suma de los cuadrados de las distancias verticales
entre los puntos y la recta sea lo más pequeño posible.
Los valores para los coeficientes de a y b son:
RECTA DE REGRESION (y=a+bx)
ESTADÍSTICA
10. CORRELACION Y REGRECION
LINEAL SIMPLE
DIAGRAMA DE DISPERSION
Un diagrama de dispersión proporciona una imagen visual del tipo de relación involucrada
y sugiere el tipo de ecuación que mejor se ajustará a los datos.
La forma usual de construir un diagrama de dispersión es localizar los valores de la variable
independiente X sobre el eje horizontal y los de la variable dependiente Y sobre el eje
vertical; así se forma un plano bidimensional con X Y.
Cada par de observaciones de X y Y (X,Y) está representado mediante un punto en el plano.
ESTADÍSTICA
11. CORRELACION Y REGRECION
LINEAL SIMPLE
EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )
1.-Un comerciante a menudo lleva a cabo un estudio
para determinar la relación entre los gasto de
publicidad semanal y las ventas. Se obtuvieron los
siguientes resultados
Costo de
publicidad ($)
Ventas ($)
40 385
20 400
25 395
20 365
30 475
50 440
40 490
20 420
50 560
40 525
25 480
50 510
Determinar el coeficiente de correlación de Pearson y
determinar cual es su nivel.
Dibuje el diagrama de dispersión.
Encuentre la ecuación y grafique la recta de regresión
para pronosticar las ventas semanales resultante del
gasto de publicidad.
Estimes las ventas semanales cuando los gastos de
publicidad asciende a 35$
ESTADÍSTICA
13. CORRELACION Y REGRECION
LINEAL SIMPLE
EJEMPLO COEFICIENTE DE CORRELACIÓN.( Pearson )
Ecuación de la Recta Y = a+bx
CORRELACION Y REGRECION
LINEAL SIMPLE
Si X= 35$ (Gastos de Publicidad) Y = ? (Ventas) Y =343.70+3.22*35 = 456.40 $
y = 3,220x + 343,7
R² = 0,403
350
400
450
500
550
600
0 10 20 30 40 50 60
Ventas
Costo de Publicidad
Coeficiente de Correlación de Pearson
35
456.4
ESTADÍSTICA
(20,365)
14. CORRELACION Y REGRECION
LINEAL SIMPLE
COEFICIENTE DE CORRELACIÓN.( Spearman) ρ (rho),
Es una prueba no Paramétrica que mide la asociación o interdependencia entre dos
Variables continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo
orden. El estadístico ρ viene dado por la expresión:
donde d es la diferencia entre los correspondientes valores de x - y. n es el número de parejas. Se
tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son
pocos, se puede ignorar tal circunstancia La interpretación de coeficiente de Spearman Oscila entre
-1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no
correlación pero no independencia
ESTADÍSTICA
15. EJEMPLO COEFICIENTE DE CORRELACIÓN.(Spearman)
CORRELACION Y REGRECION
LINEAL SIMPLE
Con el mismo ejemplo determinar el Coeficiente de Correlación de Spearman
Orden Costo $
(X)
Orden Ventas $
( Y )
ESTADÍSTICA
Costo de
publicidad ($)
Ventas ($)
40 385
20 400
25 395
20 365
30 475
50 440
40 490
20 420
50 560
40 525
25 480
50 510
50
50
50
40
40
40
30
25
25
20
20
20
560
525
510
490
480
475
440
420
400
395
385
365
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12