Análisis de Correlación y Regresión Lineal. Ejercicios de aplicación del coeficiente de correlación y su interpretación. Así mismo el gráfico de dispersión y su interpretación.
2. Correlación
Es la relación entre dos variables cuantitativas sin ser capaz de
inferir relaciones causales.
Correlación es una técnica estadística utilizada para determinar
el grado en el que dos variables están relacionadas
3. • Dos variables cuantitativas
• Una variable es llamada independiente (X)
y la otra dependiente (Y)
• Los puntos no se unen
• No es tabla de frecuencias
Diagrama de dispersión de puntos
5. Dispersión de puntos
El modelo de los datos es indicativo del tipo de relación
entre las dos variables:
Relación positiva
Relación negativa
No hay relación
10. Coeficiente de correlación
Estadístico que muestra el grado de relación entre las dos
variables
Coeficiente de correlación simple (r)
También llamado correlación de Pearson
Mide la naturaleza y fuerza entre dos variables cuantitativas.
11. El signo de r denota la naturaleza de la
asociación
Mientras que el valor de r denota la fuerza de
asociación.
12. Si el signo es positivo, significa que la relación es
directa (un incremento en una variable está asociado
con el incremento de la otra variable; una disminución
de una variable está asociado con la disminución de la
otra variable).
Si el signo es negativo, significa una relación inversa o
indirecta (significando que el incremento en una variable
está asociado con una disminución de la otra variable).
13. El valor de r está entre ( -1) y ( +1)
El valor de r denota la fuerza de la asociación
como se ilustra en el siguiente diagrama.
-1 1
0
-0.25
-0.75 0.75
0.25
fuerte fuerte
intermedio intermedio
débil débil
sin relación
Correlación
perfecta
correlación
perfecta
Directa
indirecta
14. Si r = cero significa que no hay asociación o correlación
entre las dos variables.
Si 0 < r < 0.25 = débil correlación.
Si 0.25 ≤ r < 0.75 = intermedia correlación.
Si 0.75 ≤ r < 1 = fuerte correlación.
Si r = 1 = perfecta correlación.
15. ¿Cómo calcular el coeficiente de correlación
simple (r)?
Una empresa de fabricación de jabón se plantea cambiar
la composición de uno de sus productos utilizando una
nueva materia prima. Antes de tomar una decisión, la
empresa decide realizar un ensayo para estudiar la
posible relación entre la utilización dicha materia prima y
el número de no conformidades. Para ello analiza lotes
con diferentes porcentajes de la nueva materia prima y
toma los siguientes datos:
16. Coeficiente de determinación (r2)
Es la proporción de la variación de Y (variable dependiente)
que se explica por la variación lineal entre X e Y.
17. Análisis de regresión
Regresión: técnica enfocada a la predicción de algunas
variables conociendo a otras.
El proceso de predecir la variable Y usando la variable X.
Nos dice cuanto es el valor de cambio de y en función del
cambio en los valores de x.
18. Correlación y regresión
Correlación describe la fuerza de una relación lineal entre dos
variables
Lineal significa “línea recta”
Regresión nos dice como trazar la línea recta descrita en la
correlación.
19. Recta de regresión: método de mínimos
cuadrados
Y = a + bx
a ordenada en el origen
b pendiente
20. Ejercicios
1) El gerente de personal de la empresa P&C quiere estudiar la relación entre el
ausentismo y la edad de sus trabajadores. Tomó una muestra aleatoria de 10
trabajadores de la empresa y encontró los siguientes datos.
Edad (año) 25 46 58 37 55 32 41 50 23 60
Ausentismo
(días por año)
18 12 8 15 10 13 7 9 16 6
a) Determinar la ecuación muestral que relaciona las dos variables.
b) Calcule el coeficiente de determinación. De su comentario sobre el ajuste de la
línea de regresión a los datos de la muestra.
21. Ejercicios
2) El gerente de ventas de una cadena de tiendas obtuvo información de los pedidos por
internet y del número de ventas realizadas por esa modalidad. Como parte de su
presentación en la próxima reunión de vendedores al gerente le gustaría dar información
específica sobre la relación entre el número de pedidos y el número de ventas realizadas.
Número de
pedidos
50 56 60 68 65 50 79 35 42 15
Número de
ventas
45 55 50 65 60 40 75 30 38 12
a) Calcule el coeficiente de correlación.
b) Calcule el coeficiente de determinación. De su comentario sobre el ajuste de la
línea de regresión a los datos de la muestra.
c) Determinar la ecuación muestral que relaciona las dos variables.
d) ¿Qué puede usted concluir acerca de la correlación entre número de pedidos y
número de ventas?