2. ANÁLISIS DE CORRELACIÓN
Grupo de técnicas para medir la asociación entre dos variables
Pasos
1. Trazar los datos en un diagrama de dispersión
3. ANÁLISIS DE CORRELACIÓN
Calcular el coeficiente de correlación, brinda una medida
cuantitativa de la fuerza de la relación entre dos variables.
-1 Correlación negativa 0 Correlación positiva 1
4. EJEMPLO: NÚMERO DE LLAMADAS DE VENTAS Y
COPIADORAS VENDIDAS POR CADA EMPLEADO
PAG 463
Representante de
ventas
Número de
llamadas de
ventas
Número de
copiadoras
vendidas
Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramirez 10 40
Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70
5. DIAGRAMA DE DISPERSIÓN
Variable independiente:
Número de llamadas
telefónicas (Eje X)
Variable dependiente:
Copiadoras vendidas (Eje
Y)
En el diagrama se observa
quien hace más llamadas
tienden a vender más
copiadoras.
Parece haber una relación
positiva entre las dos
variables, no todos los
puntos se encuentran en
una recta.
6. CÁLCULOS PARA EL COEFICIENTE DE
CORRELACIÓN
Represen
tante de
ventas
Número
de
llamadas
de ventas
Número
de
copiado
ras
vendida
s
X-
Prome
dio
Y-
Prome
dio
(X-Promedio)(Y-
Promedio)
Tom
Keller
20 30
-2 -15 30
Jeff Hall 40 60 18 15 270
Brian
Virost
20 40
-2 -5 10
Greg
Fish
30 60
8 15 120
Susan
Welch
10 30
-12 -15 180
Carlos
Ramirez
10 40
-12 -5 60
Rich
Niles
20 40
-2 -5 10
Mike Kiel 20 50 -2 5 -10
Mark
Reynold
s
20 30
-2 -15 30
Soni
Jones
30 70
8 25 200
Promedi
o 22 45 900
Desviaci
r= 900/(10-
1)(9,189)(14,337)=0,759
Correlación positiva,
relación directa entre el
número de llamadas de
ventas y el número de
copiadoras vendidad
Asociación es fuerte
Todavía no se ha
demostrado la causa y el
efecto, sólo que hay una
relación entre las dos
variables.
7. PRUEBA T DEL COEFICIENTE DE CORRELACIÓN
H I P O T E S I S
Ho : ρ=0
H1: ρ≠0
T tabulado = 2,306
T calculado = 3,297
Se rechaza Ho con un nivel
de significancia de 0,05, esto
indica que hay una
correlación entre el número
de llamadas y el número de
copiadoras vendidas.
Esta prueba sólo muestra
que existe una relación.
8. ANÁLISIS DE REGRESIÓN
O B J E T I V O
Utilizar los datos para trazar
una línea que represente
mejor la relación entre
dos variables.
Desarrollar una ecuación que
permita estimar Y
(Variable dependiente)
con base en X (variable
dependiente)
Método de los mínimos
cuadrados , proporciona
lo que se conoce como
recta del mejor ajuste,
P R I N C I P I O S D E
M Í N I M O S
C U A D R A D O S
Determina una ecuación
de regresión al
minimizar la suma de
los cuadrados de las
distancias verticales
entre los valores
reales de Y y los
valores pronosticados
de Y
10. EJEMPLO
Representante de ventas
Número de
llamadas de
ventas
Número de
copiadoras
vendidas
Promedio 22 45
Desviación estandar
9,189365835
14,337208
78
Coefiente de correlación 0,759
11. SALIDAS DE EXCEL
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,759014109
Coeficiente de determinación R^2 0,576102418
R^2 ajustado 0,52311522
Error típico 9,900823995
Observaciones 10
Coeficiente
s
Error
típico
Estadístic
o t
Probabilid
ad Inferior 95%
Superior
95%
Inferior
95,0%
Superior
95,0%
Intercepción
18,947368
42
8,498818
56
2,229412
04
0,0563486
47 -0,65094232
38,545679
16
-
0,6509423
2
38,5456791
6
Variable X 1
1,1842105
26
0,359140
63
3,297344
87
0,0109019
3 0,356030741
2,0123903
12
0,3560307
41
2,01239031
2
12. PROBAR SIGNIFICANCIA DE LA PENDIENTE
Se analiza la ecuación de
regresión mediante
una prueba de
hipótesis para ver si
la pendiente de la
recta es distinta a
cero.
H0 : β=0
H1 : β≠0
Si demostramos que
esta pendiente es
distinta de cero,
entonces se concluye
que no tiene caso
utilizar la variable
independiente como
elemento de
predicción.
13. EJEMPLO
Coeficiente
s
Error
típico
Estadístic
o t
Probabilid
ad Inferior 95%
Superior
95%
Inferior
95,0%
Superior
95,0%
Intercepció
n
18,947368
42
8,498818
56
2,229412
04
0,056348
647 -0,65094232
38,545679
16
-
0,6509423
2
38,5456791
6
Variable X 1
1,1842105
26
0,359140
63
3,297344
87
0,010901
930,356030741
2,0123903
12
0,3560307
41
2,01239031
2
14. EVALUACIÓN DE LA CAPACIDAD
PREDICTORA DE UNA ECUACIÓN DE
REGRESIÓN
E R R O R E S T Á N D A R D E
E S T I M A C I Ó N
C O E F I C I E N T E D E
D E T E R M I N A C I Ó N
15. EJEMPLO
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple
0,759014
109
Coeficiente de determinación
R^2
0,576102
418
R^2 ajustado
0,523115
22
Error típico
9,900823
995
Observaciones 10
I N T E R P R E T A C I Ó N
El 57,6% de la
variación del
número de
copiadoras
vendidas se
explica o esta
representado por
la variación de
llamadas de venta.