1. ESTADISTICA II
Lic. MARTINEZ SANCHEZ, EDGAR
EJERCICIOS DE CORRELACION Y REGRESION
TRABAJO DOMICILIARIO
1 .-
Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a
partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los
siguientes datos:
X
190
208
227
239
252
257
274
293
308
316
Y
X
189
402
404
412
425
429
436
440
447
458
469
469
representa la renta nacional en millones de euros e
Y
representa las ventas de la
compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).
Calcular:
1. La recta de regresión de Y sobre X.
2. El coeficiente de correlación lineal e interpretarlo.
3. Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la
predicción para las ventas de la compañía en este año?
2. -
La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente
entre la inversión re alizada y el rendimiento obtenido en cientos de miles de euros para
explotaciones agrícolas, se muestra en el siguiente cuadro:
Inversión (X)
11
14
16
15
16
18
20
21
14
20
19
11
Rendimiento (Y)
2
3
5
6
5
3
7
10
6
10
5
6
Calcular:
1. La recta de regresión del rendimiento respecto de la inversión.
2. La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.
2. 3.
El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el
examen correspondiente, de ocho personas es:
Horas (X)
20
16
34
23
27
32
18
22
Calificación (Y)
6.5
6
8.5
7
9
9.5
7.5
8
Se pide:
1. Recta de regresión de Y sobre X.
2. Calificación estimada para una persona que hubiese estudiado 28 horas.
4.
En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala
de cero a 10) de 10 niños.
Edad
6
6
6.7
7
7.4
7.9
8
8.2
8.5
8.9
Conducta agresiva
9
6
7
8
7
4
2
3
3
1
1. Obtener la recta de regresión de la conducta agresiva en función de la edad.
2. A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería
a un niño de 7.2 años.
5.
Los valores de dos variables X e Y se distribuyen según la tabla siguiente:
Y/X
100
50
25
14
1
1
0
18
2
3
0
22
0
1
2
Se pide:
1. Calcular la covarianza .
2. Obtener e interpretar el coeficiente de correlación lineal.
3. Ecuación de la recta de regresión de Y sobre X.
3. 6.
Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la
habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
Y/X
20
30
40
50
(25-35)
6
4
0
0
(35-45)
3
6
1
0
(45-55)
0
2
5
3
(55-65)
0
1
2
7
Se pide:
1. ¿Existe correlación entre ambas variables?
2. Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70
puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?
7. Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado
que se recogen en una ciudad no existe relación.
1. ¿Cuál es el valor de la covarianza de estas variables?
2. ¿Cuánto vale el coeficiente de correlación lineal ?
3. ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el
plano?
8.
En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos
son los siguientes:
Años (X)
3
4
5
6
Infracciones (Y)
4
3
2
1
Calcular el coeficiente de correlación lineal e interpretarlo.
9.
Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el
número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:
Quiniela (X)
6
8
6
8
Primitiva (Y)
1
2
2
1
Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza las
previsiones hechas con las rectas de regresión?
4. ESTADISTICA II
Lic. MARTÍNEZ SÁNCHEZ, EDGAR
EJERCICIOS DE CORRELACION Y REGRESION
TRABAJO EN AULA
1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilos.
1. Hallar la ecuación de la recta de regresión de la edad sobre el peso.
2. ¿Cuál sería el peso aproximado de un niño de seis años?
2.
Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de clientes (X)
8
7
6
4
2
1
Distancia (Y)
15
19
25
23
34
40
1. Calcular el coeficiente de correlación lineal .
2. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
3. Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe
situarse?
3.
Las notas obtenidas por cinco alumnos en Matemáticas y Química son:
Matemáticas
6
4
8
5
3. 5
Química
6. 5
4. 5
7
5
4
Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno
que tiene 7.5 en Matemáticas.
4.
Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = −0.9,
siendo las medias de las distribuciones marginales
= 1,
= 2. Se sabe que una de las cuatro
ecuaciones siguientes corresponde a la recta de regresión de Y sobre X:
y = -x + 2
3x - y = 1
2x + y = 4
y = x + 1
Seleccionar razonadamente esta recta.
5.
Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X)
186
189
190
192
193
193
198
201
203
205
Pesos (Y)
85
85
86
90
87
91
93
103
100
101
5. Calcular:
1. La recta de regresión de Y sobre X.
2. El coeficiente de correlación.
3. El peso estimado de un jugador que mide 208 cm.
6.
A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades
producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación
lineal e interpretarlo.
Horas (X)
80
79
83
84
78
60
82
85
79
84
80
62
Producción
300
302
315
330
300
250
300
340
315
330
310
240
(Y)
7.
Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que
dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido
elaborar la siente tabla:
Nº de horas dormidas (X)
6
7
8
9
10
Nº de horas de televisión (Y)
4
3
3
2
1
Frecuencias absolutas (f i )
3
16
20
10
1
Se pide:
1. Calcular el coeficiente de correlación .
2. Determinar la ecuación de la recta de regresión de Y sobre X.
3. Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la
televisión?
8.
La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba
y ventas del primer mes de prueba (Y) en cientos de euros.
X
25
42
33
54
29
36
Y
42
72
50
90
45
48
1. Hallar el coeficiente de correlación e interpretar el resultado obtenido.
2. Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor
que obtenga 47 en el test.
6. SOLUCIONARIO 1
Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20, 32, 42 y 44
kilos.
1 Hallar la ecuación de la recta de regresión de la edad sobre el peso.
2 ¿Cuál sería el peso aproximado de un niño de seis años?
2
3
5
7
yi
14
20
32
42
x i ·y i
xi2
yi2
4
196
28
9
400
60
25 1 024 160
49 1 764 294
8 44
64 1 936 352
25 152 151 5 320 894
2.- Un centro comercial sabe en función de la distancia, en kilómetros, a la que se sitúe de un
núcleo de población, acuden los clientes, en cientos, que figuran en la tabla:
Nº de clientes (X)
8
7
6
4
2
1
Distancia (Y)
15
19
25
23
34
40
1 Calcular el coeficiente de correlación lineal .
2 Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
7. 3 Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población debe
situarse?
xi
8
7
6
4
2
yi
15
19
25
23
34
x i ·y i
120
133
150
92
68
xi2
64
49
36
16
4
yi2
225
361
625
529
1 156
1
40
40
1
1 600
28
156
603
170
4 496
Correlación negativa muy fuerte .
8. 3.-Las notas obtenidas por cinco alumnos en Matemáticas y Química son:
Matemáticas
6
4
8
5
3. 5
Química
6. 5
4. 5
7
5
4
Determinar las rectas de regresión y calcular la nota esperada en Química para un alumno
que tiene 7.5 en Matemáticas.
xi
yi
x i ·y i
xi2
yi2
6
6. 5
36
42. 25
39
4
4. 5
16
20. 25
18
8
7
64
49
56
5
5
25
25
25
3. 5
4
12. 25
16
14
26. 5
27
153. 25
152. 5
152
4.-Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de correlación r = -0.9,
siendo las medias de las distribuciones marginales
= 1,
= 2. Se sabe que una de la s
cuatro ecuaciones siguientes corresponde a la recta de regresión de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Seleccionar razonadamente esta recta.
9. Como el coeficiente de correlación lineal es negativo , la pendiente de la recta también
será negativa, por tanto descartamos la 2ª y 4ª.
Un punto de la recta ha de ser (
,
), es decir, (1, 2).
2 ≠ - 1 + 2
2 . 1 + 2 = 4
La recta pedida es: 2x + y = 4.
5.- Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:
Estatura (X)
186
189
190
192
193
193
198
201
203
205
Pesos (Y)
85
85
86
90
87
91
93
103
100
101
Calcular:
1 La recta de regresión de Y sobre X.
2 El coeficiente de correlación.
3 El peso estimado de un jugador que mide 208 cm.
xi
yi
xi2
yi2
x i ·y i
186
85
34 596
7 225
15 810
189
85
35 721
7 225
16 065
190
86
36 100
7 396
16 340
192
90
36 864
8 100
17 280
193
87
37 249
7 569
16 791
193
91
37 249
8 281
17563
198
93
39 204
8 649
18 414
201
103
40 401
10 609
20 703
203
100
41 209
10 000
20 300
205
101
42 025
10 201
20 705
1 950
921
380 618
85 255
179 971
10. Correlación positiva muy fuerte.
6.- A partir de los siguientes datos referentes a horas trabajadas en un taller (X), y a unidades
producidas (Y), determinar la recta de regresión de Y sobre X, el coeficiente de correlación
lineal e interpretarlo.
Horas (X)
80
79
83
84
78
60
82
85
79
84
80
62
Producción
300
302
315
330
300
250
300
340
315
330
310
240
(Y)
xi
yi
x i ·y i
xi2
yi2
80
300
6 400
90 000
24 000
79
302
6 241
91 204
23 858
83
315
6 889
99 225
26 145
84
330
7 056
108 900
27 720
78
300
6 084
90 000
23 400
60
250
3 600
62 500
15 000
82
300
6 724
90 000
24 600
85
340
7 225
115 600
28 900
79
315
6 241
99 225
24 885
84
330
7 056
108 900
27 720
80
310
6 400
96 100
24 800
62
240
3 844
57 600
14 880
936
3 632
73 760
1 109 254
285 908
11. Correlación positiva muy fuerte
7.- Se ha solicitado a un grupo de 50 individuos información sobre el número de horas que
dedican diariamente a dormir y ver la televisión. La clasificación de las respuestas ha permitido
elaborar la siente tabla:
Nº de horas dormidas (X)
6
7
8
9
10
Nº de horas de televisión (Y)
4
3
3
2
1
Frecuencias absolutas (f i )
3
16
20
10
1
Se pide:
1 Calcular el coeficiente de correlación .
2 Determinar la ecuación de la recta de regresión de Y sobre X.
3 Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea la
televisión?
xi
yi
fi
xi · fi
xi2 · fi
yi · fi
yi2 · fi
xi · yi · fi
6
4
3
18
108
12
48
72
7
3
16
112
784
48
144
336
8
3
20
160
1280
60
180
480
9
2
10
90
810
20
40
180
10
1
1
10
100
1
1
10
50
390
3082
141
413
1078
12. Es una correlación negativa y fuerte .
8.- La tabla siguiente nos da las notas del test de aptitud (X) dadas a seis dependientes a prueba
y ventas del primer mes de prueba (Y) en cientos de euros.
X
25
42
33
54
29
36
Y
42
72
50
90
45
48
1 Hallar el coeficiente de correlación e interpretar el resultado obtenido.
2 Calcular la recta de regresión de Y sobre X. Predecir las ventas de un vendedor
que obtenga 47 en el test.
xi
yi
x i ·y i
xi2
yi2
25
42
625
1 764
1 050
42
72
1 764
5 184
3 024
33
50
1 089
2 500
1 650
54
90
2 916
8 100
4 860
29
45
841
2 025
1 305
36
48
1 296
2 304
1 728
209
347
8 531
21 877
13 617
13.
14. SOLUCIONARIO 2
1.- Una compañía desea hacer predicciones del valor anual de sus ventas totales en cierto país a
partir de la relación de éstas y la renta nacional. Para investigar la relación cuenta con los
siguientes datos:
X
189
190
208
227
239
252
257
274
293
308
316
Y
402
404
412
425
429
436
440
447
458
469
469
X representa la renta nacional en millones de euros e Y representa las ventas de la
compañía en miles de euros en el periodo que va desde 1990 hasta 2000 (ambos inclusive).
Calcular:
1 La recta de regresión de Y sobre X.
2 El coeficiente de correlación lineal e interpretarlo.
3 Si en 2001 la renta nacional del país fue de 325 millones de euros. ¿Cuál será la
predicción para las ventas de la compañía en este año?
xi
yi
x i ·y i
xi2
yi2
189
402
35 721
161 604
75 978
190
404
36 100
163 216
76 760
208
412
43 264
169 744
85 696
227
425
51 529
180 625
96 475
239
429
57 121
184 041
102 531
252
436
63 504
190 096
109 872
257
440
66 049
193 600
113 080
274
447
75 076
199 809
122 478
293
458
85 849
209 764
134 194
308
469
94 864
219 961
144 452
316
469
99 856
219 961
148 204
2 753
4 791
708 933
2 092 421
1 209 720
15. 2.
La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente
entre la inversión realizada y el rendimiento obtenido en cientos de miles de euros para
explotaciones agrícolas, se muestra en el siguiente cuadro:
Inversión (X)
11
14
16
15
16
18
20
21
14
20
19
11
Rendimiento (Y)
2
3
5
6
5
3
7
10
6
10
5
6
Calcular:
1 La recta de regresión del rendimiento respecto de la inversión.
2 La previsión de inversión que se obtendrá con un rendimiento de 1 250 000 €.
xi
yi
x i ·y i
xi2
yi2
11
2
121
4
22
14
3
196
9
42
16
5
256
25
80
15
6
225
36
90
16
5
256
25
80
18
3
324
9
54
20
7
400
49
140
21
10
441
100
210
14
6
196
36
84
20
10
400
100
200
19
5
361
25
95
11
6
121
36
66
195
68
3 297
454
1 163
16. 3.- El número de horas dedicadas al estudio de una asignatura y la calificación obtenida en el
examen correspondiente, de ocho personas es:
Horas (X)
20
16
34
23
27
32
18
22
Calificación (Y)
6.5
6
8.5
7
9
9.5
7.5
8
Se pide:
1 Recta de regresión de Y sobre X.
2 Calificación estimada para una persona que hubiese estudiado 28 horas.
xi
16
18
20
22
23
27
32
34
192
yi
6
7.5
6.5
8
7
9
9.5
8.5
62
x i ·y i
256
324
400
484
529
729
1 024
1156
4 902
xi2
36
56.25
42.25
64
49
81
90.25
72.25
491
yi2
96
135
130
176
161
243
304
289
1 534
17. 4.
En la tabla siguiente se indica la edad (en años) y la conducta agresiva (medida en una escala
de cero a 10) de 10 niños.
Edad
6
6
6.7
7
7.4
7.9
8
8.2
8.5
8.9
Conducta agresiva
9
6
7
8
7
4
2
3
3
1
1 Obtener la recta de regresión de la conducta agresiva en función de la edad.
2 A partir de dicha recta, obtener el valor de la conducta agresiva que correspondería
a un niño de 7.2 años.
xi
6
6.4
6.7
7
7.4
7.9
8
8.2
8.5
8.9
75
yi
9
6
7
8
7
4
2
3
2
1
49
x i ·y i
36
40.96
44.89
49
54.76
62.41
64
67.24
72.25
79.21
570.72
xi2
81
36
49
64
49
16
4
9
4
1
313
yi2
54
38.4
46.9
56
51.8
31.6
16
24.6
17
8.9
345.2
18. 5.- Los valores de dos variables X e Y se distribuyen según la tabla siguiente:
Y/X
100
50
25
14
1
1
0
18
2
3
0
22
0
1
2
Se pide:
1 Calcular la covarianza.
2 Obtener e interpretar el coeficiente de correlación lineal .
3 Ecuación de la recta de regresión de Y sobre X.
Convertimos la tabla de doble entrada en una tabla simple.
yi
fi
xi · fi
xi2 · fi
100 14
1
100
10 000
14
196
1 400
100 18
2
200
20 000
36
648
3 600
xi
yi · fi yi2 · fi xi · yi · fi
50
14
1
50
2 500
14
196
700
50
18
3
150
7 500
54
972
2 700
50
22
1
50
2 500
22
484
1 100
25
22
2
50
1 250
44
968
1 100
10
600
43 750
184
3 464
10 600
19. Es una correlación negativa débil .
6.- Las puntuaciones obtenidas por un grupo de alumnos en una batería de test que mide la
habilidad verbal (X) y el razonamiento abstracto (Y) son las siguientes:
Y/X
20
30
40
50
(25-35)
6
4
0
0
(35-45)
3
6
1
0
(45-55)
0
2
5
3
(55-65)
0
1
2
7
Se pide:
1 ¿Existe correlación entre ambas variables?
2 Según los datos de la tabla, si uno de estos alumnos obtiene una puntuación de 70
puntos en razonamiento abstracto, ¿en cuánto se estimará su habilidad verbal?
20. Convertimos la tabla de doble entrada en tabla simple.
xi
yi
fi
xi · fi
xi2 · fi
yi · fi
yi2 · fi
xi · yi · fi
20
20
30
30
30
30
40
40
30
40
30
40
50
60
40
50
6
3
4
6
2
1
1
5
120
60
120
180
60
30
40
200
2 400
1 200
3 600
5 400
1 800
900
1 600
8 000
180
120
120
240
100
60
40
250
5 400
4 800
3 600
9 600
5 000
3 600
1 600
12 500
3 600
2 400
3 600
7 200
3 000
1 800
1 600
10 000
40 60
50 50
50 60
2
3
7
80
150
350
3 200
7 500
17 500
120
150
420
7 200
7 500
25 200
4 800
7 500
21 000
53 100
1 080
86 000
66 500
40 1 390
21. 7.-Se sabe que entre el consumo de papel y el número de litros de agua por metro cuadrado
que se recogen en una ciudad no existe relación.
1 ¿Cuál es el valor de la covarianza de estas variables?
= 0
2 ¿Cuánto vale el coeficiente de correlación lineal ?
r = 0
3 ¿Qué ecuaciones tienen las dos rectas de regresión y cuál es su posición en el
plano?
= k1 ,
= k2 k1, k2
.
Las rectas son paralelas a los ejes y perpendiculares entre sí.
8.- En una empresa de transportes trabajan cuatro conductores. Los años de antigüedad de
permisos de conducir y el número de infracciones cometidas en el último año por cada uno de ellos
son los siguientes:
Años (X)
3
4
5
6
Infracciones (Y)
4
3
2
1
Calcular el coeficiente de correlación lineal e interpretarlo.
xi
yi
x i ·y i
xi2
yi2
3
4
12
9
16
4
3
12
16
9
5
2
10
25
4
6
1
6
36
1
18
10
40
86
30
22. La correlación es perfecta e inversa .
9.-Una persona rellena semanalmente una quiniela y un boleto de lotería primitiva anotando el
número de aciertos que tiene. Durante las cuatro semanas del mes de febrero, los aciertos fueron:
Quiniela (X)
6
8
6
8
Primitiva (Y)
1
2
2
1
Obtener el coeficiente de correlación lineal e interpretarlo. ¿Ofrecerían confianza
las previsiones hechas con las rectas de regresión?
xi
6
8
6
8
28
y i x i ·y i x i 2 y i 2
1
6
36 1
2 16
64 4
2 12
36 4
1
8
64 1
6 42 200 10