SlideShare una empresa de Scribd logo
1 de 20
Descargar para leer sin conexión
Semana 10: Autoevaluación de Correlación y Regresión lineal simple
Rusell Axes es una empresa de gestión de proyectos inmobiliarios. Encargada de captar, gestionar, promover y comercializar proyectos
inmobiliarios en todos los distritos de Lima. El gerente de planeamiento de la empresa considera que el tiempo de construcción del edificio (en
días) se relaciona linealmente con el número de pisos que se va a construir.
El gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”, si el tiempo
empleado en la construcción del edificio de 15 pisos es menor de 400 días. Para ello, selecciona una muestra de 15 expedientes con información
de edificaciones similares, de donde obtiene el tiempo empleado en la construcción, en días, y el número de pisos realizados en cada uno. La
información se muestra a continuación:
Tiempo empleado en la construcción 300 330 300 395 376 370 360 330 380 405 481 417 500 412 460
Número de pisos 10 12 13 20 18 16 15 16 15 18 25 20 28 18 24
Utilizando un nivel de confianza del 96% y un nivel de significación del 1%, ¿Cuál será la decisión del gerente de planeamiento de la empresa?
Para el análisis respectivo, utilice la siguiente información procesada en el software minitab.
Coeficientes
Término Coef
EE
del
coef.
Valor
T
Valor
p FIV
Constante 178.445 18.6 9.616 0.000
X 11.714 1.00 11.677 0.000 1.00
Resumen del modelo
S R-cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
18.5994 91.295% 90.626% 89.21%
Análisis de Varianza
Fuente GL SC Ajust.
MC
Ajust. Valor F
Valor
p
Regresión 1 47165.731 47165.731 136.341 0.000
X 1 47165.731 47165.731 136.341 0.000
Error 13 4497.203 345.939
Falta de
ajuste
8 2526.536 315.817 0.801 0.629
Error puro 5 1970.667 394.133
Total 14 51662.933
Estadístico de Durbin-Watson
Estadístico de Durbin-
Watson =
2.10263
Prueba de Anderson - Darling
AD = 0.399 p – valor
= 0.320
Configuración
Variable
Valor de
configuración
X 15
Predicción
Error estándar
Coeficiente de determinación
El coeficiente de no determinación es 100 % - (R-cuad.)
100 % - 91.295 % = 8.705 %
0.000 < Alpha = 0.01
Se rechaza H0; es decir, se valida la regresión
Como 2.10263 está incluido en el intervalo de <1.5; 2.5>;
es decir, no existe autocorrelación de los errores
Ajuste
EE de
ajuste IC de 96% IP de 96%
354.153 5.59760 (341.382;
366.925)
(309.837;
398.470)
Configuración
Variable
Valor de
configuración
X 400
Predicción
Ajuste
EE de
ajuste IC de 96% IP de 96%
4864.01 383.387 (3989.28;
5738.75)
(3988.25;
5739.78)
Configuración
Variable
Valor de
configuración
X 15
Predicción
Ajuste
EE de
ajuste IC de 99% IP de 99%
354.153 5.59760 (337.292;
371.015)
(295.645;
412.662)
Configuración
Tiempo empleado en la construcción de un edificio de 15 pisos
IP Valor individual
Variable
Valor de
configuración
X 400
Predicción
Ajuste
EE de
ajuste IC de 99% IP de 99%
4864.01 383.387 (3709.15;
6018.88)
(3707.79;
6020.24)
1. ¿Cuál es el objetivo que persigue esta investigación?
a. Determinar si el gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos
Aires”.
b. Determinar si el tiempo empleado en la construcción del edificio de 15 pisos es menor de 400 días.
c. Determinar si el tiempo de construcción del edificio se relaciona linealmente con el número de pisos que se va a construir.
d. Determinar si el tiempo de construcción del edificio depende del número de pisos que se va a construir.
e. Determinar si el número de pisos construidos en un edificio depende del tiempo de construcción del edificio
La opción correcta es la letra: [Interpretación]
2. La variable dependiente es:
a. Un edificio
b. Número de pisos construidos
c. Tiempo empleado en la construcción
La opción correcta es la letra: [Representación]
3. El valor del coeficiente de no determinación es [Cálculo1]% y del error estándar es [Cálculo2]. Ingrese su respuesta redondeada a tres
cifras decimales.
4. Al evaluar el estadístico de Durbin Watson, se concluye que:
El tiempo empleado en la construcción
depende de la cantidad de edificios a realizar.
18.600
8.705 %
a. Como el valor del estadístico está contenido en el intervalo de 1 a 3, se asume que los errores no están autocorrelacionados y que la
varianza de los errores es constante.
b. Como el valor del estadístico está contenido en el intervalo de 1.5 a 2.5, se asume que los errores no están autocorrelacionados y que la
varianza de los errores es constante.
c. Como el valor del estadístico está contenido en el intervalo de 1.5 a 2.5, se asume que los errores están autocorrelacionados y que la
varianza de los errores no es constante.
d. Como el valor del estadístico no está contenido en el intervalo de 2.5 a 3.5,se asume que los errores no están autocorrelacionados y que
la varianza de los errores es constante.
La opción correcta es la letra: [Análisis1]
Asumiendo que se cumplen los supuestos del modelo, responda los siguientes ítems.
5. La hipótesis nula en la prueba individual para verificar la validez del modelo es:
a. H0: β0 = 0
b. H0: β1 = 0
c. H0: β0 ≠ 0
d. H0: β1 ≠ 0
La opción correcta es la letra: [Análisis_2]
6. Con un nivel de significación del 1%, la decisión y conclusión estadística en la prueba individual para verificar la validez del modelo:
a. Rechazar la hipótesis alterna, el modelo de regresión lineal estimado es válido.
b. Rechazar la hipótesis alterna, el modelo de regresión lineal estimado no es válido.
c. Rechazar la hipótesis nula, el modelo de regresión lineal estimado es válido.
d. Rechazar la hipótesis nula, el modelo de regresión lineal estimado no es válido.
La opción correcta es la letra: [Análisis_3]
7. El tiempo empleado en la construcción de un edificio de 15 pisos es [Cálculo_3] días. Ingrese su respuesta redondeada a tres cifras
decimales.
8. Con un nivel de confianza del 96%, el intervalo de [Cálculo_4] a [Cálculo_5] días contiene el tiempo empleado en la construcción de un edificio
de 15 pisos. Ingrese su respuesta redondeada a tres cifras decimales.
La hipótesis alterna es H1: B1 =/ 0
354.153
309.837 398.470
9. La respuesta del problema de investigación es:
a. El gerente de planeamiento de la empresa no aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”.
b. El gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”.
c. Con los resultados obtenidos el gerente de planeamiento de la empresa no puede tomar una decisión.
d. El tiempo empleado en la construcción del edificio si depende del número de pisos construidos.
e. El número de pisos construidos si depende del tiempo de construcción del edificio.
f. El tiempo empleado en la construcción del edificio de 15 pisos si es menor a 400 días.
La opción correcta es la letra: [Argumentación]
Debido a el tiempo empleado en la construcción del edificio de 15 pisos si
es menor a 400 días, el gerente ejecutara la obra.
Modelo de regresión lineal simple:
Y= 0 + 1X +
Donde:
• Parámetros: 0 (intercepto) y 1 (coeficiente de regresión o pendiente)
• X es una variable fija, pero no aleatoria, medida sin error.
• que representa el error aleatorio.
Ejemplo
Y= 88.82 + 0.1766X
1. El intercepto es 88.82
2. Sobre la relación de las variables involucradas se puede afirmar que:
a. Tienen una relación lineal directa, de moderada a fuerte
Semana 11: Autoevaluación de Regresión no lineal simple
El jefe de control de calidad de la empresa “Laurent S.A.” tomará la decisión de revisar el proceso de producción de la confección de maletines
deportivos, si el costo total de producción de un ciento de maletines deportivos que usa 0,60 metros cuadrados de lona supera los 5500 soles.
Para tomar esta decisión le solicita a Ud. y su equipo modelar el costo de un maletín deportivo (en miles de soles) en función del área de la lona
utilizada en su confección en metros cuadrados (su principal insumo). Para la realización del estudio se registró la información de una muestra
aleatoria de 14 maletines deportivos.
Ud. y su equipo deberán realizar el análisis estadístico de regresión simple, el procedimiento de la selección del mejor modelo lineal o no lineal,
validación de las pruebas de hipótesis de los parámetros del mejor modelo y realizar las predicciones solicitadas.
Para el análisis asuma que los supuestos se cumplen, utilice un nivel de significación del 5% y un nivel de confianza del 95%, y considere los
reportes obtenidos del Minitab.
Análisis de regresión: Y vs. X
Coeficientes
Término Coef
EE
del
coef.
Valor
T
Valor
p FIV
Constante 24.86 2.05 12.13 0.000
X 66.09 3.21 20.62 0.000 1.00
Resumen del modelo
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
1.89652 97.25% 97.03% 96.00%
Análisis de Varianza
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 1 1529.20 1529.20 425.15 0.000
X 1 1529.20 1529.20 425.15 0.000
Error 12 43.16 3.60
Modelo lineal
Falta de
ajuste
10 40.66 4.07 3.25 0.258
Error puro 2 2.50 1.25
Total 13 1572.36
Configuración
Variable
Valor de
configuración
X 0.6
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
64.5111 0.510623 (63.3986;
65.6237)
(60.2318;
68.7904)
_________________________________________________________________________________________________________________
Análisis de regresión: Y vs. X; X^2
Coeficientes
Término Coef
EE
del
coef.
Valor
T
Valor
p FIV
Constante 30.24 8.08 3.74 0.003
X 48.0 26.4 1.82 0.097 64.96
X^2 14.3 20.6 0.69 0.504 64.96
Resumen del modelo
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
1.93925 97.37% 96.89% 94.67%
Análisis de Varianza
Modelo cuadrático Es el modelo de regresión con mejor ajuste
Es el valor del coeficiente de determinación
de modelo de regresión con mejor ajuste
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 2 1530.99 765.495 203.55 0.000
X 1 12.41 12.409 3.30 0.097
X^2 1 1.79 1.794 0.48 0.504
Error 11 41.37 3.761
Falta de
ajuste
9 38.87 4.319 3.45 0.245
Error puro 2 2.50 1.250
Total 13 1572.36
Configuración
Variable
Valor de
configuración
X 0.6
X^2 0.36
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
64.1685 0.720190 (62.5834;
65.7536)
(59.6154;
68.7216)
_________________________________________________________________________________________________________________
Análisis de regresión: Ln(Y) vs. X
Coeficientes
Término Coef
EE del
coef.
Valor
T
Valor
p FIV
Constante 3.5539 0.0308 115.54 0.000
X 1.0006 0.0481 20.79 0.000 1.00
Resumen del modelo
Modelo exponencial
0.504 > Alpha = 0.05
No se rechaza H0; es decir, no se valida la regresión
Es el valor del estadístico de prueba individual
para la validación del mejor modelo válido
Es el mejor modelo de regresión validado
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
0.0284749 97.30% 97.07% 96.51%
Análisis de Varianza
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 1 0.350505 0.350505 432.28 0.000
X 1 0.350505 0.350505 432.28 0.000
Error 12 0.009730 0.000811
Falta de
ajuste
10 0.009158 0.000916 3.21 0.261
Error puro 2 0.000571 0.000286
Total 13 0.360235
Configuración
Variable
Valor de
configuración
X 0.6
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
4.15423 0.0076666 (4.13752;
4.17093)
(4.08998;
4.21848)
_________________________________________________________________________________________________________________
Análisis de regresión: Ln(Y) vs. Ln(X)
Coeficientes
Término Coef
EE del
coef.
Valor
T
Valor
p FIV
Constante 4.4817 0.0177 252.55 0.000
Ln(X) 0.6009 0.0308 19.51 0.000 1.00
Modelo potencia
0.000 < Alpha = 0.05
Se rechaza H0; es decir, se valida la regresión
Ecuación linealizada
LnY: 3.5539 + 1.0006LnX1
Ecuación potencia
Y: e^3.5539*X^1.0006
Y: 34.94935*X^1.0006
El mejor modelo
válido, el valor del 0
El mejor modelo válido,
el valor del 1
<e*4.08998; e*4.21848>
<59.7386969; 67.9301519>
Resumen del modelo
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
0.0302823 96.95% 96.69% 95.61%
Análisis de Varianza
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 1 0.349231 0.349231 380.83 0.000
Ln(X) 1 0.349231 0.349231 380.83 0.000
Error 12 0.011004 0.000917
Falta de
ajuste
10 0.010433 0.001043 3.65 0.234
Error puro 2 0.000571 0.000286
Total 13 0.360235
Configuración
Variable
Valor de
configuración
Ln(X) -0.510826
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
4.17479 0.0080935 (4.15715;
4.19242)
(4.10649;
4.24308)
1. ¿Cuál es el objetivo que persigue esta investigación?
a. Determinar el tipo de relación que existe entre el costo de producción de un maletín deportivo y el área de lona en m2.
b. Determinar el costo de producción de un de maletín deportivo cuando utiliza 0,60 m2 de lona.
c. Determinar si el jefe de Control de Calidad deberá revisar el proceso de producción de la confección de maletines deportivos.
La opción correcta es la letra: [Interpretación]
2. La variable independiente, dependiente y la técnica estadística son respectivamente:
a. Costo de producción de un maletín deportivo, el área de la lona en m2 y análisis de regresión lineal simple.
b. Costo de producción de un maletín deportivo, el área de la lona en m2 y análisis de regresión simple.
c. El área de la lona en m2, costo de producción de un maletín deportivo y análisis de regresión simple.
La opción correcta es la letra: [Representación]
3. El modelo de regresión con mejor ajuste es:
a. Lineal
b. Cuadrático
c. Exponencial
d. Potencia
La opción correcta es la letra: [Análisis1]
4. El valor del coeficiente de determinación de modelo de regresión con mejor ajuste es: [Cálculo1]% Ingrese su respuesta redondeada a dos
cifras decimales
5. El mejor modelo de regresión validado es:
a. Lineal
b. Cuadrático
c. Exponencial
d. Potencia
La opción correcta es la letra: [Análisis2]
6. El valor del estadístico de prueba individual para la validación del mejor modelo válido es: [Cálculo2] Ingrese su respuesta redondeada a
dos cifras decimales.
Ranking
1. Modelo cuadrático = 97.37 %
2. Modelo exponencial = 97.30 %
3. Modelo lineal = 97.25 %
4. Modelo potencia = 96.95 %
97.370 %
20.79
7. Del mejor modelo válido, el valor del β0 es: [Cálculo3] y el valor de β1 es: [Cálculo4] Ingrese su respuesta redondeada a tres cifras
decimales.
8. Con un 95% de nivel de confianza, el intervalo de [Cálculo5] a [Cálculo6] soles contiene el costo de fabricación de un maletín deportivo cuando
el área de la lona es m2 es de 0,60. Ingrese su respuesta redondeada a tres cifras decimales.
9. La decisión del jefe de Control de Calidad es:
a. No se puede tomar la decisión de revisar el proceso de producción de la confección de los maletines deportivos.
b. Tomar la decisión de no revisar el proceso de producción de la confección de los maletines deportivos
c. Tomar la decisión de revisar el proceso de producción de la confección de los maletines deportivos.
La opción correcta es la letra: [Argumentación]
34.950 1.0001
59.739 67.930
Debido a que el costo total de producción de un ciento de maletines deportivos que usa 0,60
metros cuadrados de lona supera los 5500 soles.
Regla de tres simple
1 59.739
100 x
x = 100*59.739
x = 5973.9
Semana 12: Autoevaluación de Regresión lineal múltiple
El ingeniero de sistemas de una compañía de transmisión de datos a distancia desea estudiar la relación lineal del costo de la transmisión (en
soles) con las siguientes variables: Cantidad de información transmitida (en mega bytes), la distancia (en miles de kilómetros), y el número de
operadores del centro de cómputo. Para ello se tomaron registros de 14 transmisiones de datos seleccionadas al azar.
Si el costo medio de la transmisión es mayor a 130 soles, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta
con dos operadores en el centro de cómputo, el ingeniero de sistemas de la compañía optimizará el proceso de transmisión de datos.
Utilizando un nivel de significación del 1% y un nivel de confianza del 95% ¿Cuál será la decisión del ingeniero de sistemas?
Para el análisis estadístico utilice los reportes obtenidos con el software MINITAB que fueron elaborados sobre los datos de las variables del
contexto presentado.
Modelo completo
Coeficientes
Término Coef
EE del
coef.
Valor
T
Valor
p FIV
Constante 118.9 21.2 5.62 0.000
Cantidad de
información
1.093 0.294 3.71 0.004 1.34
Distancia 0.61 1.07 0.57 0.579 1.83
Número de
operadores
-9.82 2.74 -3.58 0.005 2.27
Resumen del modelo
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
15.9443 88.45% 84.99% 72.12%
Análisis de Varianza
0.004 < Alpha = 0.01
Se rechaza H0; es decir, se valida la regresión
0.579 > Alpha = 0.01
No se rechaza H0; es decir, no se valida la regresión
0.005 < Alpha = 0.01
Se rechaza H0; es decir, se valida la regresión
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 3 19471.8 6490.60 25.53 0.000
Cantidad de
información
1 3502.7 3502.74 13.78 0.004
Distancia 1 83.4 83.43 0.33 0.579
Número de
operadores
1 3261.6 3261.60 12.83 0.005
Error 10 2542.2 254.22
Total 13 22014.0
Prueba de Anderson Darling
AD = 0.207 valor – p = 0.834
Estadístico de Durbin-Watson
Estadístico de Durbin-
Watson =
1.52090
Estadísticas
Variable
Conteo
total Mínimo Máximo
COOK 14 0.0000 1.0653
Configuración
Variable
Valor de
configuración
Cantidad de
información
35
Distancia 15
Número de
operadores
2
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
146.730 6.21867 (132.874;
160.586)
(108.597;
184.862)
Modelo reducido
Selección de términos escalonada
Términos candidatos: X1; X2; X3
-----Paso 1---
-
-----Paso 2---
-
Coef P Coef P
Constante 165.83 129.1
Número de
operadores
-14.40 0.000 -
10.86
0.000
Cantidad de
información
1.058 0.003
S 22.4639 15.4497
R-cuad. 72.49% 88.07%
R-cuad.(ajustado) 70.20% 85.90%
Cp de Mallows 13.82 2.33
AICc 133.11 125.45
BIC 132.62 123.56
α a entrar = 0.05; α a retirar = 0.05
Coeficientes
Término Coef
EE
del
coef.
Valor
T
Valor
p FIV
Constante 129.1 11.1 11.58 0.000
Cantidad de
información
1.058 0.279 3.79 0.003 1.28
Ecuación estimada del mejor modelo de regresión
Y: 129.1 + 1.058X1 - 10.86X3
Número de
operadores
-
10.86
1.99 -5.45 0.000 1.28
Resumen del modelo
S
R-
cuad.
R-cuad.
(ajustado)
R-
cuad.
(pred)
15.4497 88.07% 85.90% 76.33%
Análisis de Varianza
Fuente GL
SC
Ajust.
MC
Ajust.
Valor
F
Valor
p
Regresión 2 19388 9694.2 40.61 0.000
Cantidad de
información
1 3430 3429.9 14.37 0.003
Número de
operadores
1 7078 7077.6 29.65 0.000
Error 11 2626 238.7
Total 13 22014
Prueba de Anderson Darling
AD = 0.208 valor – p = 0.831
Estadístico de Durbin-Watson
Estadístico de Durbin-
Watson =
1.52014
Estadísticas
Variable
Conteo
total Mínimo Máximo
COOK 14 0.0008 0.9535
Es el valor del coeficiente de determinación,
del mejor modelo de regresión
Configuración
Variable
Valor de
configuración
Cantidad de
información
35
Número de
operadores
2
Predicción
Ajuste
EE de
ajuste IC de 95% IP de 95%
144.405 4.56641 (134.355;
154.456)
(108.947;
179.864)
1. ¿Cuál es la problemática que se deberá resolver?
a. ¿Cuál será la decisión del ingeniero?
b. ¿El costo de la transmisión de datos es mayor a 135 soles?
c. ¿El ingeniero de sistemas de la compañía optimizará el proceso de transmisión de datos?
d. ¿Cuál es el costo de la transmisión de datos, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con
dos operadores en el centro de cómputo?
La opción correcta es la letra: [Interpretación]
2. La variable dependiente es:
a. Cantidad de información transmitida (mega bytes)
b. Distancia de la transmisión de los datos (miles de kilómetros)
c. Número de operadores en el centro de cómputo
d. Costo de la transmisión de datos (soles)
La opción correcta es la letra: [Representación1]
3. Del siguiente listado, no es un supuesto del análisis de regresión lineal múltiple
a. Normalidad de los errores
Es la estimación puntal del costo de la
transmisión de datos
IP Valor individual
b. Multicolinealidad de las variables regresoras
c. Varianza constante de los errores
d. Independencia de los errores
e. Independencia de las variables independientes
La opción correcta es la letra: [Representación2]
4. Considerando un nivel de significación del 1%, a partir de la prueba de coeficientes del modelo completo de regresión se puede concluir que:
a. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que la cantidad de información trasmitida, la
distancia de la información transmitida y el número de operadores del centro de cómputo influyen en el costo de la transmisión de datos.
b. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida y la
distancia de la información transmitida influyen en el costo de la transmisión de datos.
c. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida y el
número de operadores del centro de cómputo influyen en el costo de la transmisión de datos.
d. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida
influyen en el costo de la transmisión de datos.
La opción correcta es la letra: [Análisis1]
5. La ecuación estimada del mejor modelo de regresión es:
a.
b.
c.
d.
Tener en cuenta que X1: Cantidad de información trasmitida, X2: Distancia de la información transmitida, X3: Número de operadores del centro de
cómputo.
La opción correcta es la letra: [Análisis2]
6. El valor del coeficiente de determinación, del mejor modelo de regresión, es: [Cálculo1]% Ingrese su respuesta redondeada a dos cifras
decimales.
Homocedasticidad
85.90 %
7. La estimación puntal del costo de la transmisión de datos, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta
con dos operadores en el centro de cómputo es: [Cálculo2] Ingrese su respuesta redondeada a tres cifras decimales.
8. El límite inferior del intervalo de confianza al 95% de la estimación del costo de la transmisión de datos, cuando se transmite 35 mega bytes a
una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo es: [Cálculo3] Ingrese su respuesta a tres cifras
decimales
9. ¿Cuál es la respuesta de la pregunta de investigación?
a. El ingeniero de sistemas de la compañía si optimizará el proceso de transmisión de datos.
b. El ingeniero de sistemas de la compañía no optimizará el proceso de transmisión de datos.
c. El costo medio de la transmisión de datos si es mayor a 130 soles.
d. El costo medio de la transmisión de datos no es mayor a 130 soles.
e. Ninguna de las anteriores.
La opción correcta es la letra: [Argumentación]
144.405
108.947
Debido a que el costo medio de la transmisión es mayor a
130 soles, cuando se transmite 35 mega bytes a una
distancia de 15 mil kilómetros y se cuenta
con dos operadores en el centro de cómputo

Más contenido relacionado

Similar a J.pdf

Diapositivas Unidad 2_ estudio de tb092155.pptx
Diapositivas Unidad 2_ estudio de tb092155.pptxDiapositivas Unidad 2_ estudio de tb092155.pptx
Diapositivas Unidad 2_ estudio de tb092155.pptx
SherlynGarcia16
 
Uso de Software computacional Disenos Estadistica
Uso de Software computacional Disenos EstadisticaUso de Software computacional Disenos Estadistica
Uso de Software computacional Disenos Estadistica
Alberto Carranza Garcia
 

Similar a J.pdf (20)

Diapositivas Unidad 2_ estudio de tb092155.pptx
Diapositivas Unidad 2_ estudio de tb092155.pptxDiapositivas Unidad 2_ estudio de tb092155.pptx
Diapositivas Unidad 2_ estudio de tb092155.pptx
 
Unidad5 reglineal
Unidad5 reglinealUnidad5 reglineal
Unidad5 reglineal
 
Analisis de Sencibilidad
Analisis de SencibilidadAnalisis de Sencibilidad
Analisis de Sencibilidad
 
Analisis del error
Analisis del errorAnalisis del error
Analisis del error
 
PRONOSTICOS
PRONOSTICOSPRONOSTICOS
PRONOSTICOS
 
Control estadistico de calidad cd09103 2013
Control estadistico de calidad cd09103 2013Control estadistico de calidad cd09103 2013
Control estadistico de calidad cd09103 2013
 
Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14
 
Presentación clase 5 regresión múltiple.pdf
Presentación clase 5 regresión múltiple.pdfPresentación clase 5 regresión múltiple.pdf
Presentación clase 5 regresión múltiple.pdf
 
Control estadistico de calidad cd09103 2012
Control estadistico de calidad cd09103 2012Control estadistico de calidad cd09103 2012
Control estadistico de calidad cd09103 2012
 
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
 
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
Dialnet aplicacion delasimulacionmontecarloenelcalculodelri-4835801
 
Uso de Software computacional Disenos Estadistica
Uso de Software computacional Disenos EstadisticaUso de Software computacional Disenos Estadistica
Uso de Software computacional Disenos Estadistica
 
Teoria de la estimación
Teoria de la estimaciónTeoria de la estimación
Teoria de la estimación
 
Tipos de graficos de control
Tipos de graficos de controlTipos de graficos de control
Tipos de graficos de control
 
Ayudantía de eiq344.diseño completamente al azar.
Ayudantía de eiq344.diseño completamente al azar.Ayudantía de eiq344.diseño completamente al azar.
Ayudantía de eiq344.diseño completamente al azar.
 
Operativa 1
Operativa  1Operativa  1
Operativa 1
 
05. gráfica de control y conceptos estadisticos
05. gráfica de control y conceptos estadisticos05. gráfica de control y conceptos estadisticos
05. gráfica de control y conceptos estadisticos
 
Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14
 
Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14
 
P04_MSA.4.2010.092010.ppt
P04_MSA.4.2010.092010.pptP04_MSA.4.2010.092010.ppt
P04_MSA.4.2010.092010.ppt
 

Último

6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
MiNeyi1
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
JonathanCovena1
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
JonathanCovena1
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
EliaHernndez7
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
UPTAIDELTACHIRA
 

Último (20)

6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
6.-Como-Atraer-El-Amor-01-Lain-Garcia-Calvo.pdf
 
Infografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdfInfografía EE con pie del 2023 (3)-1.pdf
Infografía EE con pie del 2023 (3)-1.pdf
 
Criterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficiosCriterios ESG: fundamentos, aplicaciones y beneficios
Criterios ESG: fundamentos, aplicaciones y beneficios
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJOACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
ACTIVIDAD DIA DE LA MADRE FICHA DE TRABAJO
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.Fe contra todo pronóstico. La fe es confianza.
Fe contra todo pronóstico. La fe es confianza.
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 

J.pdf

  • 1. Semana 10: Autoevaluación de Correlación y Regresión lineal simple Rusell Axes es una empresa de gestión de proyectos inmobiliarios. Encargada de captar, gestionar, promover y comercializar proyectos inmobiliarios en todos los distritos de Lima. El gerente de planeamiento de la empresa considera que el tiempo de construcción del edificio (en días) se relaciona linealmente con el número de pisos que se va a construir. El gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”, si el tiempo empleado en la construcción del edificio de 15 pisos es menor de 400 días. Para ello, selecciona una muestra de 15 expedientes con información de edificaciones similares, de donde obtiene el tiempo empleado en la construcción, en días, y el número de pisos realizados en cada uno. La información se muestra a continuación: Tiempo empleado en la construcción 300 330 300 395 376 370 360 330 380 405 481 417 500 412 460 Número de pisos 10 12 13 20 18 16 15 16 15 18 25 20 28 18 24 Utilizando un nivel de confianza del 96% y un nivel de significación del 1%, ¿Cuál será la decisión del gerente de planeamiento de la empresa? Para el análisis respectivo, utilice la siguiente información procesada en el software minitab. Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 178.445 18.6 9.616 0.000 X 11.714 1.00 11.677 0.000 1.00 Resumen del modelo
  • 2. S R-cuad. R-cuad. (ajustado) R- cuad. (pred) 18.5994 91.295% 90.626% 89.21% Análisis de Varianza Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 1 47165.731 47165.731 136.341 0.000 X 1 47165.731 47165.731 136.341 0.000 Error 13 4497.203 345.939 Falta de ajuste 8 2526.536 315.817 0.801 0.629 Error puro 5 1970.667 394.133 Total 14 51662.933 Estadístico de Durbin-Watson Estadístico de Durbin- Watson = 2.10263 Prueba de Anderson - Darling AD = 0.399 p – valor = 0.320 Configuración Variable Valor de configuración X 15 Predicción Error estándar Coeficiente de determinación El coeficiente de no determinación es 100 % - (R-cuad.) 100 % - 91.295 % = 8.705 % 0.000 < Alpha = 0.01 Se rechaza H0; es decir, se valida la regresión Como 2.10263 está incluido en el intervalo de <1.5; 2.5>; es decir, no existe autocorrelación de los errores
  • 3. Ajuste EE de ajuste IC de 96% IP de 96% 354.153 5.59760 (341.382; 366.925) (309.837; 398.470) Configuración Variable Valor de configuración X 400 Predicción Ajuste EE de ajuste IC de 96% IP de 96% 4864.01 383.387 (3989.28; 5738.75) (3988.25; 5739.78) Configuración Variable Valor de configuración X 15 Predicción Ajuste EE de ajuste IC de 99% IP de 99% 354.153 5.59760 (337.292; 371.015) (295.645; 412.662) Configuración Tiempo empleado en la construcción de un edificio de 15 pisos IP Valor individual
  • 4. Variable Valor de configuración X 400 Predicción Ajuste EE de ajuste IC de 99% IP de 99% 4864.01 383.387 (3709.15; 6018.88) (3707.79; 6020.24) 1. ¿Cuál es el objetivo que persigue esta investigación? a. Determinar si el gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”. b. Determinar si el tiempo empleado en la construcción del edificio de 15 pisos es menor de 400 días. c. Determinar si el tiempo de construcción del edificio se relaciona linealmente con el número de pisos que se va a construir. d. Determinar si el tiempo de construcción del edificio depende del número de pisos que se va a construir. e. Determinar si el número de pisos construidos en un edificio depende del tiempo de construcción del edificio La opción correcta es la letra: [Interpretación] 2. La variable dependiente es: a. Un edificio b. Número de pisos construidos c. Tiempo empleado en la construcción La opción correcta es la letra: [Representación] 3. El valor del coeficiente de no determinación es [Cálculo1]% y del error estándar es [Cálculo2]. Ingrese su respuesta redondeada a tres cifras decimales. 4. Al evaluar el estadístico de Durbin Watson, se concluye que: El tiempo empleado en la construcción depende de la cantidad de edificios a realizar. 18.600 8.705 %
  • 5. a. Como el valor del estadístico está contenido en el intervalo de 1 a 3, se asume que los errores no están autocorrelacionados y que la varianza de los errores es constante. b. Como el valor del estadístico está contenido en el intervalo de 1.5 a 2.5, se asume que los errores no están autocorrelacionados y que la varianza de los errores es constante. c. Como el valor del estadístico está contenido en el intervalo de 1.5 a 2.5, se asume que los errores están autocorrelacionados y que la varianza de los errores no es constante. d. Como el valor del estadístico no está contenido en el intervalo de 2.5 a 3.5,se asume que los errores no están autocorrelacionados y que la varianza de los errores es constante. La opción correcta es la letra: [Análisis1] Asumiendo que se cumplen los supuestos del modelo, responda los siguientes ítems. 5. La hipótesis nula en la prueba individual para verificar la validez del modelo es: a. H0: β0 = 0 b. H0: β1 = 0 c. H0: β0 ≠ 0 d. H0: β1 ≠ 0 La opción correcta es la letra: [Análisis_2] 6. Con un nivel de significación del 1%, la decisión y conclusión estadística en la prueba individual para verificar la validez del modelo: a. Rechazar la hipótesis alterna, el modelo de regresión lineal estimado es válido. b. Rechazar la hipótesis alterna, el modelo de regresión lineal estimado no es válido. c. Rechazar la hipótesis nula, el modelo de regresión lineal estimado es válido. d. Rechazar la hipótesis nula, el modelo de regresión lineal estimado no es válido. La opción correcta es la letra: [Análisis_3] 7. El tiempo empleado en la construcción de un edificio de 15 pisos es [Cálculo_3] días. Ingrese su respuesta redondeada a tres cifras decimales. 8. Con un nivel de confianza del 96%, el intervalo de [Cálculo_4] a [Cálculo_5] días contiene el tiempo empleado en la construcción de un edificio de 15 pisos. Ingrese su respuesta redondeada a tres cifras decimales. La hipótesis alterna es H1: B1 =/ 0 354.153 309.837 398.470
  • 6. 9. La respuesta del problema de investigación es: a. El gerente de planeamiento de la empresa no aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”. b. El gerente de planeamiento de la empresa aceptará la gestión de la construcción del edificio de departamentos “Buenos Aires”. c. Con los resultados obtenidos el gerente de planeamiento de la empresa no puede tomar una decisión. d. El tiempo empleado en la construcción del edificio si depende del número de pisos construidos. e. El número de pisos construidos si depende del tiempo de construcción del edificio. f. El tiempo empleado en la construcción del edificio de 15 pisos si es menor a 400 días. La opción correcta es la letra: [Argumentación] Debido a el tiempo empleado en la construcción del edificio de 15 pisos si es menor a 400 días, el gerente ejecutara la obra. Modelo de regresión lineal simple: Y= 0 + 1X + Donde: • Parámetros: 0 (intercepto) y 1 (coeficiente de regresión o pendiente) • X es una variable fija, pero no aleatoria, medida sin error. • que representa el error aleatorio. Ejemplo Y= 88.82 + 0.1766X 1. El intercepto es 88.82 2. Sobre la relación de las variables involucradas se puede afirmar que: a. Tienen una relación lineal directa, de moderada a fuerte
  • 7. Semana 11: Autoevaluación de Regresión no lineal simple El jefe de control de calidad de la empresa “Laurent S.A.” tomará la decisión de revisar el proceso de producción de la confección de maletines deportivos, si el costo total de producción de un ciento de maletines deportivos que usa 0,60 metros cuadrados de lona supera los 5500 soles. Para tomar esta decisión le solicita a Ud. y su equipo modelar el costo de un maletín deportivo (en miles de soles) en función del área de la lona utilizada en su confección en metros cuadrados (su principal insumo). Para la realización del estudio se registró la información de una muestra aleatoria de 14 maletines deportivos. Ud. y su equipo deberán realizar el análisis estadístico de regresión simple, el procedimiento de la selección del mejor modelo lineal o no lineal, validación de las pruebas de hipótesis de los parámetros del mejor modelo y realizar las predicciones solicitadas. Para el análisis asuma que los supuestos se cumplen, utilice un nivel de significación del 5% y un nivel de confianza del 95%, y considere los reportes obtenidos del Minitab. Análisis de regresión: Y vs. X Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 24.86 2.05 12.13 0.000 X 66.09 3.21 20.62 0.000 1.00 Resumen del modelo S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 1.89652 97.25% 97.03% 96.00% Análisis de Varianza Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 1 1529.20 1529.20 425.15 0.000 X 1 1529.20 1529.20 425.15 0.000 Error 12 43.16 3.60 Modelo lineal
  • 8. Falta de ajuste 10 40.66 4.07 3.25 0.258 Error puro 2 2.50 1.25 Total 13 1572.36 Configuración Variable Valor de configuración X 0.6 Predicción Ajuste EE de ajuste IC de 95% IP de 95% 64.5111 0.510623 (63.3986; 65.6237) (60.2318; 68.7904) _________________________________________________________________________________________________________________ Análisis de regresión: Y vs. X; X^2 Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 30.24 8.08 3.74 0.003 X 48.0 26.4 1.82 0.097 64.96 X^2 14.3 20.6 0.69 0.504 64.96 Resumen del modelo S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 1.93925 97.37% 96.89% 94.67% Análisis de Varianza Modelo cuadrático Es el modelo de regresión con mejor ajuste Es el valor del coeficiente de determinación de modelo de regresión con mejor ajuste
  • 9. Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 2 1530.99 765.495 203.55 0.000 X 1 12.41 12.409 3.30 0.097 X^2 1 1.79 1.794 0.48 0.504 Error 11 41.37 3.761 Falta de ajuste 9 38.87 4.319 3.45 0.245 Error puro 2 2.50 1.250 Total 13 1572.36 Configuración Variable Valor de configuración X 0.6 X^2 0.36 Predicción Ajuste EE de ajuste IC de 95% IP de 95% 64.1685 0.720190 (62.5834; 65.7536) (59.6154; 68.7216) _________________________________________________________________________________________________________________ Análisis de regresión: Ln(Y) vs. X Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 3.5539 0.0308 115.54 0.000 X 1.0006 0.0481 20.79 0.000 1.00 Resumen del modelo Modelo exponencial 0.504 > Alpha = 0.05 No se rechaza H0; es decir, no se valida la regresión Es el valor del estadístico de prueba individual para la validación del mejor modelo válido Es el mejor modelo de regresión validado
  • 10. S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 0.0284749 97.30% 97.07% 96.51% Análisis de Varianza Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 1 0.350505 0.350505 432.28 0.000 X 1 0.350505 0.350505 432.28 0.000 Error 12 0.009730 0.000811 Falta de ajuste 10 0.009158 0.000916 3.21 0.261 Error puro 2 0.000571 0.000286 Total 13 0.360235 Configuración Variable Valor de configuración X 0.6 Predicción Ajuste EE de ajuste IC de 95% IP de 95% 4.15423 0.0076666 (4.13752; 4.17093) (4.08998; 4.21848) _________________________________________________________________________________________________________________ Análisis de regresión: Ln(Y) vs. Ln(X) Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 4.4817 0.0177 252.55 0.000 Ln(X) 0.6009 0.0308 19.51 0.000 1.00 Modelo potencia 0.000 < Alpha = 0.05 Se rechaza H0; es decir, se valida la regresión Ecuación linealizada LnY: 3.5539 + 1.0006LnX1 Ecuación potencia Y: e^3.5539*X^1.0006 Y: 34.94935*X^1.0006 El mejor modelo válido, el valor del 0 El mejor modelo válido, el valor del 1 <e*4.08998; e*4.21848> <59.7386969; 67.9301519>
  • 11. Resumen del modelo S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 0.0302823 96.95% 96.69% 95.61% Análisis de Varianza Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 1 0.349231 0.349231 380.83 0.000 Ln(X) 1 0.349231 0.349231 380.83 0.000 Error 12 0.011004 0.000917 Falta de ajuste 10 0.010433 0.001043 3.65 0.234 Error puro 2 0.000571 0.000286 Total 13 0.360235 Configuración Variable Valor de configuración Ln(X) -0.510826 Predicción Ajuste EE de ajuste IC de 95% IP de 95% 4.17479 0.0080935 (4.15715; 4.19242) (4.10649; 4.24308) 1. ¿Cuál es el objetivo que persigue esta investigación? a. Determinar el tipo de relación que existe entre el costo de producción de un maletín deportivo y el área de lona en m2.
  • 12. b. Determinar el costo de producción de un de maletín deportivo cuando utiliza 0,60 m2 de lona. c. Determinar si el jefe de Control de Calidad deberá revisar el proceso de producción de la confección de maletines deportivos. La opción correcta es la letra: [Interpretación] 2. La variable independiente, dependiente y la técnica estadística son respectivamente: a. Costo de producción de un maletín deportivo, el área de la lona en m2 y análisis de regresión lineal simple. b. Costo de producción de un maletín deportivo, el área de la lona en m2 y análisis de regresión simple. c. El área de la lona en m2, costo de producción de un maletín deportivo y análisis de regresión simple. La opción correcta es la letra: [Representación] 3. El modelo de regresión con mejor ajuste es: a. Lineal b. Cuadrático c. Exponencial d. Potencia La opción correcta es la letra: [Análisis1] 4. El valor del coeficiente de determinación de modelo de regresión con mejor ajuste es: [Cálculo1]% Ingrese su respuesta redondeada a dos cifras decimales 5. El mejor modelo de regresión validado es: a. Lineal b. Cuadrático c. Exponencial d. Potencia La opción correcta es la letra: [Análisis2] 6. El valor del estadístico de prueba individual para la validación del mejor modelo válido es: [Cálculo2] Ingrese su respuesta redondeada a dos cifras decimales. Ranking 1. Modelo cuadrático = 97.37 % 2. Modelo exponencial = 97.30 % 3. Modelo lineal = 97.25 % 4. Modelo potencia = 96.95 % 97.370 % 20.79
  • 13. 7. Del mejor modelo válido, el valor del β0 es: [Cálculo3] y el valor de β1 es: [Cálculo4] Ingrese su respuesta redondeada a tres cifras decimales. 8. Con un 95% de nivel de confianza, el intervalo de [Cálculo5] a [Cálculo6] soles contiene el costo de fabricación de un maletín deportivo cuando el área de la lona es m2 es de 0,60. Ingrese su respuesta redondeada a tres cifras decimales. 9. La decisión del jefe de Control de Calidad es: a. No se puede tomar la decisión de revisar el proceso de producción de la confección de los maletines deportivos. b. Tomar la decisión de no revisar el proceso de producción de la confección de los maletines deportivos c. Tomar la decisión de revisar el proceso de producción de la confección de los maletines deportivos. La opción correcta es la letra: [Argumentación] 34.950 1.0001 59.739 67.930 Debido a que el costo total de producción de un ciento de maletines deportivos que usa 0,60 metros cuadrados de lona supera los 5500 soles. Regla de tres simple 1 59.739 100 x x = 100*59.739 x = 5973.9
  • 14. Semana 12: Autoevaluación de Regresión lineal múltiple El ingeniero de sistemas de una compañía de transmisión de datos a distancia desea estudiar la relación lineal del costo de la transmisión (en soles) con las siguientes variables: Cantidad de información transmitida (en mega bytes), la distancia (en miles de kilómetros), y el número de operadores del centro de cómputo. Para ello se tomaron registros de 14 transmisiones de datos seleccionadas al azar. Si el costo medio de la transmisión es mayor a 130 soles, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo, el ingeniero de sistemas de la compañía optimizará el proceso de transmisión de datos. Utilizando un nivel de significación del 1% y un nivel de confianza del 95% ¿Cuál será la decisión del ingeniero de sistemas? Para el análisis estadístico utilice los reportes obtenidos con el software MINITAB que fueron elaborados sobre los datos de las variables del contexto presentado. Modelo completo Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 118.9 21.2 5.62 0.000 Cantidad de información 1.093 0.294 3.71 0.004 1.34 Distancia 0.61 1.07 0.57 0.579 1.83 Número de operadores -9.82 2.74 -3.58 0.005 2.27 Resumen del modelo S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 15.9443 88.45% 84.99% 72.12% Análisis de Varianza 0.004 < Alpha = 0.01 Se rechaza H0; es decir, se valida la regresión 0.579 > Alpha = 0.01 No se rechaza H0; es decir, no se valida la regresión 0.005 < Alpha = 0.01 Se rechaza H0; es decir, se valida la regresión
  • 15. Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 3 19471.8 6490.60 25.53 0.000 Cantidad de información 1 3502.7 3502.74 13.78 0.004 Distancia 1 83.4 83.43 0.33 0.579 Número de operadores 1 3261.6 3261.60 12.83 0.005 Error 10 2542.2 254.22 Total 13 22014.0 Prueba de Anderson Darling AD = 0.207 valor – p = 0.834 Estadístico de Durbin-Watson Estadístico de Durbin- Watson = 1.52090 Estadísticas Variable Conteo total Mínimo Máximo COOK 14 0.0000 1.0653 Configuración Variable Valor de configuración Cantidad de información 35 Distancia 15 Número de operadores 2 Predicción
  • 16. Ajuste EE de ajuste IC de 95% IP de 95% 146.730 6.21867 (132.874; 160.586) (108.597; 184.862) Modelo reducido Selección de términos escalonada Términos candidatos: X1; X2; X3 -----Paso 1--- - -----Paso 2--- - Coef P Coef P Constante 165.83 129.1 Número de operadores -14.40 0.000 - 10.86 0.000 Cantidad de información 1.058 0.003 S 22.4639 15.4497 R-cuad. 72.49% 88.07% R-cuad.(ajustado) 70.20% 85.90% Cp de Mallows 13.82 2.33 AICc 133.11 125.45 BIC 132.62 123.56 α a entrar = 0.05; α a retirar = 0.05 Coeficientes Término Coef EE del coef. Valor T Valor p FIV Constante 129.1 11.1 11.58 0.000 Cantidad de información 1.058 0.279 3.79 0.003 1.28 Ecuación estimada del mejor modelo de regresión Y: 129.1 + 1.058X1 - 10.86X3
  • 17. Número de operadores - 10.86 1.99 -5.45 0.000 1.28 Resumen del modelo S R- cuad. R-cuad. (ajustado) R- cuad. (pred) 15.4497 88.07% 85.90% 76.33% Análisis de Varianza Fuente GL SC Ajust. MC Ajust. Valor F Valor p Regresión 2 19388 9694.2 40.61 0.000 Cantidad de información 1 3430 3429.9 14.37 0.003 Número de operadores 1 7078 7077.6 29.65 0.000 Error 11 2626 238.7 Total 13 22014 Prueba de Anderson Darling AD = 0.208 valor – p = 0.831 Estadístico de Durbin-Watson Estadístico de Durbin- Watson = 1.52014 Estadísticas Variable Conteo total Mínimo Máximo COOK 14 0.0008 0.9535 Es el valor del coeficiente de determinación, del mejor modelo de regresión
  • 18. Configuración Variable Valor de configuración Cantidad de información 35 Número de operadores 2 Predicción Ajuste EE de ajuste IC de 95% IP de 95% 144.405 4.56641 (134.355; 154.456) (108.947; 179.864) 1. ¿Cuál es la problemática que se deberá resolver? a. ¿Cuál será la decisión del ingeniero? b. ¿El costo de la transmisión de datos es mayor a 135 soles? c. ¿El ingeniero de sistemas de la compañía optimizará el proceso de transmisión de datos? d. ¿Cuál es el costo de la transmisión de datos, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo? La opción correcta es la letra: [Interpretación] 2. La variable dependiente es: a. Cantidad de información transmitida (mega bytes) b. Distancia de la transmisión de los datos (miles de kilómetros) c. Número de operadores en el centro de cómputo d. Costo de la transmisión de datos (soles) La opción correcta es la letra: [Representación1] 3. Del siguiente listado, no es un supuesto del análisis de regresión lineal múltiple a. Normalidad de los errores Es la estimación puntal del costo de la transmisión de datos IP Valor individual
  • 19. b. Multicolinealidad de las variables regresoras c. Varianza constante de los errores d. Independencia de los errores e. Independencia de las variables independientes La opción correcta es la letra: [Representación2] 4. Considerando un nivel de significación del 1%, a partir de la prueba de coeficientes del modelo completo de regresión se puede concluir que: a. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que la cantidad de información trasmitida, la distancia de la información transmitida y el número de operadores del centro de cómputo influyen en el costo de la transmisión de datos. b. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida y la distancia de la información transmitida influyen en el costo de la transmisión de datos. c. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida y el número de operadores del centro de cómputo influyen en el costo de la transmisión de datos. d. Con un 1% de nivel de significación, la evidencia muestral es suficiente para afirmar que solo la cantidad de información trasmitida influyen en el costo de la transmisión de datos. La opción correcta es la letra: [Análisis1] 5. La ecuación estimada del mejor modelo de regresión es: a. b. c. d. Tener en cuenta que X1: Cantidad de información trasmitida, X2: Distancia de la información transmitida, X3: Número de operadores del centro de cómputo. La opción correcta es la letra: [Análisis2] 6. El valor del coeficiente de determinación, del mejor modelo de regresión, es: [Cálculo1]% Ingrese su respuesta redondeada a dos cifras decimales. Homocedasticidad 85.90 %
  • 20. 7. La estimación puntal del costo de la transmisión de datos, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo es: [Cálculo2] Ingrese su respuesta redondeada a tres cifras decimales. 8. El límite inferior del intervalo de confianza al 95% de la estimación del costo de la transmisión de datos, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo es: [Cálculo3] Ingrese su respuesta a tres cifras decimales 9. ¿Cuál es la respuesta de la pregunta de investigación? a. El ingeniero de sistemas de la compañía si optimizará el proceso de transmisión de datos. b. El ingeniero de sistemas de la compañía no optimizará el proceso de transmisión de datos. c. El costo medio de la transmisión de datos si es mayor a 130 soles. d. El costo medio de la transmisión de datos no es mayor a 130 soles. e. Ninguna de las anteriores. La opción correcta es la letra: [Argumentación] 144.405 108.947 Debido a que el costo medio de la transmisión es mayor a 130 soles, cuando se transmite 35 mega bytes a una distancia de 15 mil kilómetros y se cuenta con dos operadores en el centro de cómputo