Concepto y definición de tipos de Datos Abstractos en c++.pptx
Estadistica y pronostico para la toma de decisiones
1. Maestros Online www.maestronline.com
Solicita una cotización a través de nuestros correos
Maestros Online Estadística y pronóstico para la toma de decisiones Grupo de problemas
Servicio de asesorías y solución de ejercicios
Envía tus actividades a ciencias_help@hotmail.com
2. Maestros Online www.maestronline.com
Actividad 1: ¿Quién tienen mayor peso, los hombres o las mujeres? Instrucciones: La estatura de una persona está relacionada con su peso, por lo que puede sugerirse, en términos generales, que a mayor estatura de una persona esta tendrá más peso. Para tener una idea de cómo es esta relación, realiza lo siguiente: 1. De manera individual pregunta a 10 personas diferentes la siguiente información: a. Su género (hombre o mujer) b. Su estatura en centímetros c. Su peso en kilogramos 2. Con base en la información recolectada, determina: a. ¿Quiénes presentan mayor estatura, hombres o mujeres? b. ¿Quiénes presentan mayor peso, hombres o mujeres? c. ¿Cuál es la mayor estatura?, ¿cuál la menor? d. ¿Cuál es el promedio de las estaturas? ¿cuál el del peso? e. ¿Cuál es la varianza del conjunto de datos? f. Determina la varianza por género. 3. Comparte tus resultados en el foro del equipo. 4. Utilicen Excel para elaborar una base de datos donde se incluya la información de todos los miembros del equipo. 5. Determinen lo siguiente: a. El promedio general tanto de estatura como de peso. b. Para ambas variables determinar la mediana. c. Calcular la varianza y la desviación estándar. 6. Verifiquen lo anterior utilizando herramientas de análisis de Excel. 7. Al finalizar, reflexionen sobre las siguientes preguntas y preparen un documento que integre las respuestas de todo el equipo a manera de conclusiones. Compartan el documento en el foro. a. ¿Cuál es el promedio general, tanto para peso como para estatura? b. ¿Cuál es el promedio por género (hombre, mujer)? c. ¿Cuál es la desviación estándar para todo el conjunto de datos? d. ¿Cuál es la desviación estándar por género? e. ¿Cuál de los dos géneros es el de mayor estatura?, ¿cuál el de mayor peso? f. ¿Qué genero presenta mayor variabilidad en ambas características (estatura y peso)? g. ¿En qué otras áreas podrían aplicar estos conceptos?
3. Maestros Online www.maestronline.com
Realiza lo siguiente: 1. Determina cuál de las siguientes es una distribución de probabilidad. En caso de que no sea función de probabilidad explicar por qué no lo es.
a. x 1 2 3 4 p(x) 0.4 0.2 0.3 0.2 c. x -2 -1 1 2 p(x) 0.1 0.2 0.6 0.1 e. x 0 2 4 6 p(x) -0.1 0.3 0.1 0.5 g. x 1 2 3 4 p(x) 0.4 0.2 0 .3 0.2 2. El gerente de una planta utiliza datos históricos para construir una función de distribución de probabilidad de X, el número de empleados ausentes en un día dado; los datos se presentan a continuación: x 0 1 2 3 4 5 6 7 p(x) 0.001 0.025 0.350 0.300 0.200 0.090 0.029 0.005 Determinar lo siguiente: a. P(X=1)
4. Maestros Online www.maestronline.com
b. P(X>5) c. P(X≥5) d. P(X=6) 3. Supón que X representa el número de personas en una vivienda. La distribución de probabilidad es como sigue: X 1 2 3 4 5 6 7 p(x) 0.26 0.31 0.19 0.14 0.05 0.03 0.02 4. a. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga menos de 3 personas? b. ¿Cuál es la probabilidad de que una casa seleccionada al azar tenga más de 5 personas? c. ¿Cuál es la probabilidad de que una vivienda seleccionada al azar tenga entre 2 y 4 (inclusive) personas? Determínese P (2≤X≤4). Escribe con tus propias palabras el proceso de prueba de hipótesis y los intervalos de confianza. 5. Una muestra aleatoria de 10 observaciones se extrajo de una población normal. Los datos son los siguientes: 3 6 3 5 6 2 6 5 5 4 a. Establecer un intervalo de confianza al 90%. b. Establecer un intervalo de confianza al 95%. c. Establecer un intervalo de confianza al 99%. 5. Del experimento para determinar los grados centígrados necesarios para llevar el punto de ebullición un litro de agua, se obtuvieron los siguientes resultados: 100.0 100.2 99.7 99.5 99.5 100.3 99.0 99.4 99.9 100.2 100.1 99.8
a. Prueba la hipótesis de que la media es igual a 100 (H0: μ = 100) contra la alternativa de que la media poblacional es diferente a 100 (Ha: μ ≠ 100). El nivel de significancia es del 1% (α = 0.01). Realiza todas las etapas de una prueba de hipótesis. b. Establece intérprete el intervalo de confianza al 99% para la media de ebullición μ.
5. Maestros Online www.maestronline.com
6. Por un período de varios años, un dentífrico ha recibido una puntuación media de 5.9, en una escala de 7 puntos, en cuanto a la satisfacción general del cliente con el producto. Debido a un cambio no anunciado en el producto, existe la preocupación de que quizás haya cambiado la satisfacción del cliente. Supón que las puntuaciones para una muestra de 25 clientes tienen una media de 5.60 y una desviación estándar de 0.87. ¿Indican estos datos que la satisfacción del cliente es diferente de 5.9? a. Prueba la hipótesis con α = 0.05. b. Obtén un intervalo de confianza al 95% para la media μ. Actividad 2: Nicotina en cigarrillos Instrucciones: 1. De manera individual, escribe el proceso de la prueba de hipótesis. 2. Reúnanse en equipos de trabajo (foro, Skype, Google Docs, chat, etc.). 3. Comenten sobre el proceso de las pruebas de hipótesis. 4. Una muestra aleatoria de 50 jóvenes adultos se selecciona y a cada persona se le pregunta cuántos minutos ven diariamente de deportes. La media muestral que se encontró fue de = 64. Supón que σ = 20. Prueben la hipótesis de que existe suficiente evidencia estadística para inferir que la media poblacional es superior a 60 minutos. Utilicen un nivel de significancia de 0.05. 5. Repitan el ejercicio 4 con n =75 6. Repitan el ejercicio 4 con n =100 7. Repitan el ejercicio 4 con σ = 10. 8. Repitan el ejercicio 4 con σ = 40. 9. Repitan el ejercicio 4 con = 62. 10. Repitan el ejercicio 4 con = 68. 11. Realicen un resumen de los ejercicios 4 a 10 describiendo qué pasa al valor de la estadística de prueba cuando pasa lo siguiente: a. El tamaño de muestra se incrementa. b. La desviación estándar disminuye. c. El valor de se incrementa. 1. Describe con tus propias palabras qué significa una serie de tiempo. 2. Enlista y define las componentes de una serie de tiempo. 3. ¿Cuál de las cuatro componentes de una serie de tiempo se utilizaría para describir el efecto de las ventas navideñas de una tienda departamental de menudeo? 4. ¿Por qué es más fácil pronosticar valores para una serie de tiempo que contiene un componente estacional que uno que posee un componente cíclico? 5. Los datos que se presentan a continuación corresponden al número de autos de pasajeros (en miles) en Francia durante los años 1970 a 2006.
6. Maestros Online www.maestronline.com
Año 1970 1975 1979 1980 1981 1982 1983 1984 1985 1986 Número de autos (miles) 12470 15520 18440 19130 19750 20300 20600 20800 21090 21500 Año 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 Número de autos (miles) 21970 22520 23010 23550 23810 24020 24385 24900 25100 25500 Año 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 Número de autos (miles) 26090 26810 27480 28060 28700 29160 29560 29900 30100 30400 6. Grafica el número de autos contra los años (utiliza Excel o cualquier paquete estadístico como Minitab). 7. ¿Qué componentes de la series de tiempo parecen estar presentes en esta serie? Actividad 3: ¿Existe relación entre el tamaño de la casa y los metros de terreno? ¿Existe
7. Maestros Online www.maestronline.com
autocorrelación en la serie de datos de los CETES? Instrucciones: 1. En forma individual define lo que significa los términos de: a. Serie de tiempo b. Componentes de una serie de tiempo c. Correlación d. Autocorrelación 2. En equipos (por Skype, chat, Google Docs, etc.) lleguen a una definición común e indiquen en que situaciones de la vida diaria se pueden aplicar estos conceptos, den un ejemplo de cada término. 3. Busquen información de 20 casas en venta en donde las variables son: Y (metros de construcción) y X (metros de terreno); y realicen lo que se indica: a. Realicen y describan el diagrama de dispersión b. Calculen e interpreten el coeficiente de correlación muestral r c. Respondan a la siguiente cuestión en un terreno urbano, ¿a mayor cantidad en metros de construcción es mayor el precio de la vivienda? 4. Busquen información de los CETES a 28 DÍAS – SEMANAL, periodicidad diaria, datos del Banco de México; consideren las últimas 20 cotizaciones de los CETES y realicen lo que se indica: a. Determina el coeficiente de autocorrelación r1 b. Determina la prueba la hipótesis de que: i. Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero) ii. Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero) iii. Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k 5. Den respuesta a la siguiente cuestión: ¿Qué significa el término autocorrelación? ¿Existe autocorrelación entre los rendimientos de los CETES a 28 días? 6. Con los conceptos vistos y puestos en práctica den una respuesta justificada a cada una de las siguientes cuestiones: a. ¿Qué significa el coeficiente de correlación? b. ¿Cómo se interpreta el coeficiente de correlación? c. ¿Para qué sirve el coeficiente de autocorrelación?
¿Bajo qué condiciones es un promedio móvil simple apropiado para pronosticar?
8. Maestros Online www.maestronline.com
1. Los datos de la demanda anual de bolsas de fertilizante de una empresa agrícola se muestran en la siguiente tabla. Año t Demanda de fertilizante (miles de bolsas) Pronóstico 1 4 - 2 6 - 3 4 - 4 5 4.7 5 10 6 8 7 7 8 9 9 12 10 14 11 15
a. Grafica la serie de tiempo. b. Encuentra el valor de pronóstico para la demanda de fertilizante para cada año, comenzando por el año 4 por medio de un promedio móvil de k=3 años. 2. Aplica el suavizamiento exponencial con una constante de suavizamiento de α = 0.1 y un valor inicial de 38 para pronosticar el valor del año 11 para el siguiente conjunto de datos. Período T Yt Ŷt 1 38 38 2 43 3 42
9. Maestros Online www.maestronline.com
4 45 5 46 6 48 7 50 8 49 9 46 10 45
3. Las ventas de equipos de cocina han aumentado durante los últimos cinco años. Año Ventas Yt Ŷt 1 400 360 2 455 3 468 4 513 5 534 6
a. El gerente había pronosticado, antes de iniciar el negocio, que las ventas del primer año serían de 360 equipos de cocina. Por medio de un suavizamiento exponencial con α = 0.40, desarrolla los pronósticos para el periodo comprendido entre los años 2 y 6. 5. Las ventas trimestrales de una cadena de tiendas departamentales se registraron para los años 1986-1989: Año Trimestre Ventas (millones) Yt Pronóstico Ŷt 1986 1 18 18 2 33
10. Maestros Online www.maestronline.com
3 25 4 41 1987 1 22 2 20 3 36 4 33 1988 1 27 2 38 3 44 4 52 1989 1 31 2 26 3 29 4 45 1990 1
a. Utiliza el suavizamiento exponencial con una constante de suavizamiento de 0.4 y un valor inicial de 18 para pronosticar las ventas para el primer trimestre de 1990. 6. Para los siguientes valores de Yt y Ŷt de la siguiente tabla calcula la DAM, el ECM, el EPAM y EPM. Valor observado Yt Pronóstico Ŷt 166 173 179 186 195 192 214 211 220 223
11. Maestros Online www.maestronline.com
6. Se utilizaron dos modelos de pronóstico para producir los valores futuros de una serie de tiempo; estos valores (Ŷt) se muestran en la tabla siguiente, junto con los valores reales observados (Yt). Valores de pronóstico Ŷt Valor observado Yt Modelo 1 Modelo 2 6.0 7.5 6.3 6.6 6.3 6.7 7.3 5.4 7.1 9.4 8.2 7.5
a. Calcula el DAM y el ECM para determinar cuál es más preciso. 8. Determina DAM y ECM para los siguientes pronósticos. Valor observado Yt Pronóstico Ŷt 57 63 60 72 70 86 75 71 70 60
8. Se utilizaron tres técnicas de pronóstico para predecir los valores de una serie de tiempo. Estos valores se dan en la siguiente tabla. Calculen el DAM y el ECM para cada técnica para determinar cuál es el más preciso. Valores de pronóstico Ŷt
12. Maestros Online www.maestronline.com
Valor observado Yt Técnica 1 Técnica 2 Técnica 3 19 21 22 17 24 27 24 20 28 29 26 25 32 31 28 31 38 35 30 39 ¿Cuánto tiempo dedica una persona en promedio a Internet? Para tener una idea de esto, realiza lo siguiente: 1. Pregunta de manera individual a 10 personas del género masculino y a 10 personas del género femenino la siguiente información: a. Su edad b. Tiempo que dedica diariamente a Internet 2. Con una calculadora de bolsillo y con base en esta información determina: a. En promedio, ¿quién dedica más tiempo a Internet, hombres o mujeres? b. ¿Cuál es el promedio de edad de las mujeres?, ¿de los hombres? c. Para los géneros por separado determina la mediana de la edad y del tiempo dedicado a Internet. d. Para el total de datos determina la varianza y la desviación estándar del tiempo que dedican a Internet y de la edad. 3. Utiliza Excel para elaborar una base de datos donde incluyas toda la información. Con una calculadora de bolsillo contesta lo siguiente: a. ¿Cuál es el promedio general de tiempo dedicado a Internet y de la edad? b. ¿Cuál es la mediana para los datos en general, tanto para el tiempo dedicado a Internet como de la edad? c. ¿Cuál es la varianza y la desviación estándar de todos los datos para el tiempo dedicado a Internet y para la edad? 4. Verifica lo anterior utilizando herramientas de análisis de Excel. 5. Para finalizar, reflexiona sobre las siguientes preguntas y prepara un documento con respuestas a manera de conclusiones. 6. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco de México y realiza lo que se indica: a. Considera las últimas 12 cotizaciones de la TIIE b. Determina el coeficiente de autocorrelación r1
13. Maestros Online www.maestronline.com
c. Determina la prueba la hipótesis de que: Hipótesis nula: H0 : ρ1 = 0 (La autocorrelación es igual a cero) Hipótesis alternativa: Ha : ρ1≠ 0 (La autocorrelación es diferente de cero) Donde ρk es el coeficiente de autocorrelación poblacional en el lapso k 7. Busca información de TIIE 28 DÍAS - MENSUAL, Periodicidad mensual, datos del Banco de México, considera las últimas 24 cotizaciones de la TIIE y realiza lo que se indica, a. Determina el valor de pronóstico para el rendimiento del bono, comenzando en 4to periodo, por medio de un promedio móvil de k= 3 meses. b. Determina el valor de pronóstico para el rendimiento del bono para cada mes, comenzando en el periodo 6, mediante un promedio móvil de k=5 meses. c. Utiliza el suavizamiento exponencial con una constante de suavizamiento α = 0.2 y un valor inicial igual a la primera lectura del TIIE 28 DÍAS. d. Evalúa estos métodos de pronóstico por medio de Desviación Absoluta Media (DAM), Error Cuadrático Medio (ECM), Error Porcentual Absoluto Medio (EPAM) y Error Porcentual Medio (EPM). e. Pronostica el rendimiento para el periodo 25 por medio de la mejor técnica. Actividad 4: Obtención de la recta de regresión ajustada por medio del método de mínimos cuadrados. Instrucciones: Preparación para la actividad colaborativa (de forma individual) 1. Define los siguientes términos: a. Análisis de la regresión simple. b. Estimadores de mínimos cuadrados. c. Intervalo de confianza. d. Coeficiente de regresión. e. Coeficiente de correlación. f. Coeficiente de determinación. 2. Comparte tus definiciones a través del foro de grupo virtual que se estableció para el desarrollo de la actividad. Durante la actividad colaborativa
14. Maestros Online www.maestronline.com
2. En equipos reporten al foro el desarrollo de los siguientes ejercicios y respuesta de las preguntas planteadas: a. En una compañía fabricante de helados se sospecha que el almacenar el helado a temperaturas bajas durante largos periodos tiene un efecto lineal en la pérdida de peso del producto. En la planta de almacenamiento de la compañía se obtuvieron los siguientes datos: Pérdida de peso (gr) Y 28 37 36 30 28 36 35 Tiempo (semanas) X 26 32 35 27 25 31 30 i. Ajusten e interpreten un modelo de regresión lineal simple a los datos. ii. Prueben la significancia de la pendiente β1. iii. Calculen e interpreten R2. iv. Elaboren un intervalo de confianza del 90% para β1. v. Pronostiquen la pérdida cuando el tiempo es de 33 semanas. 3. Con los conceptos vistos y puestos en práctica, den una respuesta justificada a cada una de las siguientes cuestiones: a. ¿Para qué utilizarías la regresión lineal simple en un problema de tu especialidad? b. ¿Qué relación tiene con la correlación? c. ¿Cómo medirías el ajuste del modelo de regresión lineal obtenido? d. ¿Qué es el coeficiente de determinación? e. ¿Por qué crees que se llama regresión lineal? f. ¿Cuál es la relación de la prueba de hipótesis con el intervalo de confianza en la regresión? I. Realiza lo siguiente: 1. En un estudio de variables que afectan la productividad en el negocio de abarrotes al menudeo, W. S. Good usa el valor agregado por hora de trabajo para medir la productividad de tiendas de abarrotes al menudeo. Él define el “valor agregado” como el “excedente [dinero generado por el negocio] disponible para pagar mano de obra, muebles accesorios y equipo”. Los datos de acuerdo con la relación del valor agregado por hora de trabajo Y y el tamaño X de la tienda de abarrotes descrita en el artículo de Good para diez tiendas de abarrotes ficticias se muestran enseguida. Se establecerá un modelo para relacionar Y con X. Datos en relación con el tamaño de tienda y el valor agregado Tienda Valor agregado por hora de trabajo Tamaño de la tienda (miles de pies cuadrados)
15. Maestros Online www.maestronline.com
Y X
1
6.08
23.0 2 5.40 14.0
3
5.51
27.2 4 5.09 12.4
5
4.92
33.9 6 3.94 9.8
7
6.11
22.6 8 5.16 17.5
9
5.75
27.0 10 5.60 21.1 a. Realiza un diagrama de dispersión de los datos para Y contra X. b. Calcula las rectas de mínimos cuadrados para Y contra X. c. Obtén una gráfica de residuales contra el valor ajustado de Y, ya sea por medio de Minitab. Observa la gráfica. ¿Qué patrón parecen seguir los datos? Éste es un ejemplo de análisis de residuales. 2. En un experimento con conejos se tomaron en cuenta las siguientes variables: Y: Proporción del peso final al peso inicial. X: Gramos diarios de alimento por kg de peso inicial. Proporción de peso final al peso inicial Y Gramos diarios de alimento por kg de peso inicial X
Proporción de peso final al peso inicial Y Gramos diarios de alimento por kg de peso inicial X
0.91
10
1.16
33 0.88 15 0.96 35
0.90
18
1.08
36 0.79 19 1.13 37
0.94
20
1.00
39 0.88 21 1.10 42
16. Maestros Online www.maestronline.com
0.95
21
1.11
45 0.97 24 1.18 54
0.88
25
1.26
56 1.01 27 1.29 56
0.95
28
1.36
59 0.95 30 1.40 59
1.05
30
1.32
60 1.05 31 1.47 64 a. Realiza un diagrama de dispersión de los datos para Y contra X. b. Calcula las rectas de mínimos cuadrados para Y contra X. c. Prueba la hipótesis de que la pendiente es cero. Realiza todas las etapas de la prueba de hipótesis (α = 0.01). d. Calcula las predicciones Ŷ para los siguientes valores de X0: 0, 5, 15, 25, 30, 35.5, 39, 45, 60, 70, 80, 90. Calcula el intervalo de confianza de los valores particulares de Y para los valores dados de X0 del inciso anterior. Realiza los siguientes ejercicios (utiliza Excel o un paquete de software estadístico como Minitab). 3. Una empresa ha estado buscando los factores que influyen en la cantidad de acero (en millones de toneladas) que puede vender cada año. La administración sospecha que los siguientes son los factores principales: la tasa anual de inflación del país, el precio promedio por tonelada de acero importado que acota los precios (en dólares) y el número de automóviles (en millones) que los fabricantes de autos planean producir ese año. Se recolectaron los datos de los últimos siete años: Millones de tons. vendidas Y Tasa de inflación X1 Cota de Importaciones X2 Número de automóviles (millones) X3
4.2
3.1
3.10
6.2 3.1 3.9 5.00 5.1
4.0
7.5
2.20
5.7
17. Maestros Online www.maestronline.com
4.7 10.7 4.50 7.1
4.3
15.5
4.35
6.5 3.7 13.0 2.60 6.1
3.5
11.0
3.05
5.9 a. Estima la ecuación de regresión múltiple. b. Interpreta los coeficientes de regresión estimados. 4. Se llevó a cabo un conjunto de ensayos experimentales para determinar una forma de predecir el tiempo de cocimiento en minutos Y a varios niveles de amplitud del horno, pies X1 y temperatura de cocción, grados Celsius X2. Los datos obtenidos fueron registrados como se muestra a continuación: Tiempo de cocimiento Y Niveles de amplitud del horno, pies X1 Temperatura en grados Cº X2 6.40 1.32 1.15 15.05 2.69 3.40 18.75 3.56 4.10 30.25 4.41 8.75 44.85 5.35 14.82 48.94 6.20 15.15 51.55 7.12 15.32 61.50 8.87 18.18 100.44 9.80 35.19 111.42 10.65 40.40 a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Pronostica el tiempo de cocimiento cuando el nivel de amplitud del horno es de 5 pies y la temperatura de cocción es de 20 grados Celsius. b. El supervisor de una empresa está examinando la relación existente entre la calificación que obtiene un empleado en una prueba de aptitud, su experiencia previa y el éxito en el trabajo. Se estudia y se pondera la experiencia de un empleado en
18. Maestros Online www.maestronline.com
trabajos anteriores y se obtiene una calificación entre 2 y 12. La medida del éxito en el empleo se basa en un sistema de puntuación que incluye producción total y eficiencia, con valor máximo posible de 50. El supervisor tomó una muestra de seis empleados con menos de un año de antigüedad, y obtuvo lo siguiente: Evaluación del desempeño Y Resultado de la prueba de aptitud X1 Experiencia en trabajos anteriores (años) X2 28 74 5 33 87 11 21 69 4 40 93 9 38 71 7 46 97 10
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Si un empleado obtuvo 83 puntos en la prueba de aptitud y tenía una experiencia en trabajos anteriores de 7 años, ¿qué evaluación de desempeño puede esperar? Actividad 5: ¿Existe relación entre la cantidad de Kilómetros y los caballos de fuerza y el peso total? Instrucciones: Revisa la siguiente información y resuelve lo que se indica. 1. Se tomó una muestra de 20 automóviles con relación al número de kilómetros por litro (Y), caballos de fuerza X1 y peso total en kg X2. Kilómetros por litro, Y Caballos de Fuerza, X1 Peso en kg X2
19. Maestros Online www.maestronline.com
19
67
1844 19 50 1998
17
62
1752 16 69 1980
16
66
1797 15 63 2199
15
90
2404 14 99 2611
13
63
3236 12 91 2606
11
94
2580 11 88 2507
11
124
2922 10 97 2434
9
114
3248 9 102 2812
8
114
3382 8 142 3197
7
153
4380 7 139 4036 a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Si un vehículo tiene 92 caballos de fuerza y un peso de 1750 kg ¿cuál será el número de kilómetros por litro que se esperaría? 3. En un experimento con conejos se hizo variar la cantidad de alimento administrado, y además se les añadió 1 g diario de colesterol en la dieta durante varias semanas. La cantidad de alimento X está expresado como gramos diarios por kg de peso al inicio del experimento, y el colesterol Y al final del experimento en mg. Los datos se presentan a continuación: Cantidad de alimento, g X Colesterol, mg Y
Cantidad de alimento, g X Colesterol, mg Y
10
313
33
677 15 370 35 151
20. Maestros Online www.maestronline.com
18
424
36
280 19 356 37 245
20
310
39
396 21 349 42 278
21
365
45
297 24 245 54 224
25
373
56
346 27 395 56 141
28
156
59
139 30 243 59 424
30
150
60
316 31 463 64 379 a. Estimen la ecuación de regresión. b. Calculen las predicciones para los siguientes valores de X0: 11, 12, 15, 25, 30, 35.5, 39, 45, 60, 70, 80, 90. c. Obtengan los intervalos de confianza al 99 para cada valor de Y para los diferentes valores de X0. Ejercicio 1 1. La energía eléctrica consumida Y cada mes por una planta química se considera relacionada con la temperatura ambiente promedio en grados Fahrenheit X1, número de días al mes X2, la pureza promedio del producto en porciento X3 y las toneladas obtenidas del producto X4. Se dispone de los datos históricos del año anterior, lo cuales se presentan enseguida: Y Temperatura en grados Fahrenheit X1 Días X2 Porcentaje de pureza X3 Toneladas de producto X4 240 25 24 91 100 236 31 21 90 95 290 45 24 88 110 274 60 25 87 88 301 65 25 91 94
21. Maestros Online www.maestronline.com
316 72 26 94 99 300 80 25 87 97 296 84 25 86 96 267 75 24 88 110 276 60 25 91 105 288 50 25 90 100 261 38 23 89 98
a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Interpreta los coeficientes de regresión en el contexto del problema. c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. d. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. e. Calcula e interpreta R2 en el contexto del problema. f. Calcula el error estándar de estimación. g. Pronostica la energía eléctrica consumida Y cuando la temperatura ambiente promedio X1 es de 30, el número de días al mes X2 es de 25 grados Fahrenheit, la pureza promedio del producto en porciento X3 es de 92 y las toneladas obtenidas del producto X4 es de 95. h. Calcula R2. i. Construye un intervalo de confianza para las pendientes de la población β1, β2 , β3 y β4. Ejercicio 2 2. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene un almacén centralizado para la distribución de los productos ordenados. La administración examina el proceso de distribución y está interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos de los últimos 24 meses, que indican los costos de distribución Y, las ventas X1 y el número de órdenes recibidas X2. Los resultados son los siguientes: Costo de Distribución (miles de dólares) Y Ventas (miles de dólares) X1 Órdenes X2
22. Maestros Online www.maestronline.com
52.95 386 4015 71.66 446 3806 85.58 512 5309 63.69 401 4262 72.81 457 4296 68.44 458 4097 52.46 301 3213 70.77 484 4809 82.03 517 5237 74.39 503 4732 70.84 535 4413 54.08 353 2921 62.98 372 3977 72.30 328 4428 58.99 408 3964 79.38 491 4582 94.44 527 5582 59.74 444 3450 90.50 623 5079 93.24 596 5735 69.33 463 4269 53.71 389 3708 89.18 547 5387 66.80 415 4161
Con base en los resultados obtenidos: a. Estima e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Interpreta los coeficientes de regresión en el contexto del problema.
23. Maestros Online www.maestronline.com
c. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. e. Calcula e interpreta R2 en el contexto del problema. f. Calcula el error estándar de estimación. g. Pronostica los costos de distribución mensuales promedio para el almacén cuando las ventas son de 400,000 dólares y el número de órdenes es de 4,500. h. Calcula R2ajustada. i. Construye un intervalo de confianza para las pendientes de la población (β1 y β2). Ejercicio 3 3. Una cadena de comida rápida ha experimentado un cambio importante en sus ventas como resultado de una campaña de publicidad exitosa. En consecuencia, la gerencia ahora necesita un nuevo modelo de regresión para sus ventas. Los siguientes datos se recolectaron en las doce semanas posteriores al inicio de la campaña de publicidad. Tiempo Semanas (X) Ventas (miles de dólares) (Y) 1 4,618 2 3,741 3 5,836 4 4,367 5 5,118 6 8,887 7 19,746 8 34,215 9 50,306 10 65,717 11 86,434 12 105,464 a. Usa Excel o Minitab para determinar la ecuación que mejor se ajuste a sus ventas. b. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema.
24. Maestros Online www.maestronline.com
c. ¿Estás satisfecho con el modelo como pronosticador de ventas Y? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05. d. Transforma la variable independiente X2, luego corre de nuevo el modelo con X y X2 como variables explicativas. ¿Es este modelo cuadrático un mejor ajuste para los datos? Explica. Realiza todas las etapas de una prueba de hipótesis con α = 0.05. e. Encuentra el coeficiente de determinación e interprétalo en el contexto del problema. Compáralo con el obtenido en el inciso b, ¿cuál modelo prefieres?, ¿por qué? Revisa la siguiente información nutricional de las ensaladas: 1. Enseguida se presentan las siguientes variables que se registraron en diferentes tipos de ensaladas. Las variables son: a. Y: Calorías b. X1: Grasa (g) c. X2:Carbohidratos (g) d. X3: Proteínas (g) Ensalada (porciones de 100 g) Grasa (g) X1 Carbohidratos (g) X2 Proteínas (g) X3 Calorías Y César 14.7 6.52 5.03 170 Atún 11.02 6.96 14.27 184 Atún con queso 14.72 6.87 14.44 217 Atún con huevo 12.93 6.96 13.71 196 Macarrones o pasta 10.63 22.98 3.76 202 Macarrones u otra pasta con pollo 13.34 15.00 10.11 221 Macarrones u otra pasta con atún 9.14 19.49 7.07 18.9 Ensalada de huevo 30.26 1.93 9.20 318 Ensalada de papas 8.20 11.17 2.68 143 Ensalada de papas con huevo 7.05 15.96 2.77 136 Ensalada de papas estilo alemán 1.24 16.66 2.52 88 Información obtenida de http://www.fatsecret.cl/.../ solo para fines educativos. 2. Estos datos se deben ingresar a Excel o Minitab y llevar a cabo lo siguiente: a. Estima e interpreta en el contexto del problema los coeficientes de la ecuación de regresión múltiple.
25. Maestros Online www.maestronline.com
b. Prueben la significancia de los coeficientes de regresión individuales. Realicen todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. c. Calculen e interpreten R2 en el contexto del problema. d. Calculen el error estándar de estimación. e. Estimen la cantidad promedio de calorías cuando el contenido de grasa es de 50 g, la cantidad de carbohidratos es de 10 g y la cantidad de proteínas es de 8 g. f. Calculen R2ajustada. g. Construyan un intervalo de confianza para las pendientes de la población (β1, β2 y β3). Ejercicio 1 1. Un negocio de ventas por catálogo de computadoras personales, software y hardware mantiene un almacén centralizado para la distribución de los productos ordenados. La administración examina el proceso de distribución y está interesada en examinar los factores que afectan los costos. En la actualidad, se cobra una pequeña cuota por manejo, independiente del monto de la orden. Se recolectaron datos de los últimos 24 meses que indican los costos de distribución Y, las ventas X1 y el número de órdenes recibidas X2. Los resultados son los siguientes: Costo de Distribución (miles de dólares) Y Ventas (miles de dólares) X1 Órdenes X2 52.95 386 4015 71.66 446 3806 85.58 512 5309 63.69 401 4262 72.81 457 4296 68.44 458 4097 52.46 301 3213 70.77 484 4809 82.03 517 5237 74.39 503 4732 70.84 535 4413 54.08 353 2921 62.98 372 3977
26. Maestros Online www.maestronline.com
72.30 328 4428 58.99 408 3964 79.38 491 4582 94.44 527 5582 59.74 444 3450 90.50 623 5079 93.24 596 5735 69.33 463 4269 53.71 389 3708 89.18 547 5387 66.80 415 4161
a. Realiza una regresión múltiple. b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. d. Determina el VIF para cada variable explicativa en el modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad? Ejercicio 2 2. Una organización de consumidores desea desarrollar un modelo para predecir el rendimiento de gasolina de automóvil, medido en cantidad de millas recorridas [millas por galón (mpg)] de acuerdo a los caballos de fuerza del motor y el peso del auto en kg. Se seleccionó una muestra de 50 modelos con los siguientes resultados: mpg Y Caballos de fuerza X1 Peso X2 43.1 48 1985 19.9 110 3365 19.2 105 3535 17.7 165 3445 18.1 139 3205
28. Maestros Online www.maestronline.com
44.6 67 1850 32.9 100 2615 38 67 1965 24.2 120 2930 38.1 60 1968 39.4 70 2070 25.4 116 2900 31.3 75 2542 34.1 68 1985 34 88 2395 31 82 2720 27.4 80 2670 22.3 88 2890 28 79 2625 17.6 85 3465 34.4 65 3465 20.6 105 3380
a. Realiza un modelo de regresión lineal múltiple. b. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. c. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. d. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad? Ejercicio 3 1. El director de operaciones de transmisión de una estación de televisión desea estudiar el aspecto de las “horas de espera” en la que los artistas gráficos sindicalizados se les paga por no realizar actividades. Las variables a considerar son: a. Horas de espera (Y): número total de horas por semana b. Personal presente total (X1): total semanal de días-persona los 7 días a la semana
29. Maestros Online www.maestronline.com
c. Horas remotas (X2): número total de horas trabajadas por empleados fuera de la planta central d. Los resultados para un periodo de 26 semanas son: Horas en espera Y Personal presente X1 Horas remotas X2 245 338 414 177 333 598 271 358 656 211 372 631 196 339 528 135 289 409 195 334 382 118 293 399 116 325 343 147 311 338 154 304 353 146 312 289 115 283 388 161 307 402 274 322 151 245 335 228 201 350 271 183 339 440 237 327 475 175 328 347 152 319 449 188 325 336 188 322 267 197 317 235
30. Maestros Online www.maestronline.com
261 315 164 232 331 270
e. Ajusta un modelo de regresión lineal múltiple. f. Prueba la significancia del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. g. Prueba la significancia de los coeficientes de regresión individuales; realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. h. Determina el factor de inflación de varianza (VIF) para cada variable explicativa en el modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad? Analiza y resuelve los siguientes ejercicios, sin olvidar incluir los procedimientos utilizados que te llevaron a la respuesta. Concluye con una reflexión sobre la utilización de la regresión y correlación en la vida cotidiana. ¿Qué tipo de problemas pudieras resolver con los conocimientos adquiridos en este módulo? 1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un centro comercial y la distancia desde la casa en donde tú vives? Entrevista a 20 compañeros y pregúntales el tiempo que tardan en llegar al centro comercial y la distancia a su casa. Después denomina a la variable tiempo en minutos como Y y a la distancia en km como X. a. Contesta lo siguiente: i. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor distancia es mayor el tiempo? ii. Calcula la recta de regresión de mínimos cuadrados. iii. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en llegar? Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01. iv. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis. Concluye en el contexto del problema. v. Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y 6 kilómetros de distancia. vi. Calcula el coeficiente de correlación. vii. Determina e interpreta el coeficiente de determinación en el contexto del problema. viii. Realiza un breve resumen de los hallazgos.
31. Maestros Online www.maestronline.com
2. ¿Existe relación entre el peso de una persona y la medida de su cintura en centímetros? Selecciona 10 personas del género masculino y 10 personas del género femenino y pídeles que te den su peso en kilogramos y la medida de su cintura en centímetros. Posteriormente denomina a la variable peso como Y y a la medida de la cintura como X. a. Contesta lo siguiente: i. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A mayor medida de la cintura es mayor el peso? ii. Calcula la recta de regresión de mínimos cuadrados. ¿Existe evidencia que indique que a mayor medida de la cintura es mayor el peso? Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba de hipótesis. Concluye en el contexto del problema. iii. Pronostica el peso si las medidas de cintura son de 66, 80 y 86 centímetros. iv. Calcula el coeficiente de correlación. v. Determina e interpreta el coeficiente de determinación en el contexto del problema. vi. Realiza un breve resumen de los hallazgos. 3. Busca información de 20 casas en venta en donde las variables son Y (metros de construcción) y X (metros de terreno), y realiza lo que se te indica: a. Contesta lo siguiente: i. Realiza el diagrama de dispersión y describe el comportamiento de ambas variables. ii. ¿Qué clase de relación crees que existe entre estas dos variables? iii. Calcula la recta de regresión de mínimos cuadrados. iv. Prueba la significancia de la recta de regresión con un nivel de significancia α = 0.01. v. ¿Es significativa esta regresión? Explica. Concluye en el contexto del problema. Realiza todas las etapas de una prueba de hipótesis. vi. Pronostica los metros de construcción cuando los metros de terreno son de 90, 100 y 150 metros. vii. Calcula el coeficiente de correlación. viii. Determina e interpreta el coeficiente de determinación en el contexto del problema. ix. Realiza un breve resumen de los hallazgos. 4. Revisa la siguiente información tomada de la sección de avisos de ocasión. Precio (miles de pesos) Metros de terreno X1 Metros de construcción X2 Número de recámaras X3
33. Maestros Online www.maestronline.com
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la ecuación de regresión lineal múltiple. b. Prueba la significancia global del modelo de regresión múltiple; realiza todas las etapas de una prueba de hipótesis. c. Pronostica el precio para los siguientes datos: Metros de terreno ( X1 ) Metros de construcción (X2 ) Número de recámaras ( X3 ) 180 390 4 200 250 3 230 200 4 250 180 2 100 120 3 d. Prueba la significancia de los coeficientes de regresión individuales. Realiza todas las etapas de una prueba de hipótesis para cada uno de los coeficientes. e. Calcula el error estándar de estimación. f. Construye un intervalo de confianza para las pendientes de la población (β1, β2 y β3). g. Calcula e interpreta R2 en el contexto del problema. h. Calcula R2ajustada. i. Determina el Factor de Inflación de Varianza (VIF) para cada variable explicativa en el modelo. ¿Existe alguna razón para sospechar que existe multicolinealidad? j. Finalmente prepara un documento presentando un resumen de tus hallazgos.