Este documento presenta el modelo de regresión lineal múltiple para asociar una variable dependiente (Y) con múltiples variables independientes (X1, X2, X3, etc). Explica cómo se estiman los parámetros del modelo usando el método de mínimos cuadrados y provee un ejemplo de aplicación para predecir la resistencia a la tracción de alambres usando sus alturas y longitudes.
1) El documento habla sobre pruebas de hipótesis, definidas como procedimientos basados en evidencia muestral y teoría de probabilidad para determinar si una hipótesis planteada es razonable.
2) Se realizan pruebas de hipótesis mediante un proceso sistemático de cinco pasos: plantear la hipótesis nula y alternativa, seleccionar el nivel de significancia, identificar el estadístico de prueba, formar la regla de decisión, y tomar una muestra para decidir si se re
El Teorema Central del Límite establece que la suma de una gran cantidad de variables aleatorias independientes con la misma distribución se aproxima a una distribución normal, independientemente de la distribución original de las variables individuales. Este teorema se aplica a problemas que involucran promedios y probabilidades en muestras grandes.
Equipo 3 "Clasificación de los diseños experimentales"RosarioFL
Un diseño experimental es un plan para estudiar las relaciones entre variables mediante la manipulación de al menos una variable independiente y el control aleatorio de sujetos en grupos experimentales. Los componentes clave son la comparación, manipulación y control de factores internos y externos. Existen diferentes tipos de diseños clasificados según el número de condiciones, metodología y variables estudiadas.
Este documento trata sobre estadística descriptiva e inferencial. La estadística descriptiva se encarga de recopilar, organizar y presentar datos muestrales para predecir el comportamiento de una población. La inferencia estadística estima valores de la población a partir de valores muestrales y cubre temas como medias, distribuciones muestrales, estimación puntual e intervalos de confianza, y pruebas de hipótesis.
Este documento describe tres pruebas estadísticas para analizar datos categóricos: la prueba de bondad de ajuste, la prueba de independencia y la prueba de homogeneidad. Explica cómo usar la prueba chi-cuadrado de bondad de ajuste para determinar si las proporciones observadas en una muestra difieren de las proporciones esperadas en la población total. También incluye un ejemplo numérico para ilustrar el cálculo e interpretación de la prueba chi-cuadrado de bondad de ajuste
Uso de la tabla de distribucion de probabilidad normal estandarAraceli Gomez
Este documento explica cómo usar una tabla de distribución de probabilidad normal estándar. La tabla proporciona áreas bajo la curva de una distribución normal con media 0 y desviación estándar 1 para valores de Z positivos. Para encontrar el área bajo la curva para un valor particular de Z, se busca el valor de Z en la tabla y se lee el área en la columna correspondiente a los decimales de Z. La tabla también se puede usar para encontrar niveles de confianza como 95%, 98% y 99% dividiendo el valor de P entre 2.
El documento presenta 13 problemas de probabilidad que involucran la distribución hipergeométrica. Cada problema proporciona datos como el tamaño total de la población (N), la cantidad de elementos con una característica deseada (m), el tamaño de la muestra extraída (n) y la cantidad de elementos en la muestra con dicha característica (k). Luego se calcula la probabilidad de k usando la fórmula de la distribución hipergeométrica y se interpretan los resultados.
1) El documento habla sobre pruebas de hipótesis, definidas como procedimientos basados en evidencia muestral y teoría de probabilidad para determinar si una hipótesis planteada es razonable.
2) Se realizan pruebas de hipótesis mediante un proceso sistemático de cinco pasos: plantear la hipótesis nula y alternativa, seleccionar el nivel de significancia, identificar el estadístico de prueba, formar la regla de decisión, y tomar una muestra para decidir si se re
El Teorema Central del Límite establece que la suma de una gran cantidad de variables aleatorias independientes con la misma distribución se aproxima a una distribución normal, independientemente de la distribución original de las variables individuales. Este teorema se aplica a problemas que involucran promedios y probabilidades en muestras grandes.
Equipo 3 "Clasificación de los diseños experimentales"RosarioFL
Un diseño experimental es un plan para estudiar las relaciones entre variables mediante la manipulación de al menos una variable independiente y el control aleatorio de sujetos en grupos experimentales. Los componentes clave son la comparación, manipulación y control de factores internos y externos. Existen diferentes tipos de diseños clasificados según el número de condiciones, metodología y variables estudiadas.
Este documento trata sobre estadística descriptiva e inferencial. La estadística descriptiva se encarga de recopilar, organizar y presentar datos muestrales para predecir el comportamiento de una población. La inferencia estadística estima valores de la población a partir de valores muestrales y cubre temas como medias, distribuciones muestrales, estimación puntual e intervalos de confianza, y pruebas de hipótesis.
Este documento describe tres pruebas estadísticas para analizar datos categóricos: la prueba de bondad de ajuste, la prueba de independencia y la prueba de homogeneidad. Explica cómo usar la prueba chi-cuadrado de bondad de ajuste para determinar si las proporciones observadas en una muestra difieren de las proporciones esperadas en la población total. También incluye un ejemplo numérico para ilustrar el cálculo e interpretación de la prueba chi-cuadrado de bondad de ajuste
Uso de la tabla de distribucion de probabilidad normal estandarAraceli Gomez
Este documento explica cómo usar una tabla de distribución de probabilidad normal estándar. La tabla proporciona áreas bajo la curva de una distribución normal con media 0 y desviación estándar 1 para valores de Z positivos. Para encontrar el área bajo la curva para un valor particular de Z, se busca el valor de Z en la tabla y se lee el área en la columna correspondiente a los decimales de Z. La tabla también se puede usar para encontrar niveles de confianza como 95%, 98% y 99% dividiendo el valor de P entre 2.
El documento presenta 13 problemas de probabilidad que involucran la distribución hipergeométrica. Cada problema proporciona datos como el tamaño total de la población (N), la cantidad de elementos con una característica deseada (m), el tamaño de la muestra extraída (n) y la cantidad de elementos en la muestra con dicha característica (k). Luego se calcula la probabilidad de k usando la fórmula de la distribución hipergeométrica y se interpretan los resultados.
La distribución normal tiene dos colas, y la variable Z se usa para calcular la probabilidad de que los datos estén fuera del intervalo definido por la media (μ) más o menos z veces la desviación estándar (σ).
Tarea 16 de probabilidad y estadistica con respuestasIPN
Este documento presenta 10 problemas de estadística descriptiva que involucran estimación de parámetros poblacionales mediante intervalos de confianza y predicción para una o dos muestras. Los problemas abarcan temas como vida promedio de ratones, profundidad de módulos de marcapasos, kilómetros recorridos por automóviles, contenido de azúcar en cereales y dureza de cabezas de alfileres. Se pide calcular intervalos de confianza y predicción utilizando desviaciones estándares muestrales y sup
Este documento presenta una introducción a la econometría. Explica que la econometría utiliza la teoría económica, las matemáticas y la estadística para estudiar fenómenos económicos mediante la estimación de modelos econométricos. Describe las fases del método econométrico, incluida la especificación del modelo, la obtención de datos, la estimación de parámetros y la prueba de hipótesis. También introduce conceptos como los modelos econométricos, la regresión múltiple y los
Este documento describe el análisis de regresión múltiple, incluyendo la ecuación de regresión múltiple y el error estándar múltiple de estimación. También cubre el coeficiente múltiple de determinación, las hipótesis de normalidad, homocedasticidad e independencia de errores, y cómo detectar cuando estas hipótesis no se cumplen. Finalmente, explica cómo predecir valores utilizando un modelo de regresión múltiple.
El documento analiza la relación entre variables a través de regresión y correlación. Explica que la regresión predice una variable en función de otras y que la correlación mide la intensidad de la relación. Define relación funcional como aquella expresada por una función matemática, a diferencia de la estadística donde los puntos no caen exactamente sobre la curva.
Este documento presenta un tema sobre regresión lineal, prueba de hipótesis y T de student. El objetivo es aplicar estos conceptos estadísticos para resolver problemas relacionados con el comercio exterior. Se incluyen ejemplos y ejercicios para calcular la ecuación de regresión lineal y probar hipótesis sobre los coeficientes y predicciones de la población basados en datos de muestras.
Problemas resueltos de distribución muestralasrodriguez75
Este documento presenta la resolución de 5 preguntas sobre distribución muestral. La primera pregunta calcula la probabilidad de que la media de un muestra de 100 recién nacidos sea mayor a 3030 gramos. La segunda pregunta encuentra la probabilidad de que la vida promedio de una muestra de 16 focos sea menor a 775 horas. La tercera pregunta determina el número de medias muestrales que caen dentro de dos rangos dados para 200 muestras de 25 estudiantes.
Este documento presenta varios problemas estadísticos que involucran el cálculo de intervalos de confianza para la media de una población basados en muestras. Los problemas cubren temas como la duración de bombillas, kilómetros recorridos por automóviles, diámetros de piezas metálicas y pesos de tallos de árboles en un estudio de nitrógeno. En cada caso, se proporcionan los datos de la muestra como el tamaño de muestra, la media muestral, la desviación estándar y el nivel
Este documento explica cómo construir distribuciones muestrales de medias para una población, incluyendo los pasos para: 1) determinar el número de muestras posibles, 2) listar todas las muestras, 3) calcular la media de cada muestra, 4) agrupar las medias y calcular la media de medias, 5) calcular el error típico de la muestra y la población. Proporciona ejemplos para muestras con y sin reposición de tamaños 2 y 3 elementos seleccionados de poblaciones dadas.
Este documento presenta 5 ejemplos que ilustran el uso de la distribución t de Student y la distribución F de Snedecor. Los ejemplos calculan probabilidades y percentiles asociados a estas distribuciones estadísticas. Se proporcionan detalles sobre cómo buscar valores en las tablas de estas distribuciones dadas las entradas requeridas como grados de libertad y probabilidades acumuladas.
Este documento presenta 10 ejercicios resueltos sobre estadística inferencial que incluyen cálculos de probabilidades, intervalos de confianza y contrastes de hipótesis. Los ejercicios cubren temas como distribuciones normales, distribución t de Student, intervalos de confianza para proporciones y varianzas, y contrastan una proporción muestral con una poblacional dada.
Este documento describe las distribuciones binomial y Poisson. Explica que la distribución binomial modela experimentos con sucesos discretos independientes con probabilidad constante, mientras que la distribución de Poisson se aplica a eventos aleatorios e impredecibles. Proporciona ejemplos y fórmulas para calcular probabilidades usando ambas distribuciones.
Tarea 17 de probabilidad y estadistica con respuestasIPN
1. Se calculó un intervalo de confianza del 94% para la diferencia entre las medias de dos poblaciones normales a partir de muestras.
2. Se calculó un intervalo de confianza del 98% para la diferencia entre las medias de rendimiento de un tratamiento y sin él, indicando que el tratamiento reduce posiblemente la cantidad de metal eliminado.
3. Se calculó un intervalo de confianza del 99% para la diferencia entre las calificaciones promedio de dos cursos, asumiendo distribuciones normales con varianzas iguales.
Este documento presenta diferentes formas funcionales y modelos de regresión que incluyen variables cualitativas. Explica formas como lineal, logarítmica, cuadrática e interacciones, así como el uso de variables dummy para capturar efectos de variables binarias. Finalmente, muestra cómo estas técnicas permiten analizar políticas públicas y comparar grupos.
Este documento presenta información sobre diseños experimentales y análisis de varianza. Explica el diseño completamente al azar con un solo criterio de clasificación, los grados de libertad en un ANOVA, y cómo calcular y verificar la significancia de las diferencias entre tratamientos. También discute los supuestos del modelo de ANOVA y ejemplos de aplicación en experimentos sobre el efecto del pH y la temperatura en procesos químicos.
El documento trata sobre experimentación. Explica que la experimentación es la aplicación del método científico para generar conocimiento sobre un sistema o proceso mediante el uso de técnicas activas que manipulan el proceso para obtener información relevante. Además, describe los diferentes tipos de diseños experimentales que existen dependiendo del objetivo del experimento.
Este documento presenta la planificación de un curso de optimización que consta de 5 semanas. Cada semana se cubrirán aproximadamente 2 temas. Habrá un parcial a mediados del curso y un proyecto final al final del curso. El documento también incluye conceptos teóricos básicos de optimización como funciones objetivo, restricciones y regiones factibles.
El resumen analiza la relación entre el tiempo de extracción y el rendimiento de un proceso. Se observa una correlación positiva donde el rendimiento aumenta con el tiempo. Se ajusta un modelo de regresión lineal que es estadísticamente significativo pero explica solo el 45% de la variación. Se estima que a 25 minutos el rendimiento estaría entre 77.65% y 98.004%.
Descripción de los estadísticos de prueba para diferentes casos de hipótesis en una y dos poblaciones. Para casos de varianzas conocidas y casos de varianzas desconocidas. Para casos de muestra dependientes y muestras independientes.
Diseño y analisis de experimentos montgomery ocrJair Muñoz
Diseño y analisis experimentos se define como un conjunto de técnicas activas que manipulan un proceso para inducirlo a proporcionar la información que se requiere para mejorarlo mediante los cambios en sus variables y su interacción o secuencia de ejecución
Este documento presenta el modelo de regresión lineal múltiple, incluyendo su motivación, asociación entre variables, caso particular y general del modelo, estimación de parámetros a través del método de mínimos cuadrados ordinarios, y un ejemplo de aplicación para predecir la resistencia a tracción de alambre usando tres variables independientes.
Este documento presenta los modelos de regresión para analizar la relación entre variables. Introduce los diagramas de dispersión y el coeficiente de correlación para estudiar datos bidimensionales. Explica el método de mínimos cuadrados para estimar los parámetros de la regresión lineal simple y múltiple. Finalmente, aborda cómo transformar modelos no lineales como el exponencial y potencial para aplicar la regresión lineal.
La distribución normal tiene dos colas, y la variable Z se usa para calcular la probabilidad de que los datos estén fuera del intervalo definido por la media (μ) más o menos z veces la desviación estándar (σ).
Tarea 16 de probabilidad y estadistica con respuestasIPN
Este documento presenta 10 problemas de estadística descriptiva que involucran estimación de parámetros poblacionales mediante intervalos de confianza y predicción para una o dos muestras. Los problemas abarcan temas como vida promedio de ratones, profundidad de módulos de marcapasos, kilómetros recorridos por automóviles, contenido de azúcar en cereales y dureza de cabezas de alfileres. Se pide calcular intervalos de confianza y predicción utilizando desviaciones estándares muestrales y sup
Este documento presenta una introducción a la econometría. Explica que la econometría utiliza la teoría económica, las matemáticas y la estadística para estudiar fenómenos económicos mediante la estimación de modelos econométricos. Describe las fases del método econométrico, incluida la especificación del modelo, la obtención de datos, la estimación de parámetros y la prueba de hipótesis. También introduce conceptos como los modelos econométricos, la regresión múltiple y los
Este documento describe el análisis de regresión múltiple, incluyendo la ecuación de regresión múltiple y el error estándar múltiple de estimación. También cubre el coeficiente múltiple de determinación, las hipótesis de normalidad, homocedasticidad e independencia de errores, y cómo detectar cuando estas hipótesis no se cumplen. Finalmente, explica cómo predecir valores utilizando un modelo de regresión múltiple.
El documento analiza la relación entre variables a través de regresión y correlación. Explica que la regresión predice una variable en función de otras y que la correlación mide la intensidad de la relación. Define relación funcional como aquella expresada por una función matemática, a diferencia de la estadística donde los puntos no caen exactamente sobre la curva.
Este documento presenta un tema sobre regresión lineal, prueba de hipótesis y T de student. El objetivo es aplicar estos conceptos estadísticos para resolver problemas relacionados con el comercio exterior. Se incluyen ejemplos y ejercicios para calcular la ecuación de regresión lineal y probar hipótesis sobre los coeficientes y predicciones de la población basados en datos de muestras.
Problemas resueltos de distribución muestralasrodriguez75
Este documento presenta la resolución de 5 preguntas sobre distribución muestral. La primera pregunta calcula la probabilidad de que la media de un muestra de 100 recién nacidos sea mayor a 3030 gramos. La segunda pregunta encuentra la probabilidad de que la vida promedio de una muestra de 16 focos sea menor a 775 horas. La tercera pregunta determina el número de medias muestrales que caen dentro de dos rangos dados para 200 muestras de 25 estudiantes.
Este documento presenta varios problemas estadísticos que involucran el cálculo de intervalos de confianza para la media de una población basados en muestras. Los problemas cubren temas como la duración de bombillas, kilómetros recorridos por automóviles, diámetros de piezas metálicas y pesos de tallos de árboles en un estudio de nitrógeno. En cada caso, se proporcionan los datos de la muestra como el tamaño de muestra, la media muestral, la desviación estándar y el nivel
Este documento explica cómo construir distribuciones muestrales de medias para una población, incluyendo los pasos para: 1) determinar el número de muestras posibles, 2) listar todas las muestras, 3) calcular la media de cada muestra, 4) agrupar las medias y calcular la media de medias, 5) calcular el error típico de la muestra y la población. Proporciona ejemplos para muestras con y sin reposición de tamaños 2 y 3 elementos seleccionados de poblaciones dadas.
Este documento presenta 5 ejemplos que ilustran el uso de la distribución t de Student y la distribución F de Snedecor. Los ejemplos calculan probabilidades y percentiles asociados a estas distribuciones estadísticas. Se proporcionan detalles sobre cómo buscar valores en las tablas de estas distribuciones dadas las entradas requeridas como grados de libertad y probabilidades acumuladas.
Este documento presenta 10 ejercicios resueltos sobre estadística inferencial que incluyen cálculos de probabilidades, intervalos de confianza y contrastes de hipótesis. Los ejercicios cubren temas como distribuciones normales, distribución t de Student, intervalos de confianza para proporciones y varianzas, y contrastan una proporción muestral con una poblacional dada.
Este documento describe las distribuciones binomial y Poisson. Explica que la distribución binomial modela experimentos con sucesos discretos independientes con probabilidad constante, mientras que la distribución de Poisson se aplica a eventos aleatorios e impredecibles. Proporciona ejemplos y fórmulas para calcular probabilidades usando ambas distribuciones.
Tarea 17 de probabilidad y estadistica con respuestasIPN
1. Se calculó un intervalo de confianza del 94% para la diferencia entre las medias de dos poblaciones normales a partir de muestras.
2. Se calculó un intervalo de confianza del 98% para la diferencia entre las medias de rendimiento de un tratamiento y sin él, indicando que el tratamiento reduce posiblemente la cantidad de metal eliminado.
3. Se calculó un intervalo de confianza del 99% para la diferencia entre las calificaciones promedio de dos cursos, asumiendo distribuciones normales con varianzas iguales.
Este documento presenta diferentes formas funcionales y modelos de regresión que incluyen variables cualitativas. Explica formas como lineal, logarítmica, cuadrática e interacciones, así como el uso de variables dummy para capturar efectos de variables binarias. Finalmente, muestra cómo estas técnicas permiten analizar políticas públicas y comparar grupos.
Este documento presenta información sobre diseños experimentales y análisis de varianza. Explica el diseño completamente al azar con un solo criterio de clasificación, los grados de libertad en un ANOVA, y cómo calcular y verificar la significancia de las diferencias entre tratamientos. También discute los supuestos del modelo de ANOVA y ejemplos de aplicación en experimentos sobre el efecto del pH y la temperatura en procesos químicos.
El documento trata sobre experimentación. Explica que la experimentación es la aplicación del método científico para generar conocimiento sobre un sistema o proceso mediante el uso de técnicas activas que manipulan el proceso para obtener información relevante. Además, describe los diferentes tipos de diseños experimentales que existen dependiendo del objetivo del experimento.
Este documento presenta la planificación de un curso de optimización que consta de 5 semanas. Cada semana se cubrirán aproximadamente 2 temas. Habrá un parcial a mediados del curso y un proyecto final al final del curso. El documento también incluye conceptos teóricos básicos de optimización como funciones objetivo, restricciones y regiones factibles.
El resumen analiza la relación entre el tiempo de extracción y el rendimiento de un proceso. Se observa una correlación positiva donde el rendimiento aumenta con el tiempo. Se ajusta un modelo de regresión lineal que es estadísticamente significativo pero explica solo el 45% de la variación. Se estima que a 25 minutos el rendimiento estaría entre 77.65% y 98.004%.
Descripción de los estadísticos de prueba para diferentes casos de hipótesis en una y dos poblaciones. Para casos de varianzas conocidas y casos de varianzas desconocidas. Para casos de muestra dependientes y muestras independientes.
Diseño y analisis de experimentos montgomery ocrJair Muñoz
Diseño y analisis experimentos se define como un conjunto de técnicas activas que manipulan un proceso para inducirlo a proporcionar la información que se requiere para mejorarlo mediante los cambios en sus variables y su interacción o secuencia de ejecución
Este documento presenta el modelo de regresión lineal múltiple, incluyendo su motivación, asociación entre variables, caso particular y general del modelo, estimación de parámetros a través del método de mínimos cuadrados ordinarios, y un ejemplo de aplicación para predecir la resistencia a tracción de alambre usando tres variables independientes.
Este documento presenta los modelos de regresión para analizar la relación entre variables. Introduce los diagramas de dispersión y el coeficiente de correlación para estudiar datos bidimensionales. Explica el método de mínimos cuadrados para estimar los parámetros de la regresión lineal simple y múltiple. Finalmente, aborda cómo transformar modelos no lineales como el exponencial y potencial para aplicar la regresión lineal.
Este documento resume los principales problemas que pueden violar los supuestos del modelo de regresión clásico, como la multicolinealidad, errores de especificación, heteroscedasticidad y autocorrelación. Explica cómo la multicolinealidad ocurre cuando las variables explicativas están correlacionadas y cómo esto puede inflar la varianza de los parámetros estimados. También cubre posibles soluciones como agregar observaciones, restringir parámetros o eliminar variables.
Modelos de regresión lineales y no lineales au aplicación en problemas de ing...Néstor Valles Villarreal
Este documento describe la aplicación de modelos de regresión lineales y no lineales para resolver problemas de ingeniería. Se presenta un ejemplo de regresión lineal utilizando datos sobre deformación y dureza del acero. Luego, se aplican modelos cuadráticos, potenciales, exponenciales y logarítmicos a los mismos datos y se comparan los resultados. El modelo exponencial proporciona el mejor ajuste.
Este documento describe la aplicación de modelos de regresión lineales y no lineales para resolver problemas de ingeniería. Se presenta un ejemplo de regresión lineal utilizando datos sobre deformación y dureza del acero. Luego, se aplican modelos cuadráticos, potenciales, exponenciales y logarítmicos a los mismos datos y se comparan los resultados. El modelo exponencial proporciona el mejor ajuste.
Previous concepts for linear correlation, linear regression, and generalized linear model. Universidad Nacional de Colombia, Sede Bogotá. Octubre 2020.
Formas funcionales de los modelos de regresiónchrisrgt1999
Este documento describe diferentes modelos de regresión y sus aplicaciones. Explica los modelos de regresión lineal, los modelos de regresión lineal en logaritmos que miden elasticidades, los modelos de regresión múltiple como el modelo Cobb-Douglass, y los modelos de regresión polinomial. También discute cómo elegir la mejor forma funcional para los datos y variables en cuestión.
Este documento presenta un resumen de un capítulo sobre modelos de vectores autorregresivos (VAR). Explica que los modelos VAR permiten modelar las relaciones dinámicas entre múltiples variables económicas de manera flexible y sin necesidad de especificar relaciones causales. También describe cómo los modelos VAR pueden usarse para realizar pruebas de causalidad entre variables y análisis de descomposición de varianzas y respuestas a impulsos.
Este documento trata sobre métodos numéricos para resolver ecuaciones no lineales y sistemas de ecuaciones no lineales. Presenta criterios de existencia y unicidad como el teorema del valor medio y la teoría del punto fijo. Describe métodos para encontrar raíces como bisección, punto fijo, Newton y secante para problemas unidimensionales y multidimensionales. Finalmente, menciona software disponible para resolver ecuaciones no lineales y raíces de polinomios.
Este documento presenta una introducción al curso de actualización en econometría básica para docentes de la Facultad de Economía y Contabilidad. Define la econometría como la aplicación de herramientas estadísticas y matemáticas al análisis de fenómenos económicos. Explica la metodología de la econometría, incluyendo la formulación de teorías, modelos y hipótesis; la obtención y análisis de datos; la especificación de modelos econométricos; y la verificación de
Este documento resume los modelos Logit y Probit. Explica que estos modelos se usan cuando la variable dependiente es binaria para evitar los problemas de usar un modelo de probabilidad lineal con MCO. El modelo Logit usa una función logística acumulativa mientras que el Probit usa una función normal acumulativa. Ambos modelos estiman los parámetros mediante máxima verosimilitud para manejar los errores heterocedásticos y no normales. Finalmente, indica que estos modelos producen predicciones similares aunque los coeficientes
Similar a Modelo de regresión lineal múltiple (11)
Ofrecemos herramientas y metodologías para que las personas con ideas de negocio desarrollen un prototipo que pueda ser probado en un entorno real.
Cada miembro puede crear su perfil de acuerdo a sus intereses, habilidades y así montar sus proyectos de ideas de negocio, para recibir mentorías .
200. Efemerides junio para trabajar en periodico mural
Modelo de regresión lineal múltiple
1. Motivación
Asociación entre variables
MODELO DE REGRESIÓN LINEAL MÚLTIPLE
Andrey Mauricio Montoya Jurado
ASOCIACIÓN ENTRE VARIABLES
Estadística y Probabilidad
Universidad del Quindío
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
2. Motivación
Asociación entre variables
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
3. Motivación
Asociación entre variables
Regresión
Ejemplo de Motivación
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
4. Motivación
Asociación entre variables
Regresión
Ejemplo de Motivación
Regresión
La historia dice que Sir Francis Galton a finales del siglo XIX
estaba interesado en predecir la altura de los hijos a partir de la
altura de los padres.
Despues de reunir las alturas de padres e hijos, verificó que
padres altos tenían hijos altos y padres bajos tenían hijos bajos.
Esto lo hizo pensar que existía una regresión entre las alturas
de padres e hijos, desde entonces se usa el término Regresión
para asociar variables.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
5. Motivación
Asociación entre variables
Regresión
Ejemplo de Motivación
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
6. Motivación
Asociación entre variables
Regresión
Ejemplo de Motivación
Motivación
Una de las características del alambre para amarres es su resistencia
a tracción (Y ). Se desea estimar la resistencia a la tracción (Y ) con
la información que proporcionan las variables: altura del amarre (X1),
altura del poste (X2) y longitud del alambre(X3).
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
7. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
8. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Modelo Poblacional del MRLM
Se tiene el interés de relacionar la variable Y con las variables expli-
cativas X1 y X2 utilizando la regresión lineal, se trataría de analizar
un modelo de la forma
Y = b0 +b1X1 +b2X2 +e
Si se dispone de un conjunto de n observaciones (x1i , x2i , yi ), i =
1,...,n
X1 X2 Y
x11 x21 y1
x12 x22 y2
x13 x22 y3
...
...
...
x1n x2n yn
Cuadro : Esquema de una Matriz de Datos con 3 variables
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
9. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Modelo Muestral del MRLM
El sistema de ecuaciones
yi = b0 +b1x1i +b2x2i +ei , i = 1,...,n
Supuestos del modelo:
ei ∼ N 0, σ2 .
ei son no correlacionados.
X1 y X2 son no correlacionadas.
En notación matricial queda expresado en la forma
Y = Xβ +e
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
10. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Modelo de Regresión Lineal Múltiple (MRLM)
donde Y =
y1
y2
...
yn
, X =
1 x11 x21
1 x12 x22
...
...
...
1 x1n x2n
,
β =
b0
b1
b2
, e =
e1
e2
...
en
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
11. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Estimación del modelo
Dado el modelo muestral
yi = b0 +b1x1i +b2x2i +ei , i = 1,...,n
¿Cómo estimar los parámetros b0, b1 b2?
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
12. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Método de mínimos cuadrados
La ecuación Y = Xβ +e puede también expresarse como
e = Y −Xβ
por lo tanto
e e =
n
∑
i=1
e2
i = (Y −Xβ) (Y −Xβ)
= Y Y −2(Xβ) Y +(Xβ) (Xβ)
= Y Y −2β X Y +β X Xβ
es una ecuación que expresa la suma de los cuadrados de los errores
en términos del vector de parámetros β.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
13. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Método de mínimos cuadrados
El mínimo de esta función se obtiene derivando e e respecto a β e
igualando a cero, esto es
∂e e
∂β
= −2X Y +2X Xβ = 0
lo que conduce finalmente a la ecuación
X Xβ = X Y (1)
y el estimador de mínimos cuadrados de β esta dador por :
β = X X
−1
X Y (2)
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
14. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
15. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Caso General del MRLM
Cuando se desea relacionar p variables independientes X1,X2, X3, ,..., Xp
con una variable dependiente Y , el modelo de regresión toma la for-
ma
Y = b0 +b1X1 +b2X2 +···+bpXp +e
Si se dispone de n observaciones (x1i , ,x2i ,,..., ,xpi , yi ), i = 1,...,n
yi = b0 +b1x1i +b2x2i +···+bpxpi +ei , i = 1,...,n
Supuestos del modelo:
ei ∼ N 0, σ2 .
ei son no correlacionados.
X s sean no correlacionados entre ellas.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
16. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Caso General del MRLM
En notación matricial el modelo queda expresado en la forma Y =
Xβ +e
donde Y =
y1
y2
...
yn
, X =
1 x11 x21 ··· xp1
1 x12 x22 ··· xp2
...
...
...
...
...
1 x1n x2n ··· xpn
,
β =
b0
b1
...
bp
, e =
e1
e2
...
en
de (2) tenemos:
β = X X
−1
X Y
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
17. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Caso General del MRLM
Con las matrices X X y X Y de la forma:
X X =
n ∑x1i ∑x2i ∑x3i ··· ∑xpi
∑x1i ∑x2
1i ∑x1i x2i ∑x1i x3i ··· ∑x1i xpi
∑x2i ∑x2i x1i ∑x2
2i ∑x2i x3i ··· ∑x2i xpi
...
...
...
...
...
...
∑xpi ∑xpi x1i ∑xpi x2i ∑xpi x3i ··· ∑x2
pi
X Y =
∑yi
∑x1i yi
∑x2i yi
...
∑xpi yi
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
18. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Contenido
1 Motivación
Regresión
Ejemplo de Motivación
2 Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
19. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Problema de Aplicación del MRLM
Una de las características del alambre para amarres es su resistencia
a tracción (Y ). En la tabla, está la información sobre esta variable,
altura del amarre (X1), altura del poste (X2) y longitud (X3) para
19 alambres.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
20. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Datos de las variables de alambre para amarres.
Y X1 X2 X3
8,0 19,6 29,6 94,9
8,3 19,8 32,4 89,7
8,5 19,6 31 96,2
8,8 19,4 32,4 95,6
9,0 18,6 28,6 86,5
9,3 18,8 30,6 84,5
9,3 20,4 32,4 88,8
9,5 19,0 32,6 85,7
9,8 20,8 32,2 93,6
10,0 19,9 31,8 86,0
10,3 18,0 32,6 87,1
10,5 20,6 33,4 93,1
10,8 20,2 31,8 83,4
11,0 20,2 32,4 94,5
11,3 19,2 31,4 83,4
11,5 17,0 33,2 85,2
11,8 19,8 35,4 84,1
12,3 18,8 34 86,9
12,5 18,06 34,2 83,0
Cuadro : Datos de las variables de Alambre para amarres.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
21. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Forma matricial del problema
La variable Y se puede relacionar con las variables X1, X2, y X3 a
través del modelo de regresión lineal múltiple
Y = b0 +b1X1 +b2X2 +b3X3 +e
En forma matricial
Y =
8
8,3
8,5
...
12,5
X =
1 19,6 29,6 94,9
1 19,8 32,4 89,7
...
...
...
...
1 18,6 34,2 83,0
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
22. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Forma matricial del problema
Utilizando R (lenguaje y entorno de programación para análisis es-
tadístico y gráfico) tenemos:
X X =
19 368,3 612 1682,2
368,3 7155,45 1186,22 32643,48
612 11863,22 19757,92 54154,88
1682,2 32643,48 54154,88 149323,1
X Y =
192,5
3725,66
6227,26
16980,18
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
23. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Forma matricial del problema
(X X)−1
=
61,834 −0,681 −0,867 −0,233
−0,681 0,078 −0,005 −0,007
−0,867 −0,005 0,024 0,002
−0,233 −0,007 0,002 0,003
finalmente
β =
b0
b1
b2
b3
= (X X)−1
X Y =
5,6458
−0,1131
0,5187
−0,1133
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
24. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Modelo de regresión que relaciona las variables
Así el modelo que relaciona las variables: resistencia a la tracción
(Y ), altura del amarre (X1), altura del poste (X2), y longitud del
alambre (X3), para los datos de la tabla es
Y = 5,6458−0,1131X1 +0,5187X2 −0,1133X3 (3)
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
25. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Evaluación del modelo
Debemos probar la significancia de los parámetros estimados
H0 : bi = 0 i = 0,1,2,3
H1 : bi = 0
Si p−valor > 0,05
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
26. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Confirmación de los resultados utilizando STATGRAPHICS
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
27. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Mejor ajuste utilizando STATGRAPHICS
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
28. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Diagramas de dispersión para las variables explicativas
Para visualizar la no colinealidad entre las variables regresoras X1, X2
y X3 aparecen en la figura los diagramas de dispersión entre diferentes
pares de variables.
Figura : Diagramas de dispersión para las variables explicativas X1, X2 y X3.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
29. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
Matriz de correlación
La matriz de correlación entre las variables explicativas X1, X2 y X3
es
Corr(Xi ,Xj ) =
X1
X2
X3
X1 X2 X3
1,0000 0,0031 0,4463
0,0031 1,0000 −0,2248
0,4463 −0,2248 1,0000
y como puede observarse no existe correlación lineal alta entre ningún
par de variables, confirmándose de nuevo la no colinelidad.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
30. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
La calidad del Modelo de Regresión Multiple
La evaluación del Modelo de Regresión Multiple se hace, a travez de
R2
=
ˆβ X Y −n(¯y)2
∑n
i=1 Y 2
i −n(¯y)2
Utilizando el paquete R tenemos
¯y = 10,13
n
∑
i=1
y2
i = 1983,55 ˆβ X Y = 1971,9
Finalmente se tiene que el coeficiente de determinación es
R2
=
1971,9−19(10,13)2
1983,55−19(10,13)2
= 0,65
lo cual significa que las tres variables independientes consideradas en
este ejemplo explican el 65% de la variación de la resistencia a la
tracción.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
31. Motivación
Asociación entre variables
Caso particular del modelo de Regresión Lineal Múltiple
Caso general del Modelo de Regresión Lineal Múltiple
Problema de Aplicación del MRLM
MUCHAS GRACIAS
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple
32. Bibliografia Lecturas Complementarias
Lecturas Complementarias I
Hurtado, L. H., García, M. D., Galvis, D. M., & Salcedo, G. E.
(2006). Estadística Básica. Armenia.
Mendenhall, W., Beaver, R., & Beaver, B. (2003). Introducción
a la probabilidad y estadística. Mexico: Thomson Learning.
Ross, S. (2000). Probabilidad y Estadística para Ingenieros.
Mexico: McGRAW-HILL.
Draper, N. R., & Smith, H. (1966). Applied Regression
Analysis. New York: John Wiley & Sons, Inc.
Andrey Mauricio Montoya Jurado Regresión Lineal Múltiple