Este documento trata sobre el tema de la regresión lineal simple. Explica el modelo de regresión lineal, incluyendo su estructura, hipótesis y estimación de parámetros. También cubre el contraste del modelo, análisis de residuos, predicción y diagnóstico del modelo. Proporciona ejemplos de cómo se puede utilizar la regresión lineal simple para estudiar diferentes tipos de relaciones entre variables.
El documento presenta varios escenarios sobre el procesamiento de datos estadísticos en Stata. Incluye instrucciones para pegar y abreviar nombres de variables, etiquetar variables numéricas y categóricas, y generar resúmenes estadísticos, tablas de contingencia, histogramas y gráficos de caja para explorar y comparar variables. También cubre cómo identificar y remover datos atípicos antes de analizar la distribución de variables.
Este documento presenta 10 ejercicios estadísticos que involucran conceptos como tablas de frecuencias, medidas de tendencia central, diagramas y gráficas. Los ejercicios incluyen datos sobre puntuaciones de una prueba, pesos de atletas, edades de personas, volúmenes de envases, preferencias de color, números de clientes en un restaurante y velocidades de vehículos. Se pide completar tablas, calcular medidas estadísticas e interpretar resultados.
La distribución binomial describe el número de éxitos en una serie de ensayos independientes con dos posibles resultados (éxito o fracaso) y una probabilidad constante de éxito en cada ensayo. Esta tabla muestra las probabilidades de obtener diferentes números de éxitos para diferentes números de ensayos y probabilidades de éxito.
1. The document contains a table of critical values for the F distribution with an alpha value of 0.05.
2. The table lists the critical values across different degrees of freedom for the numerator and denominator.
3. Critical values range from 161.4 to 249.3 depending on the degrees of freedom.
Este documento presenta información sobre la prueba t de Student para muestras independientes y pareadas. Explica cómo calcular intervalos de confianza y realizar pruebas de hipótesis para comparar medias entre dos grupos o tratamientos aplicados a las mismas unidades. Proporciona un ejemplo numérico para ilustrar los pasos.
Se imparten Clases Particulares de Matematicas y su Didactica en Granada
Amplia experiencia en la preparacion de examenes de Rafael Roa, Marta Molina, Juan Godino, Pablo Flores y resto de profesores del Departamento de Didáctica de la Matemática de la Facultad de Ciencias de la Educación de Granada.
Clases individuales o en grupo.
Descuento a grupos reducidos.
Direccion de correo:
granada.clases.particulares@gmail.com
http://granada-clases-matematicas.blogspot.com/
El sistema haplodiploide de determinación del sexo en los himenópteros establece que las hembras son diploides y resultan de la fertilización de un óvulo, mientras que los machos son haploides y resultan de óvulos no fertilizados. Esto crea la peculiaridad de que los machos no tienen padre y no pueden tener hijos, pero sí nietos a través de sus hijas. Generalmente, este sistema se explica por la presencia de alelos complementarios que determinan el sexo.
Este documento presenta los conceptos básicos del análisis estadístico, incluyendo la sistematización de datos, codificación numérica, libro de códigos, matriz de datos, tablas y gráficas. Explica cómo organizar y codificar los datos recolectados, y métodos para presentarlos de manera resumida y visual como tablas y gráficas, las cuales son útiles para el análisis.
El documento presenta varios escenarios sobre el procesamiento de datos estadísticos en Stata. Incluye instrucciones para pegar y abreviar nombres de variables, etiquetar variables numéricas y categóricas, y generar resúmenes estadísticos, tablas de contingencia, histogramas y gráficos de caja para explorar y comparar variables. También cubre cómo identificar y remover datos atípicos antes de analizar la distribución de variables.
Este documento presenta 10 ejercicios estadísticos que involucran conceptos como tablas de frecuencias, medidas de tendencia central, diagramas y gráficas. Los ejercicios incluyen datos sobre puntuaciones de una prueba, pesos de atletas, edades de personas, volúmenes de envases, preferencias de color, números de clientes en un restaurante y velocidades de vehículos. Se pide completar tablas, calcular medidas estadísticas e interpretar resultados.
La distribución binomial describe el número de éxitos en una serie de ensayos independientes con dos posibles resultados (éxito o fracaso) y una probabilidad constante de éxito en cada ensayo. Esta tabla muestra las probabilidades de obtener diferentes números de éxitos para diferentes números de ensayos y probabilidades de éxito.
1. The document contains a table of critical values for the F distribution with an alpha value of 0.05.
2. The table lists the critical values across different degrees of freedom for the numerator and denominator.
3. Critical values range from 161.4 to 249.3 depending on the degrees of freedom.
Este documento presenta información sobre la prueba t de Student para muestras independientes y pareadas. Explica cómo calcular intervalos de confianza y realizar pruebas de hipótesis para comparar medias entre dos grupos o tratamientos aplicados a las mismas unidades. Proporciona un ejemplo numérico para ilustrar los pasos.
Se imparten Clases Particulares de Matematicas y su Didactica en Granada
Amplia experiencia en la preparacion de examenes de Rafael Roa, Marta Molina, Juan Godino, Pablo Flores y resto de profesores del Departamento de Didáctica de la Matemática de la Facultad de Ciencias de la Educación de Granada.
Clases individuales o en grupo.
Descuento a grupos reducidos.
Direccion de correo:
granada.clases.particulares@gmail.com
http://granada-clases-matematicas.blogspot.com/
El sistema haplodiploide de determinación del sexo en los himenópteros establece que las hembras son diploides y resultan de la fertilización de un óvulo, mientras que los machos son haploides y resultan de óvulos no fertilizados. Esto crea la peculiaridad de que los machos no tienen padre y no pueden tener hijos, pero sí nietos a través de sus hijas. Generalmente, este sistema se explica por la presencia de alelos complementarios que determinan el sexo.
Este documento presenta los conceptos básicos del análisis estadístico, incluyendo la sistematización de datos, codificación numérica, libro de códigos, matriz de datos, tablas y gráficas. Explica cómo organizar y codificar los datos recolectados, y métodos para presentarlos de manera resumida y visual como tablas y gráficas, las cuales son útiles para el análisis.
El documento describe los conceptos fundamentales del análisis de regresión lineal simple, incluyendo la interpretación del modelo de regresión lineal simple, la estimación de parámetros, la inferencia estadística de los parámetros y el análisis de varianza de los modelos. Se presentan ejemplos para ilustrar los conceptos y se define formalmente el modelo de regresión lineal simple.
Este documento describe los principales componentes de la pantalla de Excel, incluyendo la barra de título, barra de menús, barra de herramientas, títulos de columnas y filas, cuadro de nombres, barra de fórmulas, celdas, barra de herramientas de formato, barra de etiquetas, barra de desplazamiento, barra de estado, botones de navegación, etiquetas de hojas y panel de tareas. Explica brevemente la función de cada uno de estos componentes.
Este documento presenta el modelo clásico de regresión lineal múltiple, incluyendo su formulación matricial, el método de mínimos cuadrados ordinarios para estimar los parámetros, y las propiedades de dichos estimadores. También explica cómo realizar pruebas de hipótesis sobre los parámetros y el ajuste global del modelo usando el análisis de varianza (ANOVA). Se incluyen ejemplos ilustrativos.
Este documento presenta una introducción al tema de la regresión lineal simple. Explica el modelo de regresión, los métodos de estimación de parámetros como mínimos cuadrados y máxima verosimilitud, y realiza inferencia y predicción. También cubre el diagnóstico del modelo verificando supuestos como linealidad, homocedasticidad y normalidad revisando gráficos de residuos.
Unidad 2: Regresión lineal múltiple y correlaciónAlvaro Chavez
Este documento trata sobre regresión lineal múltiple. Explica el modelo de regresión múltiple, donde se usan más de una variable independiente para estimar la variable dependiente. También describe cómo determinar la ecuación de regresión, calcular los coeficientes de la regresión y realizar pruebas de hipótesis sobre los coeficientes.
Este documento describe el análisis de regresión múltiple, incluyendo la ecuación de regresión múltiple y el error estándar múltiple de estimación. También cubre el coeficiente múltiple de determinación, las hipótesis de normalidad, homocedasticidad e independencia de errores, y cómo detectar cuando estas hipótesis no se cumplen. Finalmente, explica cómo predecir valores utilizando un modelo de regresión múltiple.
La regresión lineal modela la relación entre dos variables continuas mediante una ecuación de recta. Se presentan datos de altura y peso de 17 niños. Usando el método de mínimos cuadrados, se ajusta una recta de regresión a los datos con la ecuación Ŷ = 0,5289X - 42,833. Esto indica que a mayor altura mayor peso, y que el modelo explica aproximadamente el 71,6% de los datos.
Este documento presenta los conceptos clave del análisis de regresión y correlación múltiples, incluyendo cómo desarrollar la ecuación de regresión múltiple, calcular el error estándar múltiple de estimación, interpretar una matriz de correlación, realizar pruebas de hipótesis para determinar si los coeficientes de regresión son significativos, y analizar los residuos. También incluye un ejemplo completo que ilustra estos conceptos.
El documento presenta dos ejemplos de análisis de regresión múltiple. El primero analiza los factores que afectan el gasto familiar mensual en alimentos, incluyendo el ingreso, integrantes familiares y ahorro. El segundo analiza los factores que afectan las ventas anuales de llantas de una empresa, incluyendo tiendas minoristas, tamaño del parque automotor, ingreso personal e antigüedad de autos. Ambos ejemplos presentan las ecuaciones de regresión obtenidas.
Un navegador web es una aplicación que permite visualizar páginas web e interpreta archivos y sitios para mostrar texto e imágenes. Un motor de búsqueda como Google rastrea páginas web para crear una base de datos de contenido y puede buscar términos específicos para devolver resultados relevantes. La diferencia principal es que un navegador accede directamente a páginas web mientras que un buscador devuelve una lista de resultados basados en consultas.
M.galante historia politica y del derechoNameless RV
Este documento discute las convergencias y divergencias entre la historia del derecho y la historia política en relación con el estudio del Estado en América Latina. Ambas disciplinas comparten un enfoque revisionista pero difieren en cómo expresan su crítica al Estado. La historia del derecho se ha centrado más en deconstruir el "mito del Estado" y explorar formas de derecho alternativas, mientras que la nueva historia política ha puesto más énfasis en interpretar el proceso de construcción estatal en el siglo XIX. El documento analiza
Este breve documento desea feliz cumpleaños a alguien, deseándole éxito en su vida personal y en sus objetivos, así como un año lleno de amor, felicidad y alegría, con la esperanza de que Dios ilumine su camino.
Este documento resume el primer conversatorio con el Dr. Hugo Castro Cadavid, familiar del poeta Miguel Ángel Osorio Benitez. El conversatorio tuvo lugar en la Casa Museo "Porfirio Barba Jacob" en Angostura, Antioquia. El Dr. Castro habló sobre la vida y obra de Osorio Benitez y aclaró dudas sobre la inspiración de uno de sus poemas más famosos. También compartió recuerdos de la familia y recitó poemas escritos por la madre de Osorio Benitez.
El documento habla sobre SAIA - Ingeniería Económica y contiene la información de Rauxeni Rojas con su número de cédula. Además, menciona que la capitalización puede tener diferentes duraciones como mensual, bimestral o semestral y define el término "tasa nominal".
El documento presenta las cosas malas, buenas y deseadas del Colegio Ana María Janer según dos estudiantes. Entre lo malo mencionan las caídas en las escaleras. Lo bueno incluye los buses escolares y los juegos como el taca taca para los recreos. Las cosas que quieren son consolas para jugar y clases de natación.
La ENIAC fue la primera computadora electrónica construida en 1947 en la Universidad de Pennsylvania. En 1951 se introdujo la UNIVAC, la primera computadora comercial que podía leer cintas magnéticas y procesar datos. En la década de 1960, IBM produjo la exitosa serie 360 que estandarizó tecnologías como unidades de cinta de nueve canales y discos magnéticos. En 1976, Steve Jobs y Steve Wozniak inventaron la primera microcomputadora para uso masivo llamada Apple, que llegó a ser la segunda compañía más grande del mundo.
Los valores morales son conceptos importantes que deben compararse con la actualidad y relacionarse con la teoría y la práctica. Sin embargo, a menudo no se llevan a la práctica en el aula y es necesario desarrollar estrategias didácticas para lograr un aprendizaje significativo de los valores a través del plan de estudios y la educación.
El documento describe los conceptos fundamentales del análisis de regresión lineal simple, incluyendo la interpretación del modelo de regresión lineal simple, la estimación de parámetros, la inferencia estadística de los parámetros y el análisis de varianza de los modelos. Se presentan ejemplos para ilustrar los conceptos y se define formalmente el modelo de regresión lineal simple.
Este documento describe los principales componentes de la pantalla de Excel, incluyendo la barra de título, barra de menús, barra de herramientas, títulos de columnas y filas, cuadro de nombres, barra de fórmulas, celdas, barra de herramientas de formato, barra de etiquetas, barra de desplazamiento, barra de estado, botones de navegación, etiquetas de hojas y panel de tareas. Explica brevemente la función de cada uno de estos componentes.
Este documento presenta el modelo clásico de regresión lineal múltiple, incluyendo su formulación matricial, el método de mínimos cuadrados ordinarios para estimar los parámetros, y las propiedades de dichos estimadores. También explica cómo realizar pruebas de hipótesis sobre los parámetros y el ajuste global del modelo usando el análisis de varianza (ANOVA). Se incluyen ejemplos ilustrativos.
Este documento presenta una introducción al tema de la regresión lineal simple. Explica el modelo de regresión, los métodos de estimación de parámetros como mínimos cuadrados y máxima verosimilitud, y realiza inferencia y predicción. También cubre el diagnóstico del modelo verificando supuestos como linealidad, homocedasticidad y normalidad revisando gráficos de residuos.
Unidad 2: Regresión lineal múltiple y correlaciónAlvaro Chavez
Este documento trata sobre regresión lineal múltiple. Explica el modelo de regresión múltiple, donde se usan más de una variable independiente para estimar la variable dependiente. También describe cómo determinar la ecuación de regresión, calcular los coeficientes de la regresión y realizar pruebas de hipótesis sobre los coeficientes.
Este documento describe el análisis de regresión múltiple, incluyendo la ecuación de regresión múltiple y el error estándar múltiple de estimación. También cubre el coeficiente múltiple de determinación, las hipótesis de normalidad, homocedasticidad e independencia de errores, y cómo detectar cuando estas hipótesis no se cumplen. Finalmente, explica cómo predecir valores utilizando un modelo de regresión múltiple.
La regresión lineal modela la relación entre dos variables continuas mediante una ecuación de recta. Se presentan datos de altura y peso de 17 niños. Usando el método de mínimos cuadrados, se ajusta una recta de regresión a los datos con la ecuación Ŷ = 0,5289X - 42,833. Esto indica que a mayor altura mayor peso, y que el modelo explica aproximadamente el 71,6% de los datos.
Este documento presenta los conceptos clave del análisis de regresión y correlación múltiples, incluyendo cómo desarrollar la ecuación de regresión múltiple, calcular el error estándar múltiple de estimación, interpretar una matriz de correlación, realizar pruebas de hipótesis para determinar si los coeficientes de regresión son significativos, y analizar los residuos. También incluye un ejemplo completo que ilustra estos conceptos.
El documento presenta dos ejemplos de análisis de regresión múltiple. El primero analiza los factores que afectan el gasto familiar mensual en alimentos, incluyendo el ingreso, integrantes familiares y ahorro. El segundo analiza los factores que afectan las ventas anuales de llantas de una empresa, incluyendo tiendas minoristas, tamaño del parque automotor, ingreso personal e antigüedad de autos. Ambos ejemplos presentan las ecuaciones de regresión obtenidas.
Un navegador web es una aplicación que permite visualizar páginas web e interpreta archivos y sitios para mostrar texto e imágenes. Un motor de búsqueda como Google rastrea páginas web para crear una base de datos de contenido y puede buscar términos específicos para devolver resultados relevantes. La diferencia principal es que un navegador accede directamente a páginas web mientras que un buscador devuelve una lista de resultados basados en consultas.
M.galante historia politica y del derechoNameless RV
Este documento discute las convergencias y divergencias entre la historia del derecho y la historia política en relación con el estudio del Estado en América Latina. Ambas disciplinas comparten un enfoque revisionista pero difieren en cómo expresan su crítica al Estado. La historia del derecho se ha centrado más en deconstruir el "mito del Estado" y explorar formas de derecho alternativas, mientras que la nueva historia política ha puesto más énfasis en interpretar el proceso de construcción estatal en el siglo XIX. El documento analiza
Este breve documento desea feliz cumpleaños a alguien, deseándole éxito en su vida personal y en sus objetivos, así como un año lleno de amor, felicidad y alegría, con la esperanza de que Dios ilumine su camino.
Este documento resume el primer conversatorio con el Dr. Hugo Castro Cadavid, familiar del poeta Miguel Ángel Osorio Benitez. El conversatorio tuvo lugar en la Casa Museo "Porfirio Barba Jacob" en Angostura, Antioquia. El Dr. Castro habló sobre la vida y obra de Osorio Benitez y aclaró dudas sobre la inspiración de uno de sus poemas más famosos. También compartió recuerdos de la familia y recitó poemas escritos por la madre de Osorio Benitez.
El documento habla sobre SAIA - Ingeniería Económica y contiene la información de Rauxeni Rojas con su número de cédula. Además, menciona que la capitalización puede tener diferentes duraciones como mensual, bimestral o semestral y define el término "tasa nominal".
El documento presenta las cosas malas, buenas y deseadas del Colegio Ana María Janer según dos estudiantes. Entre lo malo mencionan las caídas en las escaleras. Lo bueno incluye los buses escolares y los juegos como el taca taca para los recreos. Las cosas que quieren son consolas para jugar y clases de natación.
La ENIAC fue la primera computadora electrónica construida en 1947 en la Universidad de Pennsylvania. En 1951 se introdujo la UNIVAC, la primera computadora comercial que podía leer cintas magnéticas y procesar datos. En la década de 1960, IBM produjo la exitosa serie 360 que estandarizó tecnologías como unidades de cinta de nueve canales y discos magnéticos. En 1976, Steve Jobs y Steve Wozniak inventaron la primera microcomputadora para uso masivo llamada Apple, que llegó a ser la segunda compañía más grande del mundo.
Los valores morales son conceptos importantes que deben compararse con la actualidad y relacionarse con la teoría y la práctica. Sin embargo, a menudo no se llevan a la práctica en el aula y es necesario desarrollar estrategias didácticas para lograr un aprendizaje significativo de los valores a través del plan de estudios y la educación.
9. Taller No 8 GráFica De La EcuacióN CuadráTica IiiJuan Galindo
Este documento presenta un taller sobre gráficas de ecuaciones cuadráticas para estudiantes de noveno grado. El taller introduce el tema y explica cómo graficar funciones de la forma y = a(x - h)2 + k variando los parámetros a, h y k. Los estudiantes completan ejercicios individuales y en grupo usando software para explorar cómo cambian las gráficas cuando se modifican los valores de a, h y k.
El documento presenta información sobre correlación y regresión lineal con el objetivo de dar solución a problemas relacionados con estas temáticas. Se explican conceptos como coeficiente de correlación, regresión lineal, diagrama de dispersión, entre otros. Además, contiene varios ejemplos y ejercicios resueltos para mostrar la aplicación práctica de estos métodos estadísticos en la solución de problemas.
9. Taller No 2 Manejo De Calculadora IJuan Galindo
Este documento presenta un taller sobre el manejo de calculadoras científicas. El taller tiene como objetivo que los estudiantes aprendan las características básicas y el uso de la calculadora para operaciones aritméticas complejas. El documento guía a los estudiantes a través de ejercicios prácticos para familiarizarse con las teclas y funciones de la calculadora.
El resumen analiza los datos de una variable sobre el número de coches por familia en una población de 25 familias. Se crea una tabla de frecuencias que muestra la media en 1.56 coches por familia y la moda en 1 coche. El rango es de 4 y la desviación típica es 0.94. Los datos se representan en un diagrama de barras y gráfico de sectores.
El documento proporciona una introducción a la estadística inferencial, incluyendo la distribución normal, estimación puntual e intervalos de confianza, pruebas de hipótesis, y análisis de varianza. Explica la distribución normal estándar y cómo calcular probabilidades utilizando tablas de la distribución normal o funciones en Excel.
Este documento proporciona una introducción a conceptos clave de estadística inferencial como la distribución normal, estimación puntual, intervalos de confianza y pruebas de hipótesis. Explica la distribución normal estándar y cómo calcular probabilidades utilizando esta distribución. También describe cómo estimar parámetros poblacionales como el promedio y la desviación estándar a partir de una muestra, así como cómo construir intervalos de confianza. Finalmente, menciona diferentes tipos de pruebas de hipótesis comúnmente us
El resumen analiza los datos de una variable sobre el número de coches por familia en una población de 25 familias. Calcula la tabla de frecuencias, la media, mediana y moda. Luego determina el rango y desviación típica de los datos. Finalmente, representa los resultados en un diagrama de barras y gráfico de sectores.
Este documento presenta diferentes tipos de funciones de fórmulas en Excel, incluyendo funciones de producto, pago, suma, promedio, condicionales, hipervínculos, contar, máximo, seno y suma condicional. También describe cómo las gráficas dinámicas en Word pueden ayudar a expresar y comparar datos de una manera ordenada e intuitiva para acelerar las tareas escolares.
Este documento presenta un modelo probabilístico de Poisson para analizar los datos de entrada de vehículos a un estacionamiento. Se calcula la media de los datos y las frecuencias esperadas y observadas. Luego, se grafican estas frecuencias y se calcula la bondad de ajuste, la cual es mayor que el valor alfa, indicando que los datos no se ajustan a una distribución de Poisson. Por lo tanto, este modelo probabilístico no es adecuado para representar los datos de entrada de vehículos al estacionamiento.
El documento presenta datos sobre la relación entre diferentes variables como el porcentaje de un nuevo material, número de defectos, antigüedad de maquinaria y porcentaje de indisponibilidad, tiempo de cocción de pizzas y porciones defectuosas. Se realizan análisis de correlación entre las variables y en la mayoría de los casos se demuestra una buena correlación linear entre ellas.
El documento contiene 4 gráficas que muestran datos numéricos sobre medallas olímpicas y funciones matemáticas. La primera gráfica muestra el número de medallas ganadas por los Estados Unidos en diferentes Juegos Olímpicos. La segunda gráfica ilustra una función cuadrática. La tercera presenta una distribución de frecuencias. La cuarta grafica la función seno.
Este documento presenta una guía de estudio sobre conjuntos numéricos. Contiene 17 actividades que cubren temas como clasificación de números, operaciones con potencias y raíces, simplificación de expresiones, y resolución de problemas relacionados con números reales. El objetivo es que los estudiantes reconozcan los conjuntos numéricos y sus propiedades, y puedan realizar operaciones y resolver situaciones problema utilizando números reales.
Este documento presenta un modelo probabilístico de Poisson para analizar los datos de 46 observaciones del número de autos que ingresan a un parqueadero. Se calcula la media de los datos y las frecuencias esperadas según la distribución de Poisson. Luego, se grafican las frecuencias observadas versus las esperadas, y se calcula un estadístico de bondad de ajuste que indica que los datos no se ajustan bien a un modelo de Poisson.
Este documento presenta un tema sobre correlación y regresión lineal para estudiantes de 6to año de la Escuela de Comercio Exterior y Negociación Comercial Internacional de la Universidad Politécnica Estatal del Carchi. El objetivo general es dar solución a problemas planteados utilizando la correlación y regresión lineal. Se incluyen ejemplos y ejercicios para que los estudiantes apliquen sus conocimientos en la resolución de problemas relacionados con el comercio exterior.
Este documento presenta información sobre un tema de correlación y regresión lineal impartido a estudiantes de 6to año de la carrera de Comercio Exterior. El objetivo general es dar solución a problemas planteados utilizando los conceptos de correlación y regresión lineal. Se explican estos conceptos y se justifica el tema para fortalecer los conocimientos de los estudiantes y aplicarlos a problemas relacionados con el comercio exterior. Se plantea realizar ejercicios prácticos para poner en práctica los conocimientos
Este documento presenta información sobre un curso de probabilidad y estadística. Detalla los libros de texto, los temas a cubrir como regresión lineal simple y múltiple, y ejemplos de problemas de investigación. También incluye fórmulas y tablas sobre correlación, coeficientes de determinación, y errores estándar de estimación.
El documento presenta gráficos de barras que muestran el número de medallas ganadas por los Estados Unidos en diferentes Juegos Olímpicos desde 1984 hasta 2000, separadas por oro, plata y bronce. También incluye gráficos de líneas y dispersión que ilustran diferentes tipos de funciones matemáticas.
El documento presenta gráficos de barras que muestran el número de medallas ganadas por los Estados Unidos en diferentes Juegos Olímpicos desde 1984 hasta 2000, separadas por oro, plata y bronce. También incluye gráficos de líneas y dispersión que ilustran diferentes tipos de funciones matemáticas.
1. Tema 1- Regresión lineal simple.
1.1. Introducción
1.2. Especificación del modelo de regresión lineal simple en la población.
1.2.1. Estructura de los modelos de regresión
1.2.2. Hipótesis básicas
1.3. Estimación de los parámetros del modelo de regresión lineal simple
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
1.3.2. La recta de regresión en puntuaciones diferenciales
1.3.3. La recta de regresión en puntuaciones típicas
1.3.4. Relación entre la pendiente de la recta y el coeficiente de
correlación
1.3.5. Interpretación de los coeficientes de la recta de regresión
1.4. El contraste de la regresión
1.4.1.Componentes de variabilidad y bondad de ajuste
1.4.2. Validación del modelo
1.4.3. Significación de parámetros
1.5. Diagnosis del modelo: Análisis de residuos
1.6. Predicción
2. Tema 1- Regresión lineal simple.
1.1. Introducción
1.1.1. Ejemplos de investigaciones en las que puede ser
adecuado utilizar el modelo de regresión simple.
1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
1.1.3. Herramientas para evaluar la relación entre dos
variables
1.1.3.1. El diagrama de dispersión
1.1.3.2. La covarianza
1.1.3.3. El coeficiente de correlación de Pearson
3. 1.1. Introducción
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresión simple.
Se pretende estudiar si la competencia escolar de niños, medida en
una escala entre 1 y 4, depende del tiempo en meses que llevan
viviendo con un progenitor
Variable dependiente o criterio (endógena) : competencia escolar
Variable independiente o predictora (exógena) : meses de
monoparentalidad
Se pretende estudiar si el ajuste emocional de niños, medido por un
test de ajuste que proporciona puntuaciones en una escala entre 0
y 10, depende del ámbito rural o urbano en el que vive la familia
Variable dependiente o criterio : ajuste emocional
Variable independiente o predictora : ámbito geográfico
4. 1.1. Introducción
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresión simple.
Se pretende estudiar la relación entre estrés laboral y la variable
trabajo a turno
Variable dependiente o criterio : estrés laboral
Variable independiente o predictora : tipo de turno: fijo o variable
Se pretende estudiar si las notas en Análisis de Datos II dependen
de Análisis de Datos I
Variable dependiente o criterio : Análisis de Datos II
Variable independiente o predictora : Análisis de datos I
Para estudiar empíricamente estas relaciones medimos, en una muestra de sujetos, los valores
de las variables incluidas en la relación. Genéricamente, la información de un sujeto cualquiera de
la muestra Si, vendrá dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos
de la investigación y para los ejemplos propuestos tendrá el siguiente formato.
5. Tabla o matriz de datos N=9
Análisis de datos I Análisis de datos II
1 2
Meses comp escolar
2 1 2 4
3 3 18 4
4 4 108 3.66
5 2 24 2.83
0 3 132 2
7 5 60 3.5
8 6 16 2.16
9 8 9 2.66
10 9 84 2.5
N=10
comp escolar ámbito Observar que las variable Turno estrés
ámbito y turno aunque
4 1 0 65
no son métricas las hemos
4 1 codificado como numéricas. 0 76
3.66 1 Hemos elegido el 0 y el 1
para diferenciar entre 0 50
2.83 1 las categorías de las variables. 0 89
2 1 Este tipo de codificación,
muy frecuente en estadística, 0 57
3.5 0 se conoce como codificación 1 45
2.16 0 “dummy” o ficticia
1 34
2.66 0 1 56
2.5 0 1 55
1.83 0 1 61
N=10 N=10
6. 1.1.2. El concepto de relación entre variables.
Naturaleza y tipos de relación: el gráfico de dispersión
25 5
4
20 0
3
15 0 2 4 6 8 10 12
-5
10 2
-10
5 1
-15
0
0
0 2 4 6 8 10 12 -20
0 2 4 6 8 10 12
7. 1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
100
10
80
5
60
0
40
-5
20
-10
0
-15
0 1
30 40
35
25
30
20 25
20
15 15
10 10
5
5 0
0 0 5 10 15 20
300
250
200
150
100
50
0
0 5 10 15 20
8. 1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
31 35
30
29
25
27
20
25
15
23
10
21 5
19 0
0 2 4 6 8 10 12 0 2 4 6 8 10 12
9. 1.1.3.2. La covarianza
N
∑ (X
i =1
i − X )(Y i − Y ) S P C
S = =
x y
N −1 N −1
La covarianza puede tomar valores entre (-∞,+∞) de manera que si:
Sxy= 0 independencia lineal
Sxy> 0 relación lineal directa o positiva
Sxy< 0 relación lineal inversa o negativa
Vamos a ver, utilizando el gráfico de dispersión, porque las relaciones
De orden anteriores están relacionadas con el tipo de relación lineal.
10. Sxy< 0 relación lineal inversa o negativa
Sxy> 0 relación lineal directa o
positiva Y -Y
Y -Y
X - X X - X
Y
Y
X
Sxy= 0 independencia lineal X
Y -Y
X - X
Y
X
11. Análisis de datos I Análisis de datos II X - X Y -Y (X )(
- X Y -Y )
1 2 -3.9 -2.3 8.97
2 1 -2.9 -3.3 9.57
3 3 -1.9 -1.3 2.47
4 4 -0.9 -0.3 0.27
5 2 0.1 -2.3 -0.23
0 3 -4.9 -1.3 6.37
7 5 2.1 0.7 1.47
8 6 3.1 S1.7
xy
5.27
9 8 4.1 3.7 15.17
10 9 5.1 4.7 23.97
Sumas 49 43 0 0 73.3
Medias 4.9 4.3 8.14444444
13. 1.1.3.3. El coeficiente de correlación de Pearson
N
S x y
∑ (X
i =1
i − X )(Y i − Y )
r x y = =
S S N N
∑ (X ) ∑ (Y )
x y 2 2
i − X i − Y
i =1 i =1
− 1 ≤ r xy ≤ + 1
rxy = 0
9 12
rxy = 0.88
25
8
10
20 7
6 8
15 5 6
4
10
rxy = 1
4
3
5 2 2
1
0 0
0 0 2 4 6 8 10 12
0 2 4 6 8 10 12 0 2 4 6 8 10
5
0
0 2 4 6 8 10 12
-5
-10
rxy = -1
-15 rxy = -0.88
rxy = 0
-20
14. 1.2. Especificación del modelo de regresión lineal simple en la
población.
1.2.1. Estructura de los modelos de regresión
Xi
predictora
Yi
criterio
i
independiente dependiente
exógena endógena
explicativa explicada
Expresión matemática del modelo en la población
Y i = f ( X i ) + ε i = β 0 + β 1 X i + ε i = Y i + ε i
Y i = β 0 + β 1 X i Puntuación predicha por la recta de regresión verdadera
ε = Y − Y
i i i Residuo o error de predicción
En el modelo hay dos variables observadas: X e Y y dos parámetros
la ordenada en el origen de la recta de regresión 0 y la pendiente
1
Interpretación de los parámetros:
15. Interpretación de los parámetros:
Ejercicio Consumo
Esperanza de tabaco Esperanza
físico
de vida de vida
i
i
ˆ
Y = β 0 + β1 X = 70 + 0,3 X ˆ
Y = β 0 + β1 X = 70 − 0,04 X
16. 1.2.2. Hipótesis básicas
1. El término de Error es una variable aleatoria con media cero: E (ε i ) = 0
2. Homocedasticidad: la varianza del término de error es constante: Var (ε i ) = σ 2
3. Los errores se distribuyen normalmente: ε i ≈ N (0, σ 2 )
4. Los errores son independientes entre sí.
Las hipótesis anteriores pueden formularse de manera equivalente
en términos de la variable criterio. Así,
YE/( iXα+=) iXβ
E (Y / X i) = α + β X i
1’. La media de Y depende linealmente de E (Y / X i ) = α + β X i
X:
2’. La varianza de Y es constante: Var (Y / X i ) = σ
2
2)
/(XYVar σ=i
3’. La distribución de Y es normal para cada X: Y / X i ≈ N (α + βX i , σ 2 )
4’. Las observaciones Yi son independientes entre sí.
17. Resumen gráfico de las hipótesis básicas
formuladas en términos de la variable criterio
σy / x =σy / x =σy / x =σy / x
2
1
2
2
2 2
3 4
Distribución Normal
X1, X2, X3, X4
18. Resumen gráfico de las hipótesis básicas
formuladas en términos de los residuos
0
X1, X2, X3, X4
19. El objetivo del análisis de regresión será estimar los
parámetros del modelo presentado y contrastar las
hipótesis de partida todo ello a partir de una muestra.
20. 1.3. Estimación de los parámetros del modelo de regresión
lineal simple
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
1.3.2. La recta de regresión en puntuaciones diferenciales
1.3.3. La recta de regresión en puntuaciones típicas
1.3.4. Relación entre la pendiente de la recta y el coeficiente de
correlación
1.3.5. Interpretación de los coeficientes de la recta de regresión
21. 1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Partimos de una muestra de sujetos extraídos de una población
en la que se han tomado valores de las variables X e Y. La situación
más frecuente es que los puntos estén dispersos en el plano definido
por X e Y. La primera pregunta a plantearnos es de las infinitas rectas
que podemos ajustar a la nube de puntos ¿Cuál estimará mejor los
parámetros?. Existen diferentes criterios.
22. 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones
directas y principales propiedades
8,00
7,00
Y: Análisis de Datos II
6,00
5,00
4,00
3,00
2,00
1,00
Y i = a + b X i + e i = Y i + e i
1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00
X: Análisis de datos I
Y i = b 0 + b 1 X i + e i = Y i + e i
Y i = b 0 + b 1 X i
e i = Y i − Y i
23. 1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Criterio de mínimos cuadrados:
∑( ))
N N N
∑ ∑ (Y i − Y i ) Y i − (a + b X
2 2
e i
2
= = i = m in
i =1 i =1 i =1
∂
∑ (Y ))
N
− (a + b X
2
= 0
∂a i =1
i i
∂
∑ (Y ))
N
− (a + b X
2
= 0
∂b i =1
i i
24. 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones
directas y principales propiedades
Recta de regresión mínimo cuadrática (puntuaciones directas):
a = Y − bX
N
∑ (X
i=1
i − X )( Y i − Y ) S xy Sy
b = 2 = 2 = rxy
N
Sx S xº
∑ (X
i=1
i − X )
Yi = a + b X i = Y + b(X i − X )
25. Ejemplo de cálculo de la recta de regresión de
mínimos cuadrados
x y X X Y Y ( X X )2 X X Y Y
1 2 -4,5 -2,1 20,25 9,45
2 1 -3,5 -3,1 12,25 10,85
3 3 -2,5 -1,1 6,25 2,75
4 4 -1,5 -0,1 2,25 0,15
5 2 -0,5 -2,1 0,25 1,05
6 3 0,5 -1,1 0,25 -0,55
7 5 1,5 0,9 2,25 1,35
8 4 2,5 2,9 6,25 7,25
9 6 3,5 1,9 12,25 6,65
10 8 4,5 3,9 20,25 17,55
55 41 0 0 82,5 56,5
26. 1.4.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Recta de regresión mínimo cuadrática:
a Y bX 4,1 0,743 5,5 0,021
N
X
i 1
i X i Y
Y
56,50
b 2 0,743
N
82,50
X
i 1
i X
Yi 0,021 0,743 X i
ˆ
Y = 0,021 + 0,742 X i
dependencia de escalas.xls
27. 1.4.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Propiedades de la Recta de regresión mínimo cuadrática:
1) La media de las puntuaciones predichas es igual
a la media de Y
2) Los errores tienen media cero
3) La recta de mínimos cuadrados pasa por el
punto:
4) Los errores no correlacionan ni con la variable predictora
ni con las puntuaciones predichas
28. 1.4.2. La recta de regresión de mínimos cuadrados en
puntuaciones diferenciales
a) Modelo y recta en puntuaciones diferenciales
Y = a + bX + e = (Y − bX ) + bX + e
Y − Y = b( X − X ) + e
y = bx + e
y = bx
ˆ
29. 1.4.2. La recta de regresión de mínimos cuadrados en
puntuaciones estandarizadas
a) Modelo y recta en puntuaciones estandarizadas
y =bx +e
Sy
xy
yi = r
i +i
x e
Sx
yi xi e
= xy
r + i
Sy Sx Sy
Z yi = xy Z xi + ei
r Z
ˆ
Z i = xy Z xi
r
30. Recta de regresión en diferenciales y en tipificadas.
Relación entre b y r. Interpretación de los coeficientes de la
regresión
a) En puntuaciones directas
ˆ
Y = 0,021 + 0,742 X i
b) En puntuaciones diferenciales Sx
rxy = b
y = 0,742 x
ˆ Sy
c) En puntuaciones estandarizadas
ˆ
Z = 0,86 Z x
31. 1.4. El contraste de la regresión: introducción
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
-2,0
Y
-1,0 -,5 0,0 ,5 1,0 1,5
3
X 3
2
2
1 1
0 0
-1
-1
-2
-2
Y -3
-2 -1 0 1 2 3
-3
Y
-3 -2 -1 0 1 2
X
X
32. 3
1.4. El contraste de la regresión: introducción
3
2
2
1
1
0
0
-1
-1
-2
-2 -3
Y
Y
-3 -2 -1 0 1 2 -2,0 -1,5 -1,0 -,5 0,0 ,5 1,0 1,5
3
X X
2
1
0
-1
-2
-3
Y
-3 -2 -1 0 1 2 3
X
33. 1.4. El contraste de la regresión: introducción
3
3
2
2
1
1
0
0
-1
-1
-2
-2
-3
Y
-3 -2 -1 0 1 2 3 -3
Y
-3 -2 -1 0 1 2 3
X
X
34. 1.4. El contraste de la regresión: introducción
3
2
1
0
-1
-2
-3
-4
Y
-4 -3 -2 -1 0 1 2 3
X
35. 1.4. El contraste de la regresión: introducción
ˆ
Yi = a + bX i
Yi
Xi
36. 1.4.1.Componentes de variabilidad y bondad de ajuste
ˆ
Yi = a + bX i
Yi
Y
(Y −Y ) = (Y −Y ) + (Y −Y )
i
ˆ
i
ˆ
i i
Desviación Desviación Desviación
total explicada residual
Xi
37. 1.4.1. Componentes de variabilidad y bondad de ajuste
∑ (Y − Y ) = ∑ (Yˆ − Y ) + ∑ (Y − Yˆ )
N 2 N 2 N 2
i i i
i =1 i =1 i =1
SCt SCexp SCres
Variación Variación Variación
Total Explicada Residual
Xi
38. 1.4.1. Componentes de variabilidad y bondad de ajuste
Fórmulas para calcular las sumas de cuadrados en
puntuaciones directas y diferenciales:
2
N
N 2 N N
Yi
i1
SCt Y
i1
i Y
i1
y 2
i
i1
Yi 2
N
N 1S y
2
N
2
∑ Xi
( )
2 2
∑( X − X )
N N N N
SCexp = ∑ Y − Y
ˆ =b 2
= b 2 ∑ xi2 = b 2 ∑ X i2 − i =1 = b 2 ( N − 1) S x
2
i =1 i =1 i =1 i =1 N
( ) = ∑e
N 2 N
SCres = ∑ ˆ
Yi − Yi 2
i = SCt − SCexp
i =1 i =1
39. 1.4.1. Componentes de variabilidad y bondad de ajuste
Fórmulas para calcular las sumas de cuadrados en
tipificadas:
SCt SCexp SCres
N
SCt = ∑ Z y = N − 1
2
i =1
N N
SCexp = ∑ Z = r
ˆ
i
2 2
xy ∑ Z x = rxy ( N − 1)
2 2
i =1 i =1
SCres = ( N − 1) 1 − rxy
2
( )
40. 1.4.1. Componentes de variabilidad y bondad de
ajuste SCt SCexp SCres
SCt SCt SCt
1 R 2 R2
1
Bondad de ajuste o Coeficiente de
determinación
∑(Y −Y )
N 2
ˆ
b2 ( X − X )
2
SCexp i
b2Sx2
R =
2
= i=1
= = = rxy
2
∑(Y −Y ) ∑(Y −Y )
N N 2
SCt 2 2 Sy
i i
i=1 i=1
41. 1.4.1. Componentes de variabilidad y bondad de ajuste
Representación en diagramas de Venn
r2xy= 0
Y X
r2xy= 1
Y X
r2xy
Y X
42. 1.4.2. Validación del modelo
Esquema del Contraste de Hipótesis
Contrastar una Hipótesis Estadísticamente es juzgar si cierta
propiedad supuesta para una población es compatible con lo
observado en una muestra de ella.
43. Elementos de una Prueba de Hipótesis
1.- Hipótesis Nula (H0), Hipótesis
Alternativa.
2.- Estadístico de Contraste (Discrepancia).
3.- Región de Rechazo (Región Crítica):
nivel de significación.
4.- Regla de Decisión.
44. 1.4.2. Validación del modelo
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
H 0 : E ( Y / X ) = β 0 = µ ⇒ Yi = µ + ε i
H1 : E ( Y / X ) = β 0 + β 1 X i ⇒ Yi = β 0 + β 1 X i + ε i
2.- Estadístico de Contraste (Discrepancia).
2
SCexp rxy
2
S exp k K
F
2
Sres SC res 2
1 rxy
N K1 N K 1
45. 1.4.2. Validación del modelo
3.- Región de Rechazo (Región Crítica):
nivel de significación.
Región de aceptación de H0
Región de rechazo de H0
1-
Fc
46. 1.4.2. Validación del modelo
4.- Regla de Decisión.
Se rechaza la H0 si:
F >Fc
o de manera equivalente si:
p<
Por el contrario, se acepta la H0 si:
F ≤Fc
o de manera equivalente si:
p ≥
49. 1.4.3. Significación de parámetros
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
H0 : 1 0 H1 : 1 0
H0 : 0 H1: 0
2.- Estadístico de Contraste (Discrepancia).
b 1 b b rxy
t
Sb 2
S res 2
S res 2
1 rxy
N 2
2 N N 2
X
i 1
i X
N
Xi
i 1
X i2
N
i1
Nota: en regresión simple t2 = F
50. 1.4.3. Significación de parámetros
3.- Región de Rechazo (Región Crítica):
nivel de significación.
Región de aceptación de H0
2 1 2
∀
Fc
Regiones de rechazo de H0
51. 1.4.3. Significación de parámetros
4.- Regla de Decisión.
Se rechaza la H0 si:
t >+tc
o de manera equivalente si:
p<
Por el contrario, se acepta la H0 si:
t ≤ +tc
o de manera equivalente si:
p≥
54. Calculadoras estadísticas en internet
http://faculty.vassar.edu/lowry/VassarStats.htm
http://members.aol.com/johnp71/pdfs.html
http://davidmlane.com/hyperstat/F_table.html
http://davidmlane.com/hyperstat/t_table.html
http://www.psychstat.missouristate.edu/introbook/tdist.htm
http://www.psychstat.missouristate.edu/introbook/fdist.htm
http://calculators.stat.ucla.edu/cdf/
55. 1.6. Predicción
Intervalos de predicción:
Y o : Y ± t ( α , N 2
S res 1 +
1
+
(X − X )
o
2
− K −1 ) N N
∑ (X − X )
2
i =1
i
Notas del editor
Como ya hemos comentado en la presentación la organización del temario de la asignatura está función del número de variables que vamos a manejar y del criterio de medida utilizado. La situación investigación más simple en la que podemos plantearnos construir un modelo de regresión se refiere casos en los que pretendamos relacionar dos variables siendo la variable dependiente cuantitativa. Ejemplos: En este tema estudiaremos cómo construir un modelo para representar la dependencia lineal de una variable de respuesta, Y, respecto a otra variables explicativa, X. Empezaremos por situar el problema en el ámbito de la investigación en psicología y pasaremos a describir la metodología a utilizar para construir un modelo de regresión que en cualquier caso debe comenzar con un gráfico de los datos, seguirá por la estimación de parámetros, posterioremente se efectúan constrastes de hipótesis respecto a los parámetros y, finalmente se comprueban las hipótesis de partida mediante el análisis de residuos.
El número de filas de las matrices de datos corresponde al tamaño de la muestra (N) y el número de columnas a las variables medidas. La matriz de datos se representan genéricamente por X y su orden es de Nx2.
Decimos que dos variables están relacionadas cuando podemos detectar algún patrón de variación conjunta. La primera herramienta que vamos a utilizar para identificar y describir una relación entre dos variables es el gráfico de dispersión. El gráfico de dispersión, o nube de puntos, es una representación gráfica de la relación entre dos variables que se construye representando los pares de valores de las variables medidas en el plano cartesiano. La diapositiva muestra diferentes nubes de puntos todas tienen en común que representan relaciones funcionales o deterministas entre las variables. Difieren en que los tres de arriba muestran tendencias lineales o ausencia de relación y los dos de abajo muestran tendencias no lineales.
Lo que tienen en común estos gráficos es que representan relaciones estadísticas, estocásticas o probabilísticas. Son de este tipo de relaciones de las que nos ocuparemos en esta asignatura. Concretamente aprenderemos a estimar y comprobar la existencia de relaciones lineales en las poblaciones de las que proceden las muestras.
Los gráficos de dispersión son una herramienta muy útil para hacer una primera exploración, más cualitativa, de la existencia de relación entre las variables, del tipo de relación y de anomalías en la muestra que tendremos que resolver. Pero la estimación de dónde hay más relación comparando varios gráficos no es tan sencilla pues la inferencia a partir de la inspección visual está sujeta a múltiples factores: escalas, marcadores, colores, etc. Es por ello que necesitamos índices analíticos que nos permitan establecer la magnitud de la relación lineal entre las variables.
En prácticas desarrollaremos fórmulas que permitan calcular la covarianza de manera rápida. Pero
En los apartados que siguen estudiaremos como construir un modelo para representar la dependencia lineal de una variable de respuesta, y , respecto a otra variable explicativa, x. Desde Galton, los modelos estadísticos que explican la dependencia de una variable y respecto de una o varias variables se denominan modelos de regresión. Poner un ejemplo de predicción. Por ejemplo si conocemos la distribución de las notas en análisis de datos II de los alumnos de psicología y queremos predecir cual será la nota de cualquiera de vosotros ¿Cuál sería la mejor estimación?. y si sabemos que las notas dependen de las horas de estudio ¿Cuál será la mejor estimación?. la media de las notas correspondiente a las horas de estudio. Recordemos el diagrama de dispersión de una relación directa y admitamos que todos los factores o causas que influyen en una variable de respuesta, dependiente, endógena o criterio ( y ) se pueden dividir en dos grupos: el primero contiene a una variable ( x ) llamada predictora, explicativa, exógena o independiente y que se supone no aleatoria y conocida al observar (y); el segundo incluye el resto de factores, cada uno de los cuales influye en la respuesta sólo en pequeña magnitud, que englobaremos dentro del nombre común de perturbación aleatoria o término de error. La expresión matemática que relaciona esos tres términos le denominamos modelo de regresión. Si la función que relaciona Y con X es la ecuación de una recta el modelo es de regresión lineal.
Vamos a suponer que si los datos se han extraído de una población para la que es válido el modelo de regresión formulado en la muestra dicho modelo también se cumple y podemos escribir que: