Análisis de RegresiónCaso Easton Realty
Precio versus Área
Precios con tres áreas diferentes
Modelo: Recta de los PromediosEl precio promedio varía con el área.Podemos establecer una relación entre el precio y el área
Análisis de Regresión¿Qué es el Problema de Regresión?Estimar el valor promedio de una variable en términos del valor conocido de otra variable (o valores conocidos de otras variables) ¿Qué es la Ecuación de regresión?Es la Expresión matemática que establece la relación entre dos variables¿Qué incluye el Análisis de Regresión?Estimar la fuerza de la asociación entre variablesDeterminar la relación apropiadaDeterminar el nivel de significancia de la relaciónEvaluar qué tan apropiada es la ecuación de regresión
Modelo desde otra perspectivaPara cada área hay un precio promedio pero también hay un conjunto de posibles valores alrededor de este promedio. Esta variación es producida por otros factores
Primer análisis: Diagramas de Dispersión
Coeficiente de Correlación de la muestraMide la asociación entre dos variables, indicando el sentido de la asociación.Tiene el mismo sentido ( es decir signo) que la pendiente del modeloPuede evaluarse su significancia
Correlación inversa perfecta (-1)
Correlación = -0.9
Correlación = -0.5
Correlación = 0.02
Correlación = 0.8
Correlación = 0.96
Nuestro caso: Precio vs Área
Modelo Lineal
Tres casos que hay que diferenciarEcuación del modelo para los promedios:E(Y) = A + B XEs la ecuación general, aplicable para los promediosEj. El precio promedio de una casa de 200m2Ecuación del modelo para valores individualesY = A + B X + error, Es aplicable para cada casaEj. El precio de una casa individual de 200m2Ecuación estimada Y = a + b XEs la ecuación estimada a través de una muestra de observaciones (lo que producen los datos)
Nuestra Recta: Precio vs Áreab= pendientea=intercepto
Método de los Mínimos Cuadrados
Valor estimado del precio YestEELa diferencia es el error eEEValor real del precioError Estándar del Estimador EE Desviación Típica de los Residuos
Coeficiente de Determinación (r2)Es el porcentaje de variación de Y explicada por el modeloIndica fuerza de asociación linealSe le usa como indicador de la capacidad predictiva del modelo Uso muy común pero no es lo único que debe considerarseExiste una versión mejorada llamado 	R2-ajustado
Supuestos del ModeloLa relación entre las variables es linealLas observaciones son independientesLa dispersión es constante en la rectaNormalidad: Cada distribución en cada valor de X es normal (necesaria para inferencia)
Inferencia en regresión¿Es la relación mostrada en la muestra generalizable a la población?
Prueba de hipótesis en la regresión
Pruebas acerca de la Pendiente
Resultado de una Regresión SimpleEcuación de regresión simpleEl precio se incrementa en 34.9 por pie2La pendiente es significativaLa variable área capacidad predictivaLa correlación es positiva igual que la pendienteError estándar del modelo de regresiónEl área explica el 48% de la variación del precio
Análisis de ResidualesResiduales versus valor estimadoNormalidad de los errores
Regresión MúltipleEn este caso tenemos más una variable independiente o explicativa
Regresión MúltipleEstudia la relación entre Una variable dependiente, yMás de una variable independiente (explicativa)Se utiliza:Para describir la naturaleza de una relaciónPara predecir la variables dependiente a partir del valor de las independientes
Detalles del modeloY = A + B X1 + C X2 + D X3 +…+ errorSe asume relación lineal Los términos A, B, C y los demás se interpretan como contribuciones marginales a la variación de YUna herramienta útil es la matriz de correlacionesIdealmente X1, X2, X3 y las demás variables explicativas son independientes entre síProblema potencial es la multicolinealidad
Ejemplo: Sueldos de graduados
Preguntas¿Cuál es el impacto de tener una maestría en el sueldo del ejecutivo?¿Qué variables son explicativas de las diferencias en el sueldo?Ofrezca una explicación razonable para el resultado hallado
Sueldos: Matriz de correlaciónObservar que Maestría no es una variable cuantitativaLa interpretación de la correlación tiene dificultades
Gráfica: Sueldos Vs. Experiencia
Gráfica: Sueldos Vs. Calificación
Gráfica: Sueldos Vs. Maestría
Ejemplo Sueldos: EstimaciónSignificativo?
Otros indicadoresMulticolinealidad?

19 regresion

  • 1.
  • 2.
  • 3.
    Precios con tresáreas diferentes
  • 4.
    Modelo: Recta delos PromediosEl precio promedio varía con el área.Podemos establecer una relación entre el precio y el área
  • 5.
    Análisis de Regresión¿Quées el Problema de Regresión?Estimar el valor promedio de una variable en términos del valor conocido de otra variable (o valores conocidos de otras variables) ¿Qué es la Ecuación de regresión?Es la Expresión matemática que establece la relación entre dos variables¿Qué incluye el Análisis de Regresión?Estimar la fuerza de la asociación entre variablesDeterminar la relación apropiadaDeterminar el nivel de significancia de la relaciónEvaluar qué tan apropiada es la ecuación de regresión
  • 6.
    Modelo desde otraperspectivaPara cada área hay un precio promedio pero también hay un conjunto de posibles valores alrededor de este promedio. Esta variación es producida por otros factores
  • 7.
  • 8.
    Coeficiente de Correlaciónde la muestraMide la asociación entre dos variables, indicando el sentido de la asociación.Tiene el mismo sentido ( es decir signo) que la pendiente del modeloPuede evaluarse su significancia
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
    Tres casos quehay que diferenciarEcuación del modelo para los promedios:E(Y) = A + B XEs la ecuación general, aplicable para los promediosEj. El precio promedio de una casa de 200m2Ecuación del modelo para valores individualesY = A + B X + error, Es aplicable para cada casaEj. El precio de una casa individual de 200m2Ecuación estimada Y = a + b XEs la ecuación estimada a través de una muestra de observaciones (lo que producen los datos)
  • 18.
    Nuestra Recta: Preciovs Áreab= pendientea=intercepto
  • 19.
    Método de losMínimos Cuadrados
  • 20.
    Valor estimado delprecio YestEELa diferencia es el error eEEValor real del precioError Estándar del Estimador EE Desviación Típica de los Residuos
  • 21.
    Coeficiente de Determinación(r2)Es el porcentaje de variación de Y explicada por el modeloIndica fuerza de asociación linealSe le usa como indicador de la capacidad predictiva del modelo Uso muy común pero no es lo único que debe considerarseExiste una versión mejorada llamado R2-ajustado
  • 22.
    Supuestos del ModeloLarelación entre las variables es linealLas observaciones son independientesLa dispersión es constante en la rectaNormalidad: Cada distribución en cada valor de X es normal (necesaria para inferencia)
  • 23.
    Inferencia en regresión¿Esla relación mostrada en la muestra generalizable a la población?
  • 24.
    Prueba de hipótesisen la regresión
  • 25.
    Pruebas acerca dela Pendiente
  • 26.
    Resultado de unaRegresión SimpleEcuación de regresión simpleEl precio se incrementa en 34.9 por pie2La pendiente es significativaLa variable área capacidad predictivaLa correlación es positiva igual que la pendienteError estándar del modelo de regresiónEl área explica el 48% de la variación del precio
  • 27.
    Análisis de ResidualesResidualesversus valor estimadoNormalidad de los errores
  • 28.
    Regresión MúltipleEn estecaso tenemos más una variable independiente o explicativa
  • 29.
    Regresión MúltipleEstudia larelación entre Una variable dependiente, yMás de una variable independiente (explicativa)Se utiliza:Para describir la naturaleza de una relaciónPara predecir la variables dependiente a partir del valor de las independientes
  • 30.
    Detalles del modeloY= A + B X1 + C X2 + D X3 +…+ errorSe asume relación lineal Los términos A, B, C y los demás se interpretan como contribuciones marginales a la variación de YUna herramienta útil es la matriz de correlacionesIdealmente X1, X2, X3 y las demás variables explicativas son independientes entre síProblema potencial es la multicolinealidad
  • 31.
  • 32.
    Preguntas¿Cuál es elimpacto de tener una maestría en el sueldo del ejecutivo?¿Qué variables son explicativas de las diferencias en el sueldo?Ofrezca una explicación razonable para el resultado hallado
  • 33.
    Sueldos: Matriz decorrelaciónObservar que Maestría no es una variable cuantitativaLa interpretación de la correlación tiene dificultades
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.