SlideShare una empresa de Scribd logo
Tema 7: Regresión Simple
y Múltiple
EJEMPLO:
Aproxima bien el número de préstamos que efectúa una biblioteca a
lo largo de su primer año de vida.
Nos dicen que la fórmula
Si damos valores a la variable Días (nº días transcurridos desde
la apertura de la biblioteca…
DíasprestamosN 3'025º +=
0 100 200 300 400
Días
0
20
40
60
80
100
120
Nºprestamos
DíasprestamosN 3'025º +=
Si dos variables X e Y está relacionadas mediante una expresión
del tipo Y=a+bX, la gráfica que relaciona los valores de X e Y es
una línea recta, y se dice que Y=a+bX es la ecuación de dicha
recta; el recíproco es cierto, es decir, si la gráfica que
relaciona X e Y es una recta, entre ambas existe una relación del
tipo Y=a+bX. En ese caso, decimos que entre X e Y hay una
relación de tipo lineal.
En la realidad, no nos encontramos fórmulas tan “redondas”, pero
sí nos encontramos fenómenos que pueden aproximarse por ellas.
Días
Nº
prestamos
5 25
20 32
35 40
50 39
65 47
80 51
95 56
110 54
135 69
150 72
165 76
180 77
195 86
210 90
235 98
250 102
265 105
280 110
295 113
310 120
EJEMPLO: Supongamos que una biblioteca
proporcionó los siguientes datos, a lo largo
de su primer año de vida
Días
Nºprestamos
0 100 200 300 400
0
20
40
60
80
100
120
APROXIMADAMENTE,
Nº prestamos = 24,5529 + 0,301579*Días
En este caso, diríamos que las variables Nº préstamos y Días están
linealmente correlacionadas, y que lo de arriba es la ecuación de
la recta de regresión de Nº préstamos sobre Días.
¿Para qué nos sirve? (1) para conocer leyes
empíricas; (2) para predecir el valor de una cierta
variable
PROBLEMAS: Dadas dos variables X e Y, continuas
1.- [Correlación] ¿Existe una cierta relación entre ellas, o por el contrario son
independientes? En el primer caso, hablamos de que entre X e Y
hay correlación; en el segundo, decimos que son incorreladas
2.- [Correlación lineal] Suponiendo que entre X e Y hay correlación, ¿están
linealmente correlacionadas, es decir, funciona suficientemente bien un
modelo del tipo Y = a+bX para predecir Y a partir de X? ¿Cuáles son los
“óptimos” valores para a y b, es decir, los que producen “mejores” esti-
maciones?
3.- [Otros tipos de correlación] ¿Hay algún modelo mejor que el lineal
que permita estimar Y a partir de X? Por ejemplo,
Cuadrático: Y=a+bX+bX2
Exponencial: Y=a bx
…
Otro ejemplo (Leyes bibliométricas)
Curva logística del crecimiento
de la información
1. Distribuciones bidimensionales. Correlación.
Cuando en una población registramos simultáneamente los valores
de dos variables X e Y, decimos que estamos ante una distribución
BIDIMENSIONAL (PIZARRA: distribuciones marginales)
Los datos relativos a una distribución bidimensional se pueden
representar gráficamente mediante una NUBE DE PUNTOS, o
DIAGRAMA DE DISPERSION (PIZARRA)
Si la nube de puntos se ajusta aproximadamente a una curva, diremos
que las variables están correlacionadas, es decir, que existe una cierta
relación entre ellas (y buscaremos cuál es la expresión, la “fórmula” que
mejor aproxima una de ellas partir de la otra); en caso contrario, decimos
que las variables son incorreladas, es decir, que no tienen relación.
0 100 200 300 400
0
20
40
60
80
100
120
0 100 200 300 400
0
3
6
9
12
15
Hay correlación
Incorreladas
Además de la “inspección” de la nube de puntos,
hay métodos más exactos para evaluar la existencia
o no de correlación.
Si la nube de puntos parece ajustarse en torno a alguna curva (es
decir, si hay correlación), la forma de dicha curva nos indica el tipo
de correlación. Si la nube de puntos parece agruparse en torno a
una recta, diremos que hay correlación lineal, o que las variables
están linealmente correlacionadas.
0 100 200 300 400
0
20
40
60
80
100
120
Si las variables están linealmente correlacionadas, entonces tiene
sentido buscar la recta que “mejor se ajusta” a la nube de puntos,
es decir, la recta que globalmente está más cerca del conjunto de
puntos. Si nuestra intención al hacer eso es la de estimar Y a partir
de X, entonces encontrar dicha recta es equivalente a encontrar la
mejor aproximación
Y=a+bX (RECTA DE REGRESION DE Y SOBRE X)
¿Cómo tomar a, b para que la aproximación sea
“óptima”?
2. Regresión lineal sobre un conjunto de puntos.
PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar
si las variables X e Y están o no linealmente correlacionadas, y la
fuerza de dicha correlación lineal.
PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas,
determinar la recta de regresión de Y sobre X, es decir, a y b de modo
que, aproximadamente, Y=a + bX.
PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar
si las variables X e Y están o no linealmente correlacionadas, y la
fuerza de dicha correlación lineal.
- Nube de puntos.
- Coeficiente de correlación lineal de Pearson. (PIZARRA)
- Coeficiente de correlación lineal de Spearman.
- Coeficiente de determinación ó R-cuadrado ó % de variabilidad
explicada.
PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas,
determinar la recta de regresión de Y sobre X, es decir, a y b de modo
que, aproximadamente, Y=a + bX.
bXaY +=
(Ecuación recta de regresión de Y sobre X)
Conocida la recta de regresión, podemos estimar los valores de Y
correspondientes a distintos valores de X.
ii bxay +=ˆ
Valor predicho, o estimado
0 100 200 300 400
0
20
40
60
80
100
120
iy :valor real
0 100 200 300 400
0
20
40
60
80
100
120
iyˆ
Valor predicho: ii bxay +=ˆ
0 100 200 300 400
0
20
40
60
80
100
120
iyˆ
Valor predicho: ii bxay +=ˆ
Residuo: diferencia
entre el valor real
y el valor predicho
Statgraphics
R-cuadrado ó Coeficiente de Determinación ó % de variabilidad
explicada… (PIZARRA)
3. El modelo de regresión lineal.
Sabemos decidir si, aproximadamente, un conjunto (xi,yi) de puntos
(datos) se ajusta o no a Y=a+bX. Pero, teniendo en cuenta que esos
datos son una MUESTRA de una población…
¿SIGUE SIENDO “APROXIMADAMENTE”
VALIDO Y=a+bX cuando tomamos
NO una muestra (xi,yi), sino cuando consideramos
TODA LA POBLACION? ¿Qué queremos
decir por “aproximadamente”?
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Decimos que dos variables (poblacionales!)
están linealmente correlacionadas, si:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
2+ 4+ 5= Residuos siguen una normal N(0,σ)
Gráfico del Modelo Ajustado
Semanas
Prestamos
8 12 16 20 24 28 32
26
31
36
41
46
51
56
“La varianza de los residuos no depende de xi (homocedasticidad)”
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
2, 4 y 5 pueden contrastarte guardando los residuos, y procediendo
como en otras ocasiones.
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
3 lo contrastaremos con los gráficos de residuos,
y comprobando que no haya residuos atípicos.
Gráfico del Modelo Ajustado
Semanas
Prestamos
8 12 16 20 24 28 32
26
31
36
41
46
51
56
Homocedasticidad
“aceptable”
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
¿Cómo CONTRASTAR?
a.- Inspección del diagrama de dispersión, valores de los coeficientes
de correlación de Pearson y Spearman (si el ajuste no funciona bien
para la muestra, difícilmente lo hará para la población).
b.- Contraste tipo ANOVA sobre la existencia o no de correlación lineal.
COEFICIENTE DE DETERMINACION. = Contraste sobre la pendiente
de la recta de regresión.
c.- ¿Cómo podemos estar seguros de que, en la población, los coeficien-
tes de Pearson y Spearman no serían 0 (en cuyo caso, no habría
correlación lineal)? Contraste de hipótesis.
¿Cómo CONTRASTAR?
(Explicación: PIZARRA)
- Eliminación de parámetros (simplificación del modelo):
iii bxay ε++=
Si aceptamos el contraste H0: a=0, entonces la recta de regresión
que obtenemos es y = bx (una fórmula más sencilla): se dice entonces
que hemos simplificado nuestro modelo.
Y: variable explicada X: regresor
residuo
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
iii bxay ε++=
¿Qué hacer si falla alguna hipótesis? (algunas ideas sobre esto…)
(APUNTES)
Statgraphics
4. El modelo de regresión múltiple.
PROBLEMA: Hemos recogido datos sobre usuarios de mediana edad
de una biblioteca en la que además se realizan actividades tanto para
niños como para adolescentes y adultos, y estamos interesados en
analizar cuáles son las variables que determinan el nivel de satisfacción
de sus usuarios; las variables recogidas son: afición a la lectura, al cine,
a la música, número de hijos, renta… y, por supuesto, nivel de satisfac-
ción.
Aficion_lectura Num_hijos Aficion_cine Aficion_musica renta_mens Nivel_estudios Aficion_TV Satisfaccion
4 0 3 5 1200 4 4 4
3 0 3 4 1500 5 4 3
5 1 4 1 1800 3 5 5
2 2 1 3 1000 2 2 3
4 1 5 3 1300 3 4 4
3 1 3 4 1900 1 4 3
5 3 4 5 1300 4 5 5
3 0 2 3 1200 4 4 3
3 1 4 1 1600 2 5 4
1 3 2 1 1400 2 1 2
4 0 5 4 1700 3 4 4
5 0 5 5 2500 4 5 5
5 2 4 4 1100 5 3 5
5 2 5 3 1400 3 4 5
2 1 1 4 1800 4 3 3
4 2 5 4 2000 4 5 5
3 3 2 4 1500 4 3 3
1 1 2 3 1000 2 2 2
2 1 2 2 1300 3 3 3
1 0 2 5 1600 4 4 2
5 1 4 4 1800 3 4 4
2 2 3 3 1200 4 4 4
4 1 5 5 1700 2 5 4
4 1 4 3 1500 5 4 4
5 2 4 5 1100 5 5 5
El modelo de regresión simple es, a priori, poco realista (parece poco
probable que el nivel de satisfacción dependa de una única variable,
más bien lo natural es que en él intervengan varias variables). En con-
secuencia, ensayamos no con
sino con
Y=a+bX
Y=a+b1X1+ … +bnXn
Variable respuesta
(en nuestro caso,
“nivel de satisfacción”)
regresores
Satisfaccion = 0,686829 + 0,134472*Aficion_cine +
0,436889*Aficion_lectura - 0,0904825*Aficion_musica +
0,234494*Aficion_TV + 0,113699*Nivel_estudios + 0,206893*Num_hijos -
0,0000595998*renta_mens
Por ejemplo, en el problema anterior, la fórmula a la que llegaremos
es:
Aquí, Y=Satisfacción, X1=Afición_cine, X2=Aficion_lectura, etc.
Sirve para:
- predecir.
- detectar influencias (qué variables tienen más “poder” sobre la
variable que nos interesa, etc.)
Modelo de regresión múltiple:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
6. Las variables x1, x2, etc. no están linealmente correlacionadas
entre sí.
inni xbxbay ε++⋅⋅⋅++= 11
residuo
Modelo de regresión múltiple:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
6. Las variables x1, x2, etc. no están linealmente correlacionadas
entre sí.
2+ 4+ 5= Residuos siguen una normal N(0,σ)
inni xbxbay ε++⋅⋅⋅++= 11
residuo

Más contenido relacionado

La actualidad más candente

Consumo,ahorro e inversión
Consumo,ahorro e inversiónConsumo,ahorro e inversión
Consumo,ahorro e inversión
Miguel Angel
 
Solucionario de econometria
Solucionario de econometriaSolucionario de econometria
Solucionario de econometria
sistemasutb
 
Unidad6 fluctuaciones oa-da
Unidad6 fluctuaciones oa-daUnidad6 fluctuaciones oa-da
Unidad6 fluctuaciones oa-da
secedudis
 
Distribuciones discretas
Distribuciones discretasDistribuciones discretas
Rentabilidad
Rentabilidad Rentabilidad
Rentabilidad
Salma Sosa
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple
ALEX ABURTO MEZA
 
Decisiones de Inversión y Financiamiento
Decisiones de Inversión y FinanciamientoDecisiones de Inversión y Financiamiento
Decisiones de Inversión y FinanciamientoMario Duarte
 
terminos el VAN , TIR,TR, CO
terminos el VAN , TIR,TR, COterminos el VAN , TIR,TR, CO
terminos el VAN , TIR,TR, COMiriam Ajila
 
Endogeneidad
Endogeneidad Endogeneidad
Endogeneidad
Lizeth Misayauri
 
Módulo 2: La Restricción Presupuestaria
Módulo 2: La Restricción PresupuestariaMódulo 2: La Restricción Presupuestaria
Módulo 2: La Restricción PresupuestariaHoracio Santander
 
Matematica Financiera
Matematica FinancieraMatematica Financiera
Matematica Financiera
mzapanabeltran
 
Proyecto estadistica ejercicios UNIDEG
Proyecto estadistica ejercicios UNIDEGProyecto estadistica ejercicios UNIDEG
Proyecto estadistica ejercicios UNIDEG
luna_negra144
 
03 finanzas riesgo y rendimiento
03 finanzas riesgo y rendimiento03 finanzas riesgo y rendimiento
03 finanzas riesgo y rendimientoteffi
 
Valor del dinero en el tiempo
Valor del dinero en el tiempoValor del dinero en el tiempo
Valor del dinero en el tiempozulmaisabel
 
03.01 el mercado de bonos. características
03.01  el mercado de bonos. características03.01  el mercado de bonos. características
03.01 el mercado de bonos. característicasaprendiendosobrefinanzas
 
que es la economia
que es la economia que es la economia
que es la economia
Jose Leonardo Narvaez Velasco
 

La actualidad más candente (20)

Consumo,ahorro e inversión
Consumo,ahorro e inversiónConsumo,ahorro e inversión
Consumo,ahorro e inversión
 
Tasas de interes
Tasas de interesTasas de interes
Tasas de interes
 
La Curva de Phillips
La Curva de PhillipsLa Curva de Phillips
La Curva de Phillips
 
Introduccion a la econometria
Introduccion a la econometriaIntroduccion a la econometria
Introduccion a la econometria
 
Solucionario de econometria
Solucionario de econometriaSolucionario de econometria
Solucionario de econometria
 
Unidad6 fluctuaciones oa-da
Unidad6 fluctuaciones oa-daUnidad6 fluctuaciones oa-da
Unidad6 fluctuaciones oa-da
 
Distribuciones discretas
Distribuciones discretasDistribuciones discretas
Distribuciones discretas
 
Rentabilidad
Rentabilidad Rentabilidad
Rentabilidad
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple
 
Renta variable
Renta variableRenta variable
Renta variable
 
Decisiones de Inversión y Financiamiento
Decisiones de Inversión y FinanciamientoDecisiones de Inversión y Financiamiento
Decisiones de Inversión y Financiamiento
 
terminos el VAN , TIR,TR, CO
terminos el VAN , TIR,TR, COterminos el VAN , TIR,TR, CO
terminos el VAN , TIR,TR, CO
 
Endogeneidad
Endogeneidad Endogeneidad
Endogeneidad
 
Módulo 2: La Restricción Presupuestaria
Módulo 2: La Restricción PresupuestariaMódulo 2: La Restricción Presupuestaria
Módulo 2: La Restricción Presupuestaria
 
Matematica Financiera
Matematica FinancieraMatematica Financiera
Matematica Financiera
 
Proyecto estadistica ejercicios UNIDEG
Proyecto estadistica ejercicios UNIDEGProyecto estadistica ejercicios UNIDEG
Proyecto estadistica ejercicios UNIDEG
 
03 finanzas riesgo y rendimiento
03 finanzas riesgo y rendimiento03 finanzas riesgo y rendimiento
03 finanzas riesgo y rendimiento
 
Valor del dinero en el tiempo
Valor del dinero en el tiempoValor del dinero en el tiempo
Valor del dinero en el tiempo
 
03.01 el mercado de bonos. características
03.01  el mercado de bonos. características03.01  el mercado de bonos. características
03.01 el mercado de bonos. características
 
que es la economia
que es la economia que es la economia
que es la economia
 

Destacado

Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Robinho Navarrete
 
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSOPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
davp2012
 
Interpolación matricial
Interpolación matricialInterpolación matricial
Interpolación matricial
Pervys Rengifo
 
Análisis de Regresión Múltiple
Análisis de Regresión MúltipleAnálisis de Regresión Múltiple
Análisis de Regresión Múltiple
Universidad Nacional Mayor de San Marcos
 
Minimos cuadrados
Minimos cuadradosMinimos cuadrados
Minimos cuadrados
cesarvargas14
 
Regresión por Mínimos Cuadrados
Regresión por Mínimos CuadradosRegresión por Mínimos Cuadrados
Regresión por Mínimos Cuadrados
Salvador Martín Medina Torres
 
Método de Mínimos Cuadrados
Método de Mínimos CuadradosMétodo de Mínimos Cuadrados
Método de Mínimos Cuadrados
Arturo Sanchez Padilla
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlaciónAlejandro Ruiz
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicas
espanol
 

Destacado (11)

Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
 
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSOPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
 
Ajuste polinomial
Ajuste polinomialAjuste polinomial
Ajuste polinomial
 
Interpolación matricial
Interpolación matricialInterpolación matricial
Interpolación matricial
 
Análisis de Regresión Múltiple
Análisis de Regresión MúltipleAnálisis de Regresión Múltiple
Análisis de Regresión Múltiple
 
Minimos cuadrados
Minimos cuadradosMinimos cuadrados
Minimos cuadrados
 
Regresión por Mínimos Cuadrados
Regresión por Mínimos CuadradosRegresión por Mínimos Cuadrados
Regresión por Mínimos Cuadrados
 
Método de Mínimos Cuadrados
Método de Mínimos CuadradosMétodo de Mínimos Cuadrados
Método de Mínimos Cuadrados
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlación
 
Regresión lineal múltiple
Regresión lineal múltipleRegresión lineal múltiple
Regresión lineal múltiple
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicas
 

Similar a Regresion simple

Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
miguelescobarrivero
 
Regresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .pptRegresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .ppt
JuanJosOrRojas
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdf
LizbethTito2
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
movapa
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Edgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
Edgar López
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variables
Santy D
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdf
jenniferps1
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
Manuel Chavez Leandro
 
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggMat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Francisco Baculima Hidalgo
 
T6
T6T6
Paola
PaolaPaola
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
Edgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
Edgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
Edgar López
 
Manual spss diana
Manual spss dianaManual spss diana
Manual spss diana
Diana Erazo
 

Similar a Regresion simple (20)

Tema 6
Tema 6Tema 6
Tema 6
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
 
Regresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .pptRegresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .ppt
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdf
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variables
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdf
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggMat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
 
T6
T6T6
T6
 
Paola
PaolaPaola
Paola
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
T6
T6T6
T6
 
Manual spss diana
Manual spss dianaManual spss diana
Manual spss diana
 

Último

FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
El Fortí
 
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
UNIDAD DE APRENDIZAJE DEL MES  Junio 2024UNIDAD DE APRENDIZAJE DEL MES  Junio 2024
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
EdwardYumbato1
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
GallardoJahse
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
Distea V región
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Monseespinoza6
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
cintiat3400
 
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptxCLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
LilianaRivera778668
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Txema Gs
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
20minutos
 
Introducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BIIntroducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BI
arleyo2006
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
https://gramadal.wordpress.com/
 
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNETPRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
CESAR MIJAEL ESPINOZA SALAZAR
 
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
rosannatasaycoyactay
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
auxsoporte
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
JAVIER SOLIS NOYOLA
 
Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1
MauricioSnchez83
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
Edurne Navarro Bueno
 
corpus-christi-sesion-de-aprendizaje.pdf
corpus-christi-sesion-de-aprendizaje.pdfcorpus-christi-sesion-de-aprendizaje.pdf
corpus-christi-sesion-de-aprendizaje.pdf
YolandaRodriguezChin
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
HuallpaSamaniegoSeba
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
pablomarin116
 

Último (20)

FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdfFORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
FORTI-JUNIO 2024. CIENCIA, EDUCACION, CULTURA,pdf
 
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
UNIDAD DE APRENDIZAJE DEL MES  Junio 2024UNIDAD DE APRENDIZAJE DEL MES  Junio 2024
UNIDAD DE APRENDIZAJE DEL MES Junio 2024
 
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptxAutomatización de proceso de producción de la empresa Gloria SA (1).pptx
Automatización de proceso de producción de la empresa Gloria SA (1).pptx
 
El lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libroEl lugar mas bonito del mundo resumen del libro
El lugar mas bonito del mundo resumen del libro
 
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
Productos contestatos de la Séptima sesión ordinaria de CTE y TIFC para Docen...
 
Junio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividadesJunio 2024 Fotocopiables Ediba actividades
Junio 2024 Fotocopiables Ediba actividades
 
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptxCLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
CLASE N.1 ANÁLISIS ADMINISTRATIVO EMPRESARIAL presentación.pptx
 
Testimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdfTestimonio Paco Z PATRONATO_Valencia_24.pdf
Testimonio Paco Z PATRONATO_Valencia_24.pdf
 
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
Horarios y fechas de la PAU 2024 en la Comunidad Valenciana.
 
Introducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BIIntroducción a la ciencia de datos con power BI
Introducción a la ciencia de datos con power BI
 
Sesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdfSesión: El fundamento del gobierno de Dios.pdf
Sesión: El fundamento del gobierno de Dios.pdf
 
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNETPRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
PRESENTACION DE LA SEMANA NUMERO 8 EN APLICACIONES DE INTERNET
 
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
3° UNIDAD 3 CUIDAMOS EL AMBIENTE RECICLANDO EN FAMILIA 933623393 PROF YESSENI...
 
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24CALENDARIZACION DEL MES DE JUNIO - JULIO 24
CALENDARIZACION DEL MES DE JUNIO - JULIO 24
 
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
ROMPECABEZAS DE ECUACIONES DE PRIMER GRADO OLIMPIADA DE PARÍS 2024. Por JAVIE...
 
Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1Mauricio-Presentación-Vacacional- 2024-1
Mauricio-Presentación-Vacacional- 2024-1
 
Proceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de PamplonaProceso de admisiones en escuelas infantiles de Pamplona
Proceso de admisiones en escuelas infantiles de Pamplona
 
corpus-christi-sesion-de-aprendizaje.pdf
corpus-christi-sesion-de-aprendizaje.pdfcorpus-christi-sesion-de-aprendizaje.pdf
corpus-christi-sesion-de-aprendizaje.pdf
 
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
Varón de 30 años acude a consulta por presentar hipertensión arterial de reci...
 
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.Friedrich Nietzsche. Presentación de 2 de Bachillerato.
Friedrich Nietzsche. Presentación de 2 de Bachillerato.
 

Regresion simple

  • 1. Tema 7: Regresión Simple y Múltiple
  • 2. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos dicen que la fórmula Si damos valores a la variable Días (nº días transcurridos desde la apertura de la biblioteca… DíasprestamosN 3'025º +=
  • 3. 0 100 200 300 400 Días 0 20 40 60 80 100 120 Nºprestamos DíasprestamosN 3'025º +=
  • 4. Si dos variables X e Y está relacionadas mediante una expresión del tipo Y=a+bX, la gráfica que relaciona los valores de X e Y es una línea recta, y se dice que Y=a+bX es la ecuación de dicha recta; el recíproco es cierto, es decir, si la gráfica que relaciona X e Y es una recta, entre ambas existe una relación del tipo Y=a+bX. En ese caso, decimos que entre X e Y hay una relación de tipo lineal. En la realidad, no nos encontramos fórmulas tan “redondas”, pero sí nos encontramos fenómenos que pueden aproximarse por ellas.
  • 5. Días Nº prestamos 5 25 20 32 35 40 50 39 65 47 80 51 95 56 110 54 135 69 150 72 165 76 180 77 195 86 210 90 235 98 250 102 265 105 280 110 295 113 310 120 EJEMPLO: Supongamos que una biblioteca proporcionó los siguientes datos, a lo largo de su primer año de vida
  • 6. Días Nºprestamos 0 100 200 300 400 0 20 40 60 80 100 120
  • 7. APROXIMADAMENTE, Nº prestamos = 24,5529 + 0,301579*Días En este caso, diríamos que las variables Nº préstamos y Días están linealmente correlacionadas, y que lo de arriba es la ecuación de la recta de regresión de Nº préstamos sobre Días. ¿Para qué nos sirve? (1) para conocer leyes empíricas; (2) para predecir el valor de una cierta variable
  • 8. PROBLEMAS: Dadas dos variables X e Y, continuas 1.- [Correlación] ¿Existe una cierta relación entre ellas, o por el contrario son independientes? En el primer caso, hablamos de que entre X e Y hay correlación; en el segundo, decimos que son incorreladas 2.- [Correlación lineal] Suponiendo que entre X e Y hay correlación, ¿están linealmente correlacionadas, es decir, funciona suficientemente bien un modelo del tipo Y = a+bX para predecir Y a partir de X? ¿Cuáles son los “óptimos” valores para a y b, es decir, los que producen “mejores” esti- maciones? 3.- [Otros tipos de correlación] ¿Hay algún modelo mejor que el lineal que permita estimar Y a partir de X? Por ejemplo, Cuadrático: Y=a+bX+bX2 Exponencial: Y=a bx … Otro ejemplo (Leyes bibliométricas)
  • 9. Curva logística del crecimiento de la información
  • 10. 1. Distribuciones bidimensionales. Correlación. Cuando en una población registramos simultáneamente los valores de dos variables X e Y, decimos que estamos ante una distribución BIDIMENSIONAL (PIZARRA: distribuciones marginales) Los datos relativos a una distribución bidimensional se pueden representar gráficamente mediante una NUBE DE PUNTOS, o DIAGRAMA DE DISPERSION (PIZARRA) Si la nube de puntos se ajusta aproximadamente a una curva, diremos que las variables están correlacionadas, es decir, que existe una cierta relación entre ellas (y buscaremos cuál es la expresión, la “fórmula” que mejor aproxima una de ellas partir de la otra); en caso contrario, decimos que las variables son incorreladas, es decir, que no tienen relación.
  • 11. 0 100 200 300 400 0 20 40 60 80 100 120 0 100 200 300 400 0 3 6 9 12 15 Hay correlación Incorreladas
  • 12. Además de la “inspección” de la nube de puntos, hay métodos más exactos para evaluar la existencia o no de correlación.
  • 13. Si la nube de puntos parece ajustarse en torno a alguna curva (es decir, si hay correlación), la forma de dicha curva nos indica el tipo de correlación. Si la nube de puntos parece agruparse en torno a una recta, diremos que hay correlación lineal, o que las variables están linealmente correlacionadas. 0 100 200 300 400 0 20 40 60 80 100 120
  • 14. Si las variables están linealmente correlacionadas, entonces tiene sentido buscar la recta que “mejor se ajusta” a la nube de puntos, es decir, la recta que globalmente está más cerca del conjunto de puntos. Si nuestra intención al hacer eso es la de estimar Y a partir de X, entonces encontrar dicha recta es equivalente a encontrar la mejor aproximación Y=a+bX (RECTA DE REGRESION DE Y SOBRE X) ¿Cómo tomar a, b para que la aproximación sea “óptima”?
  • 15. 2. Regresión lineal sobre un conjunto de puntos. PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar si las variables X e Y están o no linealmente correlacionadas, y la fuerza de dicha correlación lineal. PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas, determinar la recta de regresión de Y sobre X, es decir, a y b de modo que, aproximadamente, Y=a + bX.
  • 16. PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar si las variables X e Y están o no linealmente correlacionadas, y la fuerza de dicha correlación lineal. - Nube de puntos. - Coeficiente de correlación lineal de Pearson. (PIZARRA) - Coeficiente de correlación lineal de Spearman. - Coeficiente de determinación ó R-cuadrado ó % de variabilidad explicada.
  • 17. PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas, determinar la recta de regresión de Y sobre X, es decir, a y b de modo que, aproximadamente, Y=a + bX. bXaY += (Ecuación recta de regresión de Y sobre X) Conocida la recta de regresión, podemos estimar los valores de Y correspondientes a distintos valores de X. ii bxay +=ˆ Valor predicho, o estimado
  • 18. 0 100 200 300 400 0 20 40 60 80 100 120 iy :valor real
  • 19. 0 100 200 300 400 0 20 40 60 80 100 120 iyˆ Valor predicho: ii bxay +=ˆ
  • 20. 0 100 200 300 400 0 20 40 60 80 100 120 iyˆ Valor predicho: ii bxay +=ˆ Residuo: diferencia entre el valor real y el valor predicho
  • 21. Statgraphics R-cuadrado ó Coeficiente de Determinación ó % de variabilidad explicada… (PIZARRA)
  • 22. 3. El modelo de regresión lineal. Sabemos decidir si, aproximadamente, un conjunto (xi,yi) de puntos (datos) se ajusta o no a Y=a+bX. Pero, teniendo en cuenta que esos datos son una MUESTRA de una población… ¿SIGUE SIENDO “APROXIMADAMENTE” VALIDO Y=a+bX cuando tomamos NO una muestra (xi,yi), sino cuando consideramos TODA LA POBLACION? ¿Qué queremos decir por “aproximadamente”?
  • 23. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Decimos que dos variables (poblacionales!) están linealmente correlacionadas, si: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 2+ 4+ 5= Residuos siguen una normal N(0,σ)
  • 24. Gráfico del Modelo Ajustado Semanas Prestamos 8 12 16 20 24 28 32 26 31 36 41 46 51 56 “La varianza de los residuos no depende de xi (homocedasticidad)”
  • 25. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 2, 4 y 5 pueden contrastarte guardando los residuos, y procediendo como en otras ocasiones.
  • 26. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 3 lo contrastaremos con los gráficos de residuos, y comprobando que no haya residuos atípicos.
  • 27. Gráfico del Modelo Ajustado Semanas Prestamos 8 12 16 20 24 28 32 26 31 36 41 46 51 56 Homocedasticidad “aceptable”
  • 28. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. ¿Cómo CONTRASTAR?
  • 29. a.- Inspección del diagrama de dispersión, valores de los coeficientes de correlación de Pearson y Spearman (si el ajuste no funciona bien para la muestra, difícilmente lo hará para la población). b.- Contraste tipo ANOVA sobre la existencia o no de correlación lineal. COEFICIENTE DE DETERMINACION. = Contraste sobre la pendiente de la recta de regresión. c.- ¿Cómo podemos estar seguros de que, en la población, los coeficien- tes de Pearson y Spearman no serían 0 (en cuyo caso, no habría correlación lineal)? Contraste de hipótesis. ¿Cómo CONTRASTAR? (Explicación: PIZARRA)
  • 30. - Eliminación de parámetros (simplificación del modelo): iii bxay ε++= Si aceptamos el contraste H0: a=0, entonces la recta de regresión que obtenemos es y = bx (una fórmula más sencilla): se dice entonces que hemos simplificado nuestro modelo.
  • 31. Y: variable explicada X: regresor residuo 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. iii bxay ε++= ¿Qué hacer si falla alguna hipótesis? (algunas ideas sobre esto…) (APUNTES) Statgraphics
  • 32. 4. El modelo de regresión múltiple. PROBLEMA: Hemos recogido datos sobre usuarios de mediana edad de una biblioteca en la que además se realizan actividades tanto para niños como para adolescentes y adultos, y estamos interesados en analizar cuáles son las variables que determinan el nivel de satisfacción de sus usuarios; las variables recogidas son: afición a la lectura, al cine, a la música, número de hijos, renta… y, por supuesto, nivel de satisfac- ción.
  • 33. Aficion_lectura Num_hijos Aficion_cine Aficion_musica renta_mens Nivel_estudios Aficion_TV Satisfaccion 4 0 3 5 1200 4 4 4 3 0 3 4 1500 5 4 3 5 1 4 1 1800 3 5 5 2 2 1 3 1000 2 2 3 4 1 5 3 1300 3 4 4 3 1 3 4 1900 1 4 3 5 3 4 5 1300 4 5 5 3 0 2 3 1200 4 4 3 3 1 4 1 1600 2 5 4 1 3 2 1 1400 2 1 2 4 0 5 4 1700 3 4 4 5 0 5 5 2500 4 5 5 5 2 4 4 1100 5 3 5 5 2 5 3 1400 3 4 5 2 1 1 4 1800 4 3 3 4 2 5 4 2000 4 5 5 3 3 2 4 1500 4 3 3 1 1 2 3 1000 2 2 2 2 1 2 2 1300 3 3 3 1 0 2 5 1600 4 4 2 5 1 4 4 1800 3 4 4 2 2 3 3 1200 4 4 4 4 1 5 5 1700 2 5 4 4 1 4 3 1500 5 4 4 5 2 4 5 1100 5 5 5
  • 34. El modelo de regresión simple es, a priori, poco realista (parece poco probable que el nivel de satisfacción dependa de una única variable, más bien lo natural es que en él intervengan varias variables). En con- secuencia, ensayamos no con sino con Y=a+bX Y=a+b1X1+ … +bnXn Variable respuesta (en nuestro caso, “nivel de satisfacción”) regresores
  • 35. Satisfaccion = 0,686829 + 0,134472*Aficion_cine + 0,436889*Aficion_lectura - 0,0904825*Aficion_musica + 0,234494*Aficion_TV + 0,113699*Nivel_estudios + 0,206893*Num_hijos - 0,0000595998*renta_mens Por ejemplo, en el problema anterior, la fórmula a la que llegaremos es: Aquí, Y=Satisfacción, X1=Afición_cine, X2=Aficion_lectura, etc. Sirve para: - predecir. - detectar influencias (qué variables tienen más “poder” sobre la variable que nos interesa, etc.)
  • 36. Modelo de regresión múltiple: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 6. Las variables x1, x2, etc. no están linealmente correlacionadas entre sí. inni xbxbay ε++⋅⋅⋅++= 11 residuo
  • 37. Modelo de regresión múltiple: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 6. Las variables x1, x2, etc. no están linealmente correlacionadas entre sí. 2+ 4+ 5= Residuos siguen una normal N(0,σ) inni xbxbay ε++⋅⋅⋅++= 11 residuo