SlideShare una empresa de Scribd logo
1 de 37
Tema 7: Regresión Simple
y Múltiple
EJEMPLO:
Aproxima bien el número de préstamos que efectúa una biblioteca a
lo largo de su primer año de vida.
Nos dicen que la fórmula
Si damos valores a la variable Días (nº días transcurridos desde
la apertura de la biblioteca…
DíasprestamosN 3'025º +=
0 100 200 300 400
Días
0
20
40
60
80
100
120
Nºprestamos
DíasprestamosN 3'025º +=
Si dos variables X e Y está relacionadas mediante una expresión
del tipo Y=a+bX, la gráfica que relaciona los valores de X e Y es
una línea recta, y se dice que Y=a+bX es la ecuación de dicha
recta; el recíproco es cierto, es decir, si la gráfica que
relaciona X e Y es una recta, entre ambas existe una relación del
tipo Y=a+bX. En ese caso, decimos que entre X e Y hay una
relación de tipo lineal.
En la realidad, no nos encontramos fórmulas tan “redondas”, pero
sí nos encontramos fenómenos que pueden aproximarse por ellas.
Días
Nº
prestamos
5 25
20 32
35 40
50 39
65 47
80 51
95 56
110 54
135 69
150 72
165 76
180 77
195 86
210 90
235 98
250 102
265 105
280 110
295 113
310 120
EJEMPLO: Supongamos que una biblioteca
proporcionó los siguientes datos, a lo largo
de su primer año de vida
Días
Nºprestamos
0 100 200 300 400
0
20
40
60
80
100
120
APROXIMADAMENTE,
Nº prestamos = 24,5529 + 0,301579*Días
En este caso, diríamos que las variables Nº préstamos y Días están
linealmente correlacionadas, y que lo de arriba es la ecuación de
la recta de regresión de Nº préstamos sobre Días.
¿Para qué nos sirve? (1) para conocer leyes
empíricas; (2) para predecir el valor de una cierta
variable
PROBLEMAS: Dadas dos variables X e Y, continuas
1.- [Correlación] ¿Existe una cierta relación entre ellas, o por el contrario son
independientes? En el primer caso, hablamos de que entre X e Y
hay correlación; en el segundo, decimos que son incorreladas
2.- [Correlación lineal] Suponiendo que entre X e Y hay correlación, ¿están
linealmente correlacionadas, es decir, funciona suficientemente bien un
modelo del tipo Y = a+bX para predecir Y a partir de X? ¿Cuáles son los
“óptimos” valores para a y b, es decir, los que producen “mejores” esti-
maciones?
3.- [Otros tipos de correlación] ¿Hay algún modelo mejor que el lineal
que permita estimar Y a partir de X? Por ejemplo,
Cuadrático: Y=a+bX+bX2
Exponencial: Y=a bx
…
Otro ejemplo (Leyes bibliométricas)
Curva logística del crecimiento
de la información
1. Distribuciones bidimensionales. Correlación.
Cuando en una población registramos simultáneamente los valores
de dos variables X e Y, decimos que estamos ante una distribución
BIDIMENSIONAL (PIZARRA: distribuciones marginales)
Los datos relativos a una distribución bidimensional se pueden
representar gráficamente mediante una NUBE DE PUNTOS, o
DIAGRAMA DE DISPERSION (PIZARRA)
Si la nube de puntos se ajusta aproximadamente a una curva, diremos
que las variables están correlacionadas, es decir, que existe una cierta
relación entre ellas (y buscaremos cuál es la expresión, la “fórmula” que
mejor aproxima una de ellas partir de la otra); en caso contrario, decimos
que las variables son incorreladas, es decir, que no tienen relación.
0 100 200 300 400
0
20
40
60
80
100
120
0 100 200 300 400
0
3
6
9
12
15
Hay correlación
Incorreladas
Además de la “inspección” de la nube de puntos,
hay métodos más exactos para evaluar la existencia
o no de correlación.
Si la nube de puntos parece ajustarse en torno a alguna curva (es
decir, si hay correlación), la forma de dicha curva nos indica el tipo
de correlación. Si la nube de puntos parece agruparse en torno a
una recta, diremos que hay correlación lineal, o que las variables
están linealmente correlacionadas.
0 100 200 300 400
0
20
40
60
80
100
120
Si las variables están linealmente correlacionadas, entonces tiene
sentido buscar la recta que “mejor se ajusta” a la nube de puntos,
es decir, la recta que globalmente está más cerca del conjunto de
puntos. Si nuestra intención al hacer eso es la de estimar Y a partir
de X, entonces encontrar dicha recta es equivalente a encontrar la
mejor aproximación
Y=a+bX (RECTA DE REGRESION DE Y SOBRE X)
¿Cómo tomar a, b para que la aproximación sea
“óptima”?
2. Regresión lineal sobre un conjunto de puntos.
PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar
si las variables X e Y están o no linealmente correlacionadas, y la
fuerza de dicha correlación lineal.
PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas,
determinar la recta de regresión de Y sobre X, es decir, a y b de modo
que, aproximadamente, Y=a + bX.
PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar
si las variables X e Y están o no linealmente correlacionadas, y la
fuerza de dicha correlación lineal.
- Nube de puntos.
- Coeficiente de correlación lineal de Pearson. (PIZARRA)
- Coeficiente de correlación lineal de Spearman.
- Coeficiente de determinación ó R-cuadrado ó % de variabilidad
explicada.
PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas,
determinar la recta de regresión de Y sobre X, es decir, a y b de modo
que, aproximadamente, Y=a + bX.
bXaY +=
(Ecuación recta de regresión de Y sobre X)
Conocida la recta de regresión, podemos estimar los valores de Y
correspondientes a distintos valores de X.
ii bxay +=ˆ
Valor predicho, o estimado
0 100 200 300 400
0
20
40
60
80
100
120
iy :valor real
0 100 200 300 400
0
20
40
60
80
100
120
iyˆ
Valor predicho: ii bxay +=ˆ
0 100 200 300 400
0
20
40
60
80
100
120
iyˆ
Valor predicho: ii bxay +=ˆ
Residuo: diferencia
entre el valor real
y el valor predicho
Statgraphics
R-cuadrado ó Coeficiente de Determinación ó % de variabilidad
explicada… (PIZARRA)
3. El modelo de regresión lineal.
Sabemos decidir si, aproximadamente, un conjunto (xi,yi) de puntos
(datos) se ajusta o no a Y=a+bX. Pero, teniendo en cuenta que esos
datos son una MUESTRA de una población…
¿SIGUE SIENDO “APROXIMADAMENTE”
VALIDO Y=a+bX cuando tomamos
NO una muestra (xi,yi), sino cuando consideramos
TODA LA POBLACION? ¿Qué queremos
decir por “aproximadamente”?
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Decimos que dos variables (poblacionales!)
están linealmente correlacionadas, si:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
2+ 4+ 5= Residuos siguen una normal N(0,σ)
Gráfico del Modelo Ajustado
Semanas
Prestamos
8 12 16 20 24 28 32
26
31
36
41
46
51
56
“La varianza de los residuos no depende de xi (homocedasticidad)”
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
2, 4 y 5 pueden contrastarte guardando los residuos, y procediendo
como en otras ocasiones.
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
3 lo contrastaremos con los gráficos de residuos,
y comprobando que no haya residuos atípicos.
Gráfico del Modelo Ajustado
Semanas
Prestamos
8 12 16 20 24 28 32
26
31
36
41
46
51
56
Homocedasticidad
“aceptable”
Modelo de regresión lineal:
iii bxay ε++=
Y: variable explicada X: regresor
residuo
Hipótesis básicas:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
¿Cómo CONTRASTAR?
a.- Inspección del diagrama de dispersión, valores de los coeficientes
de correlación de Pearson y Spearman (si el ajuste no funciona bien
para la muestra, difícilmente lo hará para la población).
b.- Contraste tipo ANOVA sobre la existencia o no de correlación lineal.
COEFICIENTE DE DETERMINACION. = Contraste sobre la pendiente
de la recta de regresión.
c.- ¿Cómo podemos estar seguros de que, en la población, los coeficien-
tes de Pearson y Spearman no serían 0 (en cuyo caso, no habría
correlación lineal)? Contraste de hipótesis.
¿Cómo CONTRASTAR?
(Explicación: PIZARRA)
- Eliminación de parámetros (simplificación del modelo):
iii bxay ε++=
Si aceptamos el contraste H0: a=0, entonces la recta de regresión
que obtenemos es y = bx (una fórmula más sencilla): se dice entonces
que hemos simplificado nuestro modelo.
Y: variable explicada X: regresor
residuo
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
iii bxay ε++=
¿Qué hacer si falla alguna hipótesis? (algunas ideas sobre esto…)
(APUNTES)
Statgraphics
4. El modelo de regresión múltiple.
PROBLEMA: Hemos recogido datos sobre usuarios de mediana edad
de una biblioteca en la que además se realizan actividades tanto para
niños como para adolescentes y adultos, y estamos interesados en
analizar cuáles son las variables que determinan el nivel de satisfacción
de sus usuarios; las variables recogidas son: afición a la lectura, al cine,
a la música, número de hijos, renta… y, por supuesto, nivel de satisfac-
ción.
Aficion_lectura Num_hijos Aficion_cine Aficion_musica renta_mens Nivel_estudios Aficion_TV Satisfaccion
4 0 3 5 1200 4 4 4
3 0 3 4 1500 5 4 3
5 1 4 1 1800 3 5 5
2 2 1 3 1000 2 2 3
4 1 5 3 1300 3 4 4
3 1 3 4 1900 1 4 3
5 3 4 5 1300 4 5 5
3 0 2 3 1200 4 4 3
3 1 4 1 1600 2 5 4
1 3 2 1 1400 2 1 2
4 0 5 4 1700 3 4 4
5 0 5 5 2500 4 5 5
5 2 4 4 1100 5 3 5
5 2 5 3 1400 3 4 5
2 1 1 4 1800 4 3 3
4 2 5 4 2000 4 5 5
3 3 2 4 1500 4 3 3
1 1 2 3 1000 2 2 2
2 1 2 2 1300 3 3 3
1 0 2 5 1600 4 4 2
5 1 4 4 1800 3 4 4
2 2 3 3 1200 4 4 4
4 1 5 5 1700 2 5 4
4 1 4 3 1500 5 4 4
5 2 4 5 1100 5 5 5
El modelo de regresión simple es, a priori, poco realista (parece poco
probable que el nivel de satisfacción dependa de una única variable,
más bien lo natural es que en él intervengan varias variables). En con-
secuencia, ensayamos no con
sino con
Y=a+bX
Y=a+b1X1+ … +bnXn
Variable respuesta
(en nuestro caso,
“nivel de satisfacción”)
regresores
Satisfaccion = 0,686829 + 0,134472*Aficion_cine +
0,436889*Aficion_lectura - 0,0904825*Aficion_musica +
0,234494*Aficion_TV + 0,113699*Nivel_estudios + 0,206893*Num_hijos -
0,0000595998*renta_mens
Por ejemplo, en el problema anterior, la fórmula a la que llegaremos
es:
Aquí, Y=Satisfacción, X1=Afición_cine, X2=Aficion_lectura, etc.
Sirve para:
- predecir.
- detectar influencias (qué variables tienen más “poder” sobre la
variable que nos interesa, etc.)
Modelo de regresión múltiple:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
6. Las variables x1, x2, etc. no están linealmente correlacionadas
entre sí.
inni xbxbay ε++⋅⋅⋅++= 11
residuo
Modelo de regresión múltiple:
1.
2. Los residuos tienen media 0.
3. La varianza de los residuos no depende de xi (homocedasticidad)
4. Los residuos son normales.
5. Los residuos son aleatorios.
6. Las variables x1, x2, etc. no están linealmente correlacionadas
entre sí.
2+ 4+ 5= Residuos siguen una normal N(0,σ)
inni xbxbay ε++⋅⋅⋅++= 11
residuo

Más contenido relacionado

La actualidad más candente

Clase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloClase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloIvan Nuñez Salinas
 
11 Relaciones Entre Variables
11 Relaciones Entre Variables11 Relaciones Entre Variables
11 Relaciones Entre VariablesJuan Timana
 
Regresión Lineal
Regresión LinealRegresión Lineal
Regresión LinealArles Ramos
 
DISTRIBUCION DE FRECUENCIAS
DISTRIBUCION DE FRECUENCIASDISTRIBUCION DE FRECUENCIAS
DISTRIBUCION DE FRECUENCIASVerónica Taipe
 
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralEstadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralAngel Villalpando
 
Métodos no paramétricos análisis de datos ordenados por rango
Métodos no paramétricos análisis de datos ordenados por rangoMétodos no paramétricos análisis de datos ordenados por rango
Métodos no paramétricos análisis de datos ordenados por rangoAlejandro Ruiz
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersionAndreinamlh
 
Histogramas de frecuencia.pdf
Histogramas de frecuencia.pdfHistogramas de frecuencia.pdf
Histogramas de frecuencia.pdfYerko Bravo
 
Gamma presentacion
Gamma presentacionGamma presentacion
Gamma presentacionKerll Eve
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Robinho Navarrete
 
3 tipos de análisis bivariado.
3 tipos de análisis bivariado.3 tipos de análisis bivariado.
3 tipos de análisis bivariado.Cookie179
 
Prueba u de mann-whitney
Prueba u de mann-whitneyPrueba u de mann-whitney
Prueba u de mann-whitneyJOHNNY28000
 
Medidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadMedidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadEnedina Rodriguez
 

La actualidad más candente (20)

Clase de estimacion puntual y intervalo
Clase de estimacion puntual y intervaloClase de estimacion puntual y intervalo
Clase de estimacion puntual y intervalo
 
11 Relaciones Entre Variables
11 Relaciones Entre Variables11 Relaciones Entre Variables
11 Relaciones Entre Variables
 
Regresión Lineal
Regresión LinealRegresión Lineal
Regresión Lineal
 
DISTRIBUCION DE FRECUENCIAS
DISTRIBUCION DE FRECUENCIASDISTRIBUCION DE FRECUENCIAS
DISTRIBUCION DE FRECUENCIAS
 
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia CentralEstadistica Inferencial - Medidas de Dispersion y Tendencia Central
Estadistica Inferencial - Medidas de Dispersion y Tendencia Central
 
Métodos no paramétricos análisis de datos ordenados por rango
Métodos no paramétricos análisis de datos ordenados por rangoMétodos no paramétricos análisis de datos ordenados por rango
Métodos no paramétricos análisis de datos ordenados por rango
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Histogramas de frecuencia.pdf
Histogramas de frecuencia.pdfHistogramas de frecuencia.pdf
Histogramas de frecuencia.pdf
 
Gamma presentacion
Gamma presentacionGamma presentacion
Gamma presentacion
 
Análisis de Regresión Múltiple
Análisis de Regresión MúltipleAnálisis de Regresión Múltiple
Análisis de Regresión Múltiple
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
 
3 tipos de análisis bivariado.
3 tipos de análisis bivariado.3 tipos de análisis bivariado.
3 tipos de análisis bivariado.
 
REGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLEREGRESIÓN LINEAL SIMPLE
REGRESIÓN LINEAL SIMPLE
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Análisis de regresión simple.
Análisis de regresión simple.Análisis de regresión simple.
Análisis de regresión simple.
 
Prueba u de mann-whitney
Prueba u de mann-whitneyPrueba u de mann-whitney
Prueba u de mann-whitney
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
5. regresión lineal multiple
5.  regresión lineal multiple5.  regresión lineal multiple
5. regresión lineal multiple
 
Medidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidadMedidas de dispersión, variación o variabilidad
Medidas de dispersión, variación o variabilidad
 
18. Regresión Lineal
18. Regresión Lineal18. Regresión Lineal
18. Regresión Lineal
 

Destacado

OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSOPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSdavp2012
 
Interpolación matricial
Interpolación matricialInterpolación matricial
Interpolación matricialPervys Rengifo
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlaciónAlejandro Ruiz
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicasespanol
 

Destacado (9)

OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOSOPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
OPERACIONES CON MATRICES, INTERPOLACIONES, AJUSTE DE CURVAS, POLINOMIOS
 
Ajuste polinomial
Ajuste polinomialAjuste polinomial
Ajuste polinomial
 
Interpolación matricial
Interpolación matricialInterpolación matricial
Interpolación matricial
 
Minimos cuadrados
Minimos cuadradosMinimos cuadrados
Minimos cuadrados
 
Regresión por Mínimos Cuadrados
Regresión por Mínimos CuadradosRegresión por Mínimos Cuadrados
Regresión por Mínimos Cuadrados
 
Método de Mínimos Cuadrados
Método de Mínimos CuadradosMétodo de Mínimos Cuadrados
Método de Mínimos Cuadrados
 
Regresión lineal y correlación
Regresión lineal y correlaciónRegresión lineal y correlación
Regresión lineal y correlación
 
Regresión lineal múltiple
Regresión lineal múltipleRegresión lineal múltiple
Regresión lineal múltiple
 
Paginas de matematicas
Paginas de matematicasPaginas de matematicas
Paginas de matematicas
 

Similar a Regresion simple

Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealmiguelescobarrivero
 
Regresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .pptRegresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .pptJuanJosOrRojas
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdfLizbethTito2
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicamovapa
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Edgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variablesSanty D
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfjenniferps1
 
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggMat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggFrancisco Baculima Hidalgo
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgEdgar López
 
Manual spss diana
Manual spss dianaManual spss diana
Manual spss dianaDiana Erazo
 

Similar a Regresion simple (20)

Tema 6
Tema 6Tema 6
Tema 6
 
Regresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión linealRegresión lineal,ajuste de curva,tipos de regresión lineal
Regresión lineal,ajuste de curva,tipos de regresión lineal
 
Regresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .pptRegresión y correlación para trabajos de educación .ppt
Regresión y correlación para trabajos de educación .ppt
 
tema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdftema2-estadistica-bidimensional.pdf
tema2-estadistica-bidimensional.pdf
 
Unidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monicaUnidad nº 1 regresion y correlacion monica
Unidad nº 1 regresion y correlacion monica
 
Regresión lineal
Regresión linealRegresión lineal
Regresión lineal
 
Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01Expocap5tablas bidimengresion upg-110916181018-phpapp01
Expocap5tablas bidimengresion upg-110916181018-phpapp01
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Medidas de asoación entre variables
Medidas de asoación entre variablesMedidas de asoación entre variables
Medidas de asoación entre variables
 
CLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdfCLASE-8 Regresión y correlación (dicotomicas).pdf
CLASE-8 Regresión y correlación (dicotomicas).pdf
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12ggggggggggggggggggggggggggMat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
Mat 50140116 regr_ simple_2011_12gggggggggggggggggggggggggg
 
T6
T6T6
T6
 
Paola
PaolaPaola
Paola
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
Correlacion
CorrelacionCorrelacion
Correlacion
 
Presentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upgPresentacion 5 diapost_regresion-upg
Presentacion 5 diapost_regresion-upg
 
T6
T6T6
T6
 
Manual spss diana
Manual spss dianaManual spss diana
Manual spss diana
 

Último

NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfUPTAIDELTACHIRA
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxiemerc2024
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAJAVIER SOLIS NOYOLA
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docxEliaHernndez7
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfFrancisco158360
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Alejandrino Halire Ccahuana
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...JAVIER SOLIS NOYOLA
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaDecaunlz
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAEl Fortí
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfpatriciaines1993
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024IES Vicent Andres Estelles
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSYadi Campos
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptxRigoTito
 

Último (20)

NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLAACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
ACERTIJO DE POSICIÓN DE CORREDORES EN LA OLIMPIADA. Por JAVIER SOLIS NOYOLA
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
🦄💫4° SEM32 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
 
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdfCurso = Metodos Tecnicas y Modelos de Enseñanza.pdf
Curso = Metodos Tecnicas y Modelos de Enseñanza.pdf
 
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
Lecciones 05 Esc. Sabática. Fe contra todo pronóstico.
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
LABERINTOS DE DISCIPLINAS DEL PENTATLÓN OLÍMPICO MODERNO. Por JAVIER SOLIS NO...
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
Qué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativaQué es la Inteligencia artificial generativa
Qué es la Inteligencia artificial generativa
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURAFORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
FORTI-MAYO 2024.pdf.CIENCIA,EDUCACION,CULTURA
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VSOCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
OCTAVO SEGUNDO PERIODO. EMPRENDIEMIENTO VS
 
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 

Regresion simple

  • 1. Tema 7: Regresión Simple y Múltiple
  • 2. EJEMPLO: Aproxima bien el número de préstamos que efectúa una biblioteca a lo largo de su primer año de vida. Nos dicen que la fórmula Si damos valores a la variable Días (nº días transcurridos desde la apertura de la biblioteca… DíasprestamosN 3'025º +=
  • 3. 0 100 200 300 400 Días 0 20 40 60 80 100 120 Nºprestamos DíasprestamosN 3'025º +=
  • 4. Si dos variables X e Y está relacionadas mediante una expresión del tipo Y=a+bX, la gráfica que relaciona los valores de X e Y es una línea recta, y se dice que Y=a+bX es la ecuación de dicha recta; el recíproco es cierto, es decir, si la gráfica que relaciona X e Y es una recta, entre ambas existe una relación del tipo Y=a+bX. En ese caso, decimos que entre X e Y hay una relación de tipo lineal. En la realidad, no nos encontramos fórmulas tan “redondas”, pero sí nos encontramos fenómenos que pueden aproximarse por ellas.
  • 5. Días Nº prestamos 5 25 20 32 35 40 50 39 65 47 80 51 95 56 110 54 135 69 150 72 165 76 180 77 195 86 210 90 235 98 250 102 265 105 280 110 295 113 310 120 EJEMPLO: Supongamos que una biblioteca proporcionó los siguientes datos, a lo largo de su primer año de vida
  • 6. Días Nºprestamos 0 100 200 300 400 0 20 40 60 80 100 120
  • 7. APROXIMADAMENTE, Nº prestamos = 24,5529 + 0,301579*Días En este caso, diríamos que las variables Nº préstamos y Días están linealmente correlacionadas, y que lo de arriba es la ecuación de la recta de regresión de Nº préstamos sobre Días. ¿Para qué nos sirve? (1) para conocer leyes empíricas; (2) para predecir el valor de una cierta variable
  • 8. PROBLEMAS: Dadas dos variables X e Y, continuas 1.- [Correlación] ¿Existe una cierta relación entre ellas, o por el contrario son independientes? En el primer caso, hablamos de que entre X e Y hay correlación; en el segundo, decimos que son incorreladas 2.- [Correlación lineal] Suponiendo que entre X e Y hay correlación, ¿están linealmente correlacionadas, es decir, funciona suficientemente bien un modelo del tipo Y = a+bX para predecir Y a partir de X? ¿Cuáles son los “óptimos” valores para a y b, es decir, los que producen “mejores” esti- maciones? 3.- [Otros tipos de correlación] ¿Hay algún modelo mejor que el lineal que permita estimar Y a partir de X? Por ejemplo, Cuadrático: Y=a+bX+bX2 Exponencial: Y=a bx … Otro ejemplo (Leyes bibliométricas)
  • 9. Curva logística del crecimiento de la información
  • 10. 1. Distribuciones bidimensionales. Correlación. Cuando en una población registramos simultáneamente los valores de dos variables X e Y, decimos que estamos ante una distribución BIDIMENSIONAL (PIZARRA: distribuciones marginales) Los datos relativos a una distribución bidimensional se pueden representar gráficamente mediante una NUBE DE PUNTOS, o DIAGRAMA DE DISPERSION (PIZARRA) Si la nube de puntos se ajusta aproximadamente a una curva, diremos que las variables están correlacionadas, es decir, que existe una cierta relación entre ellas (y buscaremos cuál es la expresión, la “fórmula” que mejor aproxima una de ellas partir de la otra); en caso contrario, decimos que las variables son incorreladas, es decir, que no tienen relación.
  • 11. 0 100 200 300 400 0 20 40 60 80 100 120 0 100 200 300 400 0 3 6 9 12 15 Hay correlación Incorreladas
  • 12. Además de la “inspección” de la nube de puntos, hay métodos más exactos para evaluar la existencia o no de correlación.
  • 13. Si la nube de puntos parece ajustarse en torno a alguna curva (es decir, si hay correlación), la forma de dicha curva nos indica el tipo de correlación. Si la nube de puntos parece agruparse en torno a una recta, diremos que hay correlación lineal, o que las variables están linealmente correlacionadas. 0 100 200 300 400 0 20 40 60 80 100 120
  • 14. Si las variables están linealmente correlacionadas, entonces tiene sentido buscar la recta que “mejor se ajusta” a la nube de puntos, es decir, la recta que globalmente está más cerca del conjunto de puntos. Si nuestra intención al hacer eso es la de estimar Y a partir de X, entonces encontrar dicha recta es equivalente a encontrar la mejor aproximación Y=a+bX (RECTA DE REGRESION DE Y SOBRE X) ¿Cómo tomar a, b para que la aproximación sea “óptima”?
  • 15. 2. Regresión lineal sobre un conjunto de puntos. PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar si las variables X e Y están o no linealmente correlacionadas, y la fuerza de dicha correlación lineal. PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas, determinar la recta de regresión de Y sobre X, es decir, a y b de modo que, aproximadamente, Y=a + bX.
  • 16. PROBLEMA 1: Dada una distribución bidimensional (X,Y), determinar si las variables X e Y están o no linealmente correlacionadas, y la fuerza de dicha correlación lineal. - Nube de puntos. - Coeficiente de correlación lineal de Pearson. (PIZARRA) - Coeficiente de correlación lineal de Spearman. - Coeficiente de determinación ó R-cuadrado ó % de variabilidad explicada.
  • 17. PROBLEMA 2: Suponiendo que X e Y están linealmente correlacionadas, determinar la recta de regresión de Y sobre X, es decir, a y b de modo que, aproximadamente, Y=a + bX. bXaY += (Ecuación recta de regresión de Y sobre X) Conocida la recta de regresión, podemos estimar los valores de Y correspondientes a distintos valores de X. ii bxay +=ˆ Valor predicho, o estimado
  • 18. 0 100 200 300 400 0 20 40 60 80 100 120 iy :valor real
  • 19. 0 100 200 300 400 0 20 40 60 80 100 120 iyˆ Valor predicho: ii bxay +=ˆ
  • 20. 0 100 200 300 400 0 20 40 60 80 100 120 iyˆ Valor predicho: ii bxay +=ˆ Residuo: diferencia entre el valor real y el valor predicho
  • 21. Statgraphics R-cuadrado ó Coeficiente de Determinación ó % de variabilidad explicada… (PIZARRA)
  • 22. 3. El modelo de regresión lineal. Sabemos decidir si, aproximadamente, un conjunto (xi,yi) de puntos (datos) se ajusta o no a Y=a+bX. Pero, teniendo en cuenta que esos datos son una MUESTRA de una población… ¿SIGUE SIENDO “APROXIMADAMENTE” VALIDO Y=a+bX cuando tomamos NO una muestra (xi,yi), sino cuando consideramos TODA LA POBLACION? ¿Qué queremos decir por “aproximadamente”?
  • 23. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Decimos que dos variables (poblacionales!) están linealmente correlacionadas, si: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 2+ 4+ 5= Residuos siguen una normal N(0,σ)
  • 24. Gráfico del Modelo Ajustado Semanas Prestamos 8 12 16 20 24 28 32 26 31 36 41 46 51 56 “La varianza de los residuos no depende de xi (homocedasticidad)”
  • 25. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 2, 4 y 5 pueden contrastarte guardando los residuos, y procediendo como en otras ocasiones.
  • 26. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 3 lo contrastaremos con los gráficos de residuos, y comprobando que no haya residuos atípicos.
  • 27. Gráfico del Modelo Ajustado Semanas Prestamos 8 12 16 20 24 28 32 26 31 36 41 46 51 56 Homocedasticidad “aceptable”
  • 28. Modelo de regresión lineal: iii bxay ε++= Y: variable explicada X: regresor residuo Hipótesis básicas: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. ¿Cómo CONTRASTAR?
  • 29. a.- Inspección del diagrama de dispersión, valores de los coeficientes de correlación de Pearson y Spearman (si el ajuste no funciona bien para la muestra, difícilmente lo hará para la población). b.- Contraste tipo ANOVA sobre la existencia o no de correlación lineal. COEFICIENTE DE DETERMINACION. = Contraste sobre la pendiente de la recta de regresión. c.- ¿Cómo podemos estar seguros de que, en la población, los coeficien- tes de Pearson y Spearman no serían 0 (en cuyo caso, no habría correlación lineal)? Contraste de hipótesis. ¿Cómo CONTRASTAR? (Explicación: PIZARRA)
  • 30. - Eliminación de parámetros (simplificación del modelo): iii bxay ε++= Si aceptamos el contraste H0: a=0, entonces la recta de regresión que obtenemos es y = bx (una fórmula más sencilla): se dice entonces que hemos simplificado nuestro modelo.
  • 31. Y: variable explicada X: regresor residuo 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. iii bxay ε++= ¿Qué hacer si falla alguna hipótesis? (algunas ideas sobre esto…) (APUNTES) Statgraphics
  • 32. 4. El modelo de regresión múltiple. PROBLEMA: Hemos recogido datos sobre usuarios de mediana edad de una biblioteca en la que además se realizan actividades tanto para niños como para adolescentes y adultos, y estamos interesados en analizar cuáles son las variables que determinan el nivel de satisfacción de sus usuarios; las variables recogidas son: afición a la lectura, al cine, a la música, número de hijos, renta… y, por supuesto, nivel de satisfac- ción.
  • 33. Aficion_lectura Num_hijos Aficion_cine Aficion_musica renta_mens Nivel_estudios Aficion_TV Satisfaccion 4 0 3 5 1200 4 4 4 3 0 3 4 1500 5 4 3 5 1 4 1 1800 3 5 5 2 2 1 3 1000 2 2 3 4 1 5 3 1300 3 4 4 3 1 3 4 1900 1 4 3 5 3 4 5 1300 4 5 5 3 0 2 3 1200 4 4 3 3 1 4 1 1600 2 5 4 1 3 2 1 1400 2 1 2 4 0 5 4 1700 3 4 4 5 0 5 5 2500 4 5 5 5 2 4 4 1100 5 3 5 5 2 5 3 1400 3 4 5 2 1 1 4 1800 4 3 3 4 2 5 4 2000 4 5 5 3 3 2 4 1500 4 3 3 1 1 2 3 1000 2 2 2 2 1 2 2 1300 3 3 3 1 0 2 5 1600 4 4 2 5 1 4 4 1800 3 4 4 2 2 3 3 1200 4 4 4 4 1 5 5 1700 2 5 4 4 1 4 3 1500 5 4 4 5 2 4 5 1100 5 5 5
  • 34. El modelo de regresión simple es, a priori, poco realista (parece poco probable que el nivel de satisfacción dependa de una única variable, más bien lo natural es que en él intervengan varias variables). En con- secuencia, ensayamos no con sino con Y=a+bX Y=a+b1X1+ … +bnXn Variable respuesta (en nuestro caso, “nivel de satisfacción”) regresores
  • 35. Satisfaccion = 0,686829 + 0,134472*Aficion_cine + 0,436889*Aficion_lectura - 0,0904825*Aficion_musica + 0,234494*Aficion_TV + 0,113699*Nivel_estudios + 0,206893*Num_hijos - 0,0000595998*renta_mens Por ejemplo, en el problema anterior, la fórmula a la que llegaremos es: Aquí, Y=Satisfacción, X1=Afición_cine, X2=Aficion_lectura, etc. Sirve para: - predecir. - detectar influencias (qué variables tienen más “poder” sobre la variable que nos interesa, etc.)
  • 36. Modelo de regresión múltiple: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 6. Las variables x1, x2, etc. no están linealmente correlacionadas entre sí. inni xbxbay ε++⋅⋅⋅++= 11 residuo
  • 37. Modelo de regresión múltiple: 1. 2. Los residuos tienen media 0. 3. La varianza de los residuos no depende de xi (homocedasticidad) 4. Los residuos son normales. 5. Los residuos son aleatorios. 6. Las variables x1, x2, etc. no están linealmente correlacionadas entre sí. 2+ 4+ 5= Residuos siguen una normal N(0,σ) inni xbxbay ε++⋅⋅⋅++= 11 residuo