SlideShare una empresa de Scribd logo
1 de 56
Tema 1- Regresión lineal simple.
1.1. Introducción
1.2. Especificación del modelo de regresión lineal simple en la población.
1.2.1. Estructura de los modelos de regresión
1.2.2. Hipótesis básicas
1.3. Estimación de los parámetros del modelo de regresión lineal simple
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
1.3.2. La recta de regresión en puntuaciones diferenciales
1.3.3. La recta de regresión en puntuaciones típicas
1.3.4. Relación entre la pendiente de la recta y el coeficiente de
correlación
1.3.5. Interpretación de los coeficientes de la recta de regresión
1.4. El contraste de la regresión
1.4.1.Componentes de variabilidad y bondad de ajuste
1.4.2. Validación del modelo
1.4.3. Significación de parámetros
1.5. Diagnosis del modelo: Análisis de residuos
1.6. Predicción
Tema 1- Regresión lineal simple.
1.1. Introducción
1.1.1. Ejemplos de investigaciones en las que puede ser
adecuado utilizar el modelo de regresión simple.
1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
1.1.3. Herramientas para evaluar la relación entre dos
variables
1.1.3.1. El diagrama de dispersión
1.1.3.2. La covarianza
1.1.3.3. El coeficiente de correlación de Pearson
1.1. Introducción
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresión simple.
Se pretende estudiar si la competencia escolar de niños, medida en
una escala entre 1 y 4, depende del tiempo en meses que llevan
viviendo con un progenitor
Variable dependiente o criterio (endógena): competencia escolar
Variable independiente o predictora (exógena): meses de
monoparentalidad
Se pretende estudiar si el ajuste emocional de niños, medido por un
test de ajuste que proporciona puntuaciones en una escala entre 0
y 10, depende del ámbito rural o urbano en el que vive la familia
Variable dependiente o criterio: ajuste emocional
Variable independiente o predictora: ámbito geográfico
1.1. Introducción
1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el
modelo de regresión simple.
Se pretende estudiar la relación entre estrés laboral y la variable
trabajo a turno
Variable dependiente o criterio: estrés laboral
Variable independiente o predictora: tipo de turno: fijo o variable
Se pretende estudiar si las notas en Análisis de Datos II dependen
de Análisis de Datos I
Variable dependiente o criterio: Análisis de Datos II
Variable independiente o predictora: Análisis de datos I
Para estudiar empíricamente estas relaciones medimos, en una muestra de sujetos, los valores
de las variables incluidas en la relación. Genéricamente, la información de un sujeto cualquiera de
la muestra Si, vendrá dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos
de la investigación y para los ejemplos propuestos tendrá el siguiente formato.
Tabla o matriz de datos
Análisis de datos I Análisis de datos II
1 2
2 1
3 3
4 4
5 2
0 3
7 5
8 6
9 8
10 9
Meses comp escolar
2 4
18 4
108 3.66
24 2.83
132 2
60 3.5
16 2.16
9 2.66
84 2.5
comp escolar ámbito
4 1
4 1
3.66 1
2.83 1
2 1
3.5 0
2.16 0
2.66 0
2.5 0
1.83 0
Turno estrés
0 65
0 76
0 50
0 89
0 57
1 45
1 34
1 56
1 55
1 61
N=10
N=9
N=10 N=10
Observar que las variable
ámbito y turno aunque
no son métricas las hemos
codificado como numéricas.
Hemos elegido el 0 y el 1
para diferenciar entre
las categorías de las variables.
Este tipo de codificación,
muy frecuente en estadística,
se conoce como codificación
“dummy” o ficticia
1.1.2. El concepto de relación entre variables.
Naturaleza y tipos de relación: el gráfico de dispersión
0
5
10
15
20
25
0 2 4 6 8 10 12 -20
-15
-10
-5
0
5
0 2 4 6 8 10 12
0
1
2
3
4
0 2 4 6 8 10 12
1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
0
20
40
60
80
100
0 1
-15
-10
-5
0
5
10
0
5
10
15
20
25
30
0
5
10
15
20
25
30
35
40
0 5 10 15 20
0
50
100
150
200
250
300
0 5 10 15 20
1.1.2. El concepto de relación entre variables: naturaleza y
tipos de relación.
19
21
23
25
27
29
31
0 2 4 6 8 10 12
0
5
10
15
20
25
30
35
0 2 4 6 8 10 12
1.1.3.2. La covarianza
( )( )
S
X X Y Y
N
S P C
Nx y
i
i
N
i
=
− −
−
=
−
=
∑1
1 1
La covarianza puede tomar valores entre (-∞,+∞) de manera que si:
Sxy= 0 independencia lineal
Sxy> 0 relación lineal directa o positiva
Sxy< 0 relación lineal inversa o negativa
Vamos a ver, utilizando el gráfico de dispersión, porque las relaciones
De orden anteriores están relacionadas con el tipo de relación lineal.
Sxy> 0 relación lineal directa o
positiva
X
Y
X X-
Y Y-
Sxy< 0 relación lineal inversa o negativa
X X-
Y Y-
X
Y
Sxy= 0 independencia lineal
X X-
Y Y-
X
Y
Análisis de datos I Análisis de datos II
1 2 -3.9 -2.3 8.97
2 1 -2.9 -3.3 9.57
3 3 -1.9 -1.3 2.47
4 4 -0.9 -0.3 0.27
5 2 0.1 -2.3 -0.23
0 3 -4.9 -1.3 6.37
7 5 2.1 0.7 1.47
8 6 3.1 1.7 5.27
9 8 4.1 3.7 15.17
10 9 5.1 4.7 23.97
Sumas 49 43 0 0 73.3
Medias 4.9 4.3 8.14444444
X X- Y Y- ( )( )X X Y Y- -
S x y
1.1.3.2. La covarianza: dependencia de escalas
1.1.3.3. El coeficiente de correlación de Pearson
( )( )
( ) ( )
r
S
S S
X X Y Y
X X Y Y
x y
x y
x y
i
i
N
i
i
i
N
i
i
N
= =
− −
− −
=
= =
∑
∑ ∑
1
2
1
2
1
− ≤ ≤ +1 1r x y
0
5
10
15
20
25
0 2 4 6 8 10 12
rxy = 1
-20
-15
-10
-5
0
5
0 2 4 6 8 10 12
rxy = -1
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
rxy = 0.88
rxy = -0.88
0
2
4
6
8
10
12
0 2 4 6 8 10 12
rxy = 0
rxy = 0
1.2. Especificación del modelo de regresión lineal simple en la
población.
Xi i
Expresión matemática del modelo en la población
( )Y f X X Y
Y X
Y Y
i i i i i i i
i i
i i i
= + = + + = +
= +
= −
ε β β ε ε
β β
ε
0 1
0 1



predictora criterio
independiente dependiente
exógena endógena
explicativa explicada
En el modelo hay dos variables observadas: X e Y y dos parámetros
la ordenada en el origen de la recta de regresión y la pendiente
Interpretación de los parámetros:
0 1
1.2.1. Estructura de los modelos de regresión
Puntuación predicha por la recta de regresión verdadera
Residuo o error de predicción
Yi
Interpretación de los parámetros:
XXY 3,070ˆ
10 +=+= ββ
i
Esperanza
de vida
Ejercicio
físico
i
Esperanza
de vida
Consumo
de tabaco
XXY 04,070ˆ
10 −=+= ββ
1.2.2. Hipótesis básicas
2. Homocedasticidad: la varianza del término de error es constante:
1. El término de Error es una variable aleatoria con media cero:
4. Los errores son independientes entre sí.
3. Los errores se distribuyen normalmente:
3’. La distribución de Y es normal para cada X:
4’. Las observaciones Yi son independientes entre sí.
Las hipótesis anteriores pueden formularse de manera equivalente
en términos de la variable criterio. Así,
2’. La varianza de Y es constante:
2)
/( σ=iXYVar
ii XXYE βα+=)/(
1’. La media de Y depende linealmente de
X:
ii XXYE βα +=)/(
2
)/( σ=iXYVar
ii XXYE βα +=)/(
),(/ 2
σβα ii XNXY +≈
0)( =iE ε
2
)( σε =iVar
),0( 2
σε Ni ≈
Resumen gráfico de las hipótesis básicas
formuladas en términos de la variable criterio
X1, X2, X3, X4
Distribución Normal
2
/
2
/
2
/
2
/ 4321 xyxyxyxy σσσσ ===
Resumen gráfico de las hipótesis básicas
formuladas en términos de los residuos
0
X1, X2, X3, X4

El objetivo del análisis de regresión será estimar los
parámetros del modelo presentado y contrastar las
hipótesis de partida todo ello a partir de una muestra.
1.3. Estimación de los parámetros del modelo de regresión
lineal simple
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
1.3.2. La recta de regresión en puntuaciones diferenciales
1.3.3. La recta de regresión en puntuaciones típicas
1.3.4. Relación entre la pendiente de la recta y el coeficiente de
correlación
1.3.5. Interpretación de los coeficientes de la recta de regresión
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Partimos de una muestra de sujetos extraídos de una población
en la que se han tomado valores de las variables X e Y. La situación
más frecuente es que los puntos estén dispersos en el plano definido
por X e Y. La primera pregunta a plantearnos es de las infinitas rectas
que podemos ajustar a la nube de puntos ¿Cuál estimará mejor los
parámetros?. Existen diferentes criterios.
1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones
directas y principales propiedades
Y a b X e Y e
Y b b X e Y e
Y b b X
e Y Y
i i i i i
i i i i i
i i
i i i
= + + = +
= + + = +
= +
= −




0 1
0 1
1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00
X: Análisis de datos I
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
Y:AnálisisdeDatosII










Criterio de mínimos cuadrados:
( ) ( )( )
( )( )
( )( )
e Y Y Y a b X
a
Y a b X
b
Y a b X
i
i
N
i i i i
i
N
i
N
i i
i
N
i i
i
N
2
1
2 2
11
2
1
2
1
0
0
= − = − + =
− + =
− + =
= ==
=
=
∑ ∑∑
∑
∑
 m i n
∂
∂
∂
∂
1.3.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
Recta de regresión mínimo cuadrática (puntuaciones directas):
( )( )
( )
( )
a Y b X
b
X X Y Y
X X
S
S
r
S
S
Y a b X Y b X X
i
i
N
i
i
i
N
x y
x
x y
y
x
i i i
= −
=
− −
−
= =
= + = + −
=
=
∑
∑
1
1
2 2
º

1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones
directas y principales propiedades
Ejemplo de cálculo de la recta de regresión de
mínimos cuadrados
56,582,5004155
17,5520,253,94,5810
6,6512,251,93,569
7,256,252,92,548
1,352,250,91,557
-0,550,25-1,10,536
1,050,25-2,1-0,525
0,152,25-0,1-1,544
2,756,25-1,1-2,533
10,8512,25-3,1-3,512
9,4520,25-2,1-4,521
yx X X Y Y   X X Y Y ( )X X 2
Recta de regresión mínimo cuadrática:
  
 
a Y bX
b
X X Y Y
X X
Y X
i
i
N
i
i
i
N
i i
     

 

 
 




4 1 0 743 55 0 021
56 50
82 50
0 743
0 021 0 743
1
1
2
, , , ,
,
,
,
 , ,
1.4.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
iXY 742,0021,0ˆ +=
dependencia de escalas.xls
Propiedades de la Recta de regresión mínimo cuadrática:
1.4.1. La recta de regresión de mínimos cuadrados en
puntuaciones directas y principales propiedades
1) La media de las puntuaciones predichas es igual
a la media de Y
2) Los errores tienen media cero
3) La recta de mínimos cuadrados pasa por el
punto:
4) Los errores no correlacionan ni con la variable predictora
ni con las puntuaciones predichas
 X Y,
1.4.2. La recta de regresión de mínimos cuadrados en
puntuaciones diferenciales
a) Modelo y recta en puntuaciones diferenciales
( )
( )
bxy
ebxy
eXXbYY
ebXXbYebXaY
=
+=
+−=−
++−=++=
ˆ
1.4.2. La recta de regresión de mínimos cuadrados en
puntuaciones estandarizadas
a) Modelo y recta en puntuaciones estandarizadas
xixyi
eixixyyi
y
i
x
i
xy
y
i
ii
x
y
xyi
ZrZ
ZZrZ
S
e
S
x
r
S
y
ex
S
S
ry
ebxy
=
+=
+=
+





=
+=
ˆ
iXY 742,0021,0ˆ +=
xy 742,0ˆ =
xZZ 86,0ˆ =
Recta de regresión en diferenciales y en tipificadas.
Relación entre b y r. Interpretación de los coeficientes de la
regresión
a) En puntuaciones directas
b) En puntuaciones diferenciales
c) En puntuaciones estandarizadas
y
x
xy
S
S
br =
X
3210-1-2
Y
3
2
1
0
-1
-2
-3
X
210-1-2-3
Y
3
2
1
0
-1
-2
-3
X
1,51,0,50,0-,5-1,0
Y
1,5
1,0
,5
0,0
-,5
-1,0
-1,5
-2,0
1.4. El contraste de la regresión: introducción
X
1,51,0,50,0-,5-1,0-1,5-2,0
Y
3
2
1
0
-1
-2
-3
X
210-1-2-3
Y
3
2
1
0
-1
-2
X
3210-1-2-3
Y
3
2
1
0
-1
-2
-3
1.4. El contraste de la regresión: introducción
X
3210-1-2-3
Y
3
2
1
0
-1
-2
-3
X
3210-1-2-3
Y
3
2
1
0
-1
-2
-3
1.4. El contraste de la regresión: introducción
X
3210-1-2-3-4
Y
3
2
1
0
-1
-2
-3
-4
1.4. El contraste de la regresión: introducción
Xi
Yi
1.4. El contraste de la regresión: introducción
ii bXaY +=ˆ
Xi
Yi
Y
Desviación Desviación Desviación
total explicada residual
ii bXaY +=ˆ
1.4.1.Componentes de variabilidad y bondad de ajuste
( ) ( ) ( )iiii YYYYYY ˆˆ −+−=−
1.4.1. Componentes de variabilidad y bondad de ajuste
Xi
SC SC SCt res exp
Variación
Total
Variación
Explicada
Variación
Residual
( ) ( ) ( )
2
1
2
1
2
1
ˆˆ ∑∑∑ ===
−+−=−
N
i
ii
N
i
i
N
i
YYYYYY
   SC Y Y y Y
Y
N
N St i
i
N
i
i
N
i
i
i
N
i
N
y    






 
 


 

1
2
2
1
2 1
2
1
2
1
1.4.1. Componentes de variabilidad y bondad de ajuste
( ) ( ) ( ) 22
1
2
122
1
22
2
1
2
2
1
exp 1ˆ
x
N
i
N
i
i
i
N
i
i
N
i
N
i
SNb
N
X
XbxbXXbYYSC −=




















−==−=−= ∑
∑
∑∑∑ =
=
===
Fórmulas para calcular las sumas de cuadrados en
puntuaciones directas y diferenciales:
( ) exp
1
2
2
1
ˆ SCSCeYYSC t
N
i
i
N
i
iires −==−= ∑∑ ==
1.4.1. Componentes de variabilidad y bondad de ajuste
Fórmulas para calcular las sumas de cuadrados en
tipificadas:
SC SC SCt res exp
( )
( )( )2
2
1
22
1
2
exp
1
2
11
1ˆ
1
xyres
xy
N
i
xxy
N
i
i
N
i
yt
rNSC
NrZrZSC
NZSC
−−=
−===
−==
∑∑
∑
==
=
1.4.1. Componentes de variabilidad y bondad de
ajuste
Bondad de ajuste o Coeficiente de
determinación
 
SC
SC
SC
SC
SC
SC
R R
t
t t
res
t
 
  
exp
1 12 2
( )
( )
( )
( )
2
2
22
1
2
22
1
2
1
2
exp2
ˆ
xy
y
x
N
i
i
N
i
i
N
i
i
t
r
S
Sb
YY
XXb
YY
YY
SC
SC
R ==
−
−
=
−
−
==
∑∑
∑
==
=
1.4.1. Componentes de variabilidad y bondad de ajuste
r2
xy= 1
r2
xy= 0
r2
xy
Representación en diagramas de Venn
Y X
Y X
XY
Esquema del Contraste de Hipótesis
Contrastar una Hipótesis Estadísticamente es juzgar si cierta
propiedad supuesta para una población es compatible con lo
observado en una muestra de ella.
1.4.2. Validación del modelo
Elementos de una Prueba de Hipótesis
1.- Hipótesis Nula (H0), Hipótesis
Alternativa.
2.- Estadístico de Contraste (Discrepancia).
3.- Región de Rechazo (Región Crítica):
nivel de significación.
4.- Regla de Decisión.
1.4.2. Validación del modelo
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
2.- Estadístico de Contraste (Discrepancia).
F
S
S
SC
k
SC
N K
r
K
r
N K
res res
xy
xy
 
 


 
exp
exp
2
2
2
2
1
1
1
( )
( ) iiii
ii
XYXXYEH
YXYEH
εββββ
εµµβ
++=⇒+=
+=⇒==
10101
00
/:
/:
1.4.2. Validación del modelo
3.- Región de Rechazo (Región Crítica):
nivel de significación.
Región de aceptación de H0
Región de rechazo de H0
1-
Fc
4.- Regla de Decisión.
1.4.2. Validación del modelo
Se rechaza la H0 si:
F >Fc
o de manera equivalente si:
p < 
Por el contrario, se acepta la H0 si:
F  ≤Fc
o de manera equivalente si:
p ≥
Tabla F
Tabla F
1.4.3. Significación de parámetros
1.- Hipótesis Nula (H0), Hipótesis Alternativa.
2.- Estadístico de Contraste (Discrepancia).
 
t
b
S
b
S
X X
b
S
X
X
N
r
r
N
b res
i
i
N
res
i
i
i
N
i
N
xy
xy
















 

 

 1
2
2
1
2
2 1
2
1
2
1
2
H H
H H
0 1 1 1
0 1
0 0
0 0
: :
: :
 
 
 
 
Nota: en regresión simple t2
= F
1.4.3. Significación de parámetros
3.- Región de Rechazo (Región Crítica):
nivel de significación.
∀
Fc
Región de aceptación de H0
Regiones de rechazo de H0

2

2 1 
4.- Regla de Decisión.
Se rechaza la H0 si:
t  >+tc
o de manera equivalente si:
p < 
Por el contrario, se acepta la H0 si:
 t  ≤  +tc
o de manera equivalente si:
p≥
1.4.3. Significación de parámetros
http://www.stat.ucla.edu/~dinov/courses_students.dir/Applets.dir/T-table.html
Tabla t de Student
Calculadoras estadísticas en internet
http://faculty.vassar.edu/lowry/VassarStats.htm
http://davidmlane.com/hyperstat/t_table.html
http://davidmlane.com/hyperstat/F_table.html
http://calculators.stat.ucla.edu/cdf/
http://members.aol.com/johnp71/pdfs.html
http://www.psychstat.missouristate.edu/introbook/tdist.htm
http://www.psychstat.missouristate.edu/introbook/fdist.htm
1.6. Predicción
Intervalos de predicción:
( )
( )
( )
Y Y t S
N
X X
X X
o N K r e s
o
i
i
N: 
,
± + +
−
−












− −
=
∑
α 1
2
2
2
1
1
1
Regresión lineal simple: introducción y estimación

Más contenido relacionado

La actualidad más candente

Ejercicios resueltos regresion multiple
Ejercicios resueltos  regresion multipleEjercicios resueltos  regresion multiple
Ejercicios resueltos regresion multipleJuan Timoteo Cori
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mataKassandra Gomez
 
Clase10 Endogeneidad y estimación por variables instrumentales
Clase10 Endogeneidad y estimación por variables instrumentalesClase10 Endogeneidad y estimación por variables instrumentales
Clase10 Endogeneidad y estimación por variables instrumentalesNerys Ramírez Mordán
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continuaLIZBETH IZA
 
Subir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoSubir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoAndy Shalom
 
Regresion multiple y correlacion
Regresion multiple y correlacionRegresion multiple y correlacion
Regresion multiple y correlacionEmmanuel Chulin
 
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...myriam sarango
 
Distribución de poisson
Distribución de poissonDistribución de poisson
Distribución de poissonJosé Mendoza
 
Ejercicios de Distribuciones
Ejercicios de Distribuciones Ejercicios de Distribuciones
Ejercicios de Distribuciones RenyWMezaM
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Luz Hernández
 

La actualidad más candente (20)

Ejercicios resueltos regresion multiple
Ejercicios resueltos  regresion multipleEjercicios resueltos  regresion multiple
Ejercicios resueltos regresion multiple
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mata
 
Clase10 Endogeneidad y estimación por variables instrumentales
Clase10 Endogeneidad y estimación por variables instrumentalesClase10 Endogeneidad y estimación por variables instrumentales
Clase10 Endogeneidad y estimación por variables instrumentales
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continua
 
estadistica medias muestrales
estadistica medias muestralesestadistica medias muestrales
estadistica medias muestrales
 
2 distribución de probabilidad discreta
2 distribución de probabilidad discreta2 distribución de probabilidad discreta
2 distribución de probabilidad discreta
 
Subir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadradoSubir tarea estadistica chi cuadrado
Subir tarea estadistica chi cuadrado
 
Regresion multiple y correlacion
Regresion multiple y correlacionRegresion multiple y correlacion
Regresion multiple y correlacion
 
Gradientes aritméticos y geométricos
Gradientes aritméticos y geométricos Gradientes aritméticos y geométricos
Gradientes aritméticos y geométricos
 
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
Pruebas para una Media Poblacional: Muestra Grande y Desviación Estándar Pobl...
 
Distribución de poisson
Distribución de poissonDistribución de poisson
Distribución de poisson
 
17.regresión y correlación simple
17.regresión y correlación simple17.regresión y correlación simple
17.regresión y correlación simple
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Análisis de Regresión Múltiple
Análisis de Regresión MúltipleAnálisis de Regresión Múltiple
Análisis de Regresión Múltiple
 
Distribucion hipergeometrica
Distribucion hipergeometricaDistribucion hipergeometrica
Distribucion hipergeometrica
 
Ejercicios de Distribuciones
Ejercicios de Distribuciones Ejercicios de Distribuciones
Ejercicios de Distribuciones
 
Ejercicios resueltos
Ejercicios resueltosEjercicios resueltos
Ejercicios resueltos
 
Actividad (a)
Actividad (a)Actividad (a)
Actividad (a)
 
Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)Metodos de muestreo, ejercicios y su procedimiento (1)
Metodos de muestreo, ejercicios y su procedimiento (1)
 
Ejercicios resueltos
Ejercicios resueltosEjercicios resueltos
Ejercicios resueltos
 

Similar a Regresión lineal simple: introducción y estimación

05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptxPEALOZACASTILLOCINTI
 
1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresionSociedadIncluyente
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Robinho Navarrete
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 
Regresion lineal
Regresion linealRegresion lineal
Regresion linealHaret Diaz
 
Clase 6 Análisis de regresión.pdf
Clase 6 Análisis de regresión.pdfClase 6 Análisis de regresión.pdf
Clase 6 Análisis de regresión.pdfAnaParave1
 
Ajuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAjuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAngie Garcia
 
trabajo estadistica asi bien bien svfgunda parte.pptx
trabajo estadistica asi bien bien svfgunda parte.pptxtrabajo estadistica asi bien bien svfgunda parte.pptx
trabajo estadistica asi bien bien svfgunda parte.pptxEleazar86
 
Curso de-econometria-basica
Curso de-econometria-basicaCurso de-econometria-basica
Curso de-econometria-basicavestaoriginal
 
Proporcionalidad factor variable
Proporcionalidad factor variableProporcionalidad factor variable
Proporcionalidad factor variableemilop1
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple ALEX ABURTO MEZA
 
S07.s4 Regresion Lineal Multiple.R.pdf
S07.s4 Regresion Lineal Multiple.R.pdfS07.s4 Regresion Lineal Multiple.R.pdf
S07.s4 Regresion Lineal Multiple.R.pdfJuanMallma3
 
Regresión simple y correlación - Estadística
Regresión simple y correlación - EstadísticaRegresión simple y correlación - Estadística
Regresión simple y correlación - EstadísticaalexySantana1
 
Psico. 14 ava. regresión y correlación
Psico. 14 ava. regresión y correlaciónPsico. 14 ava. regresión y correlación
Psico. 14 ava. regresión y correlaciónUniv Peruana Los Andes
 
Coeficiente de determinación
Coeficiente de determinaciónCoeficiente de determinación
Coeficiente de determinaciónSteve Rodriguez
 
17.Regresión y correlación simple.ppt
17.Regresión y correlación simple.ppt17.Regresión y correlación simple.ppt
17.Regresión y correlación simple.pptRogerPerezSaravia
 
3 analisis multivariable
3 analisis multivariable3 analisis multivariable
3 analisis multivariableCarmen Mejia
 

Similar a Regresión lineal simple: introducción y estimación (20)

05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx05 Bioest. Análisis Correlación y Regres. Lineal.pptx
05 Bioest. Análisis Correlación y Regres. Lineal.pptx
 
1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion1. Tema Nº 2 (Apuntes).pptx simplex regresion
1. Tema Nº 2 (Apuntes).pptx simplex regresion
 
Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011Cap2. modelo regresión multiple-v2-2011
Cap2. modelo regresión multiple-v2-2011
 
Regresion Y Correlacion
Regresion Y CorrelacionRegresion Y Correlacion
Regresion Y Correlacion
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Regresion lineal
Regresion linealRegresion lineal
Regresion lineal
 
Clase 6 Análisis de regresión.pdf
Clase 6 Análisis de regresión.pdfClase 6 Análisis de regresión.pdf
Clase 6 Análisis de regresión.pdf
 
Ajuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadradosAjuste de una_recta_por_minimos_cuadrados
Ajuste de una_recta_por_minimos_cuadrados
 
trabajo estadistica asi bien bien svfgunda parte.pptx
trabajo estadistica asi bien bien svfgunda parte.pptxtrabajo estadistica asi bien bien svfgunda parte.pptx
trabajo estadistica asi bien bien svfgunda parte.pptx
 
Regresion y correlacion
Regresion y correlacionRegresion y correlacion
Regresion y correlacion
 
2. reg.lin.multiple
2. reg.lin.multiple2. reg.lin.multiple
2. reg.lin.multiple
 
Curso de-econometria-basica
Curso de-econometria-basicaCurso de-econometria-basica
Curso de-econometria-basica
 
Proporcionalidad factor variable
Proporcionalidad factor variableProporcionalidad factor variable
Proporcionalidad factor variable
 
Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple Econometria I: modelo de regresión lineal simple
Econometria I: modelo de regresión lineal simple
 
S07.s4 Regresion Lineal Multiple.R.pdf
S07.s4 Regresion Lineal Multiple.R.pdfS07.s4 Regresion Lineal Multiple.R.pdf
S07.s4 Regresion Lineal Multiple.R.pdf
 
Regresión simple y correlación - Estadística
Regresión simple y correlación - EstadísticaRegresión simple y correlación - Estadística
Regresión simple y correlación - Estadística
 
Psico. 14 ava. regresión y correlación
Psico. 14 ava. regresión y correlaciónPsico. 14 ava. regresión y correlación
Psico. 14 ava. regresión y correlación
 
Coeficiente de determinación
Coeficiente de determinaciónCoeficiente de determinación
Coeficiente de determinación
 
17.Regresión y correlación simple.ppt
17.Regresión y correlación simple.ppt17.Regresión y correlación simple.ppt
17.Regresión y correlación simple.ppt
 
3 analisis multivariable
3 analisis multivariable3 analisis multivariable
3 analisis multivariable
 

Más de Julio Oseda

Construccion de curvas de solubilidad
Construccion   de  curvas  de  solubilidadConstruccion   de  curvas  de  solubilidad
Construccion de curvas de solubilidadJulio Oseda
 
El modelo de dispersion
El  modelo  de  dispersionEl  modelo  de  dispersion
El modelo de dispersionJulio Oseda
 
Problemas propuestos de hidratos de carbono
Problemas  propuestos  de  hidratos  de  carbonoProblemas  propuestos  de  hidratos  de  carbono
Problemas propuestos de hidratos de carbonoJulio Oseda
 
Lejía o-lavandina-casera-mediante-electrólisis-info
Lejía o-lavandina-casera-mediante-electrólisis-infoLejía o-lavandina-casera-mediante-electrólisis-info
Lejía o-lavandina-casera-mediante-electrólisis-infoJulio Oseda
 
Balance de energia en panderia
Balance  de   energia    en  panderiaBalance  de   energia    en  panderia
Balance de energia en panderiaJulio Oseda
 

Más de Julio Oseda (7)

Chi cuadrado
Chi  cuadradoChi  cuadrado
Chi cuadrado
 
Construccion de curvas de solubilidad
Construccion   de  curvas  de  solubilidadConstruccion   de  curvas  de  solubilidad
Construccion de curvas de solubilidad
 
El modelo de dispersion
El  modelo  de  dispersionEl  modelo  de  dispersion
El modelo de dispersion
 
Fisicoquímic
FisicoquímicFisicoquímic
Fisicoquímic
 
Problemas propuestos de hidratos de carbono
Problemas  propuestos  de  hidratos  de  carbonoProblemas  propuestos  de  hidratos  de  carbono
Problemas propuestos de hidratos de carbono
 
Lejía o-lavandina-casera-mediante-electrólisis-info
Lejía o-lavandina-casera-mediante-electrólisis-infoLejía o-lavandina-casera-mediante-electrólisis-info
Lejía o-lavandina-casera-mediante-electrólisis-info
 
Balance de energia en panderia
Balance  de   energia    en  panderiaBalance  de   energia    en  panderia
Balance de energia en panderia
 

Último

Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxEverardoRuiz8
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxEduardoSnchezHernnde5
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfedsonzav8
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdfCristhianZetaNima
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdfAnthonyTiclia
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVSebastianPaez47
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfMikkaelNicolae
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxSergioGJimenezMorean
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAJAMESDIAZ55
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptCRISTOFERSERGIOCANAL
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacajeremiasnifla
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfAntonioGonzalezIzqui
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptxguillermosantana15
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaXjoseantonio01jossed
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPJosLuisFrancoCaldern
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptMarianoSanchez70
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdfFernandaGarca788912
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdfvictoralejandroayala2
 

Último (20)

Unidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptxUnidad 3 Administracion de inventarios.pptx
Unidad 3 Administracion de inventarios.pptx
 
Flujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptxFlujo multifásico en tuberias de ex.pptx
Flujo multifásico en tuberias de ex.pptx
 
Manual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdfManual_Identificación_Geoformas_140627.pdf
Manual_Identificación_Geoformas_140627.pdf
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
 
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
2. UPN PPT - SEMANA 02 GESTION DE PROYECTOS MG CHERYL QUEZADA(1).pdf
 
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kVEl proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
El proyecto “ITC SE Lambayeque Norte 220 kV con seccionamiento de la LT 220 kV
 
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdfReporte de simulación de flujo del agua en un volumen de control MNVA.pdf
Reporte de simulación de flujo del agua en un volumen de control MNVA.pdf
 
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptxPPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
PPT SERVIDOR ESCUELA PERU EDUCA LINUX v7.pptx
 
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESAIPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
IPERC Y ATS - SEGURIDAD INDUSTRIAL PARA TODA EMPRESA
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.pptaCARGA y FUERZA UNI 19 marzo 2024-22.ppt
aCARGA y FUERZA UNI 19 marzo 2024-22.ppt
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpaca
 
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdfTAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
TAREA 8 CORREDOR INTEROCEÁNICO DEL PAÍS.pdf
 
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
¿QUE SON LOS AGENTES FISICOS Y QUE CUIDADOS TENER.pptx
 
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctricaProyecto de iluminación "guia" para proyectos de ingeniería eléctrica
Proyecto de iluminación "guia" para proyectos de ingeniería eléctrica
 
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIPSEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
SEGURIDAD EN CONSTRUCCION PPT PARA EL CIP
 
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
 
Curso intensivo de soldadura electrónica en pdf
Curso intensivo de soldadura electrónica  en pdfCurso intensivo de soldadura electrónica  en pdf
Curso intensivo de soldadura electrónica en pdf
 
tema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdftema05 estabilidad en barras mecanicas.pdf
tema05 estabilidad en barras mecanicas.pdf
 

Regresión lineal simple: introducción y estimación

  • 1. Tema 1- Regresión lineal simple. 1.1. Introducción 1.2. Especificación del modelo de regresión lineal simple en la población. 1.2.1. Estructura de los modelos de regresión 1.2.2. Hipótesis básicas 1.3. Estimación de los parámetros del modelo de regresión lineal simple 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1.3.2. La recta de regresión en puntuaciones diferenciales 1.3.3. La recta de regresión en puntuaciones típicas 1.3.4. Relación entre la pendiente de la recta y el coeficiente de correlación 1.3.5. Interpretación de los coeficientes de la recta de regresión 1.4. El contraste de la regresión 1.4.1.Componentes de variabilidad y bondad de ajuste 1.4.2. Validación del modelo 1.4.3. Significación de parámetros 1.5. Diagnosis del modelo: Análisis de residuos 1.6. Predicción
  • 2. Tema 1- Regresión lineal simple. 1.1. Introducción 1.1.1. Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. 1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. 1.1.3. Herramientas para evaluar la relación entre dos variables 1.1.3.1. El diagrama de dispersión 1.1.3.2. La covarianza 1.1.3.3. El coeficiente de correlación de Pearson
  • 3. 1.1. Introducción 1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar si la competencia escolar de niños, medida en una escala entre 1 y 4, depende del tiempo en meses que llevan viviendo con un progenitor Variable dependiente o criterio (endógena): competencia escolar Variable independiente o predictora (exógena): meses de monoparentalidad Se pretende estudiar si el ajuste emocional de niños, medido por un test de ajuste que proporciona puntuaciones en una escala entre 0 y 10, depende del ámbito rural o urbano en el que vive la familia Variable dependiente o criterio: ajuste emocional Variable independiente o predictora: ámbito geográfico
  • 4. 1.1. Introducción 1.1.Ejemplos de investigaciones en las que puede ser adecuado utilizar el modelo de regresión simple. Se pretende estudiar la relación entre estrés laboral y la variable trabajo a turno Variable dependiente o criterio: estrés laboral Variable independiente o predictora: tipo de turno: fijo o variable Se pretende estudiar si las notas en Análisis de Datos II dependen de Análisis de Datos I Variable dependiente o criterio: Análisis de Datos II Variable independiente o predictora: Análisis de datos I Para estudiar empíricamente estas relaciones medimos, en una muestra de sujetos, los valores de las variables incluidas en la relación. Genéricamente, la información de un sujeto cualquiera de la muestra Si, vendrá dada por el par (Xi, Yi). El conjunto de pares constituye la matriz de datos de la investigación y para los ejemplos propuestos tendrá el siguiente formato.
  • 5. Tabla o matriz de datos Análisis de datos I Análisis de datos II 1 2 2 1 3 3 4 4 5 2 0 3 7 5 8 6 9 8 10 9 Meses comp escolar 2 4 18 4 108 3.66 24 2.83 132 2 60 3.5 16 2.16 9 2.66 84 2.5 comp escolar ámbito 4 1 4 1 3.66 1 2.83 1 2 1 3.5 0 2.16 0 2.66 0 2.5 0 1.83 0 Turno estrés 0 65 0 76 0 50 0 89 0 57 1 45 1 34 1 56 1 55 1 61 N=10 N=9 N=10 N=10 Observar que las variable ámbito y turno aunque no son métricas las hemos codificado como numéricas. Hemos elegido el 0 y el 1 para diferenciar entre las categorías de las variables. Este tipo de codificación, muy frecuente en estadística, se conoce como codificación “dummy” o ficticia
  • 6. 1.1.2. El concepto de relación entre variables. Naturaleza y tipos de relación: el gráfico de dispersión 0 5 10 15 20 25 0 2 4 6 8 10 12 -20 -15 -10 -5 0 5 0 2 4 6 8 10 12 0 1 2 3 4 0 2 4 6 8 10 12
  • 7. 1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. 0 20 40 60 80 100 0 1 -15 -10 -5 0 5 10 0 5 10 15 20 25 30 0 5 10 15 20 25 30 35 40 0 5 10 15 20 0 50 100 150 200 250 300 0 5 10 15 20
  • 8. 1.1.2. El concepto de relación entre variables: naturaleza y tipos de relación. 19 21 23 25 27 29 31 0 2 4 6 8 10 12 0 5 10 15 20 25 30 35 0 2 4 6 8 10 12
  • 9. 1.1.3.2. La covarianza ( )( ) S X X Y Y N S P C Nx y i i N i = − − − = − = ∑1 1 1 La covarianza puede tomar valores entre (-∞,+∞) de manera que si: Sxy= 0 independencia lineal Sxy> 0 relación lineal directa o positiva Sxy< 0 relación lineal inversa o negativa Vamos a ver, utilizando el gráfico de dispersión, porque las relaciones De orden anteriores están relacionadas con el tipo de relación lineal.
  • 10. Sxy> 0 relación lineal directa o positiva X Y X X- Y Y- Sxy< 0 relación lineal inversa o negativa X X- Y Y- X Y Sxy= 0 independencia lineal X X- Y Y- X Y
  • 11. Análisis de datos I Análisis de datos II 1 2 -3.9 -2.3 8.97 2 1 -2.9 -3.3 9.57 3 3 -1.9 -1.3 2.47 4 4 -0.9 -0.3 0.27 5 2 0.1 -2.3 -0.23 0 3 -4.9 -1.3 6.37 7 5 2.1 0.7 1.47 8 6 3.1 1.7 5.27 9 8 4.1 3.7 15.17 10 9 5.1 4.7 23.97 Sumas 49 43 0 0 73.3 Medias 4.9 4.3 8.14444444 X X- Y Y- ( )( )X X Y Y- - S x y
  • 12. 1.1.3.2. La covarianza: dependencia de escalas
  • 13. 1.1.3.3. El coeficiente de correlación de Pearson ( )( ) ( ) ( ) r S S S X X Y Y X X Y Y x y x y x y i i N i i i N i i N = = − − − − = = = ∑ ∑ ∑ 1 2 1 2 1 − ≤ ≤ +1 1r x y 0 5 10 15 20 25 0 2 4 6 8 10 12 rxy = 1 -20 -15 -10 -5 0 5 0 2 4 6 8 10 12 rxy = -1 0 1 2 3 4 5 6 7 8 9 0 2 4 6 8 10 rxy = 0.88 rxy = -0.88 0 2 4 6 8 10 12 0 2 4 6 8 10 12 rxy = 0 rxy = 0
  • 14. 1.2. Especificación del modelo de regresión lineal simple en la población. Xi i Expresión matemática del modelo en la población ( )Y f X X Y Y X Y Y i i i i i i i i i i i i = + = + + = + = + = − ε β β ε ε β β ε 0 1 0 1    predictora criterio independiente dependiente exógena endógena explicativa explicada En el modelo hay dos variables observadas: X e Y y dos parámetros la ordenada en el origen de la recta de regresión y la pendiente Interpretación de los parámetros: 0 1 1.2.1. Estructura de los modelos de regresión Puntuación predicha por la recta de regresión verdadera Residuo o error de predicción Yi
  • 15. Interpretación de los parámetros: XXY 3,070ˆ 10 +=+= ββ i Esperanza de vida Ejercicio físico i Esperanza de vida Consumo de tabaco XXY 04,070ˆ 10 −=+= ββ
  • 16. 1.2.2. Hipótesis básicas 2. Homocedasticidad: la varianza del término de error es constante: 1. El término de Error es una variable aleatoria con media cero: 4. Los errores son independientes entre sí. 3. Los errores se distribuyen normalmente: 3’. La distribución de Y es normal para cada X: 4’. Las observaciones Yi son independientes entre sí. Las hipótesis anteriores pueden formularse de manera equivalente en términos de la variable criterio. Así, 2’. La varianza de Y es constante: 2) /( σ=iXYVar ii XXYE βα+=)/( 1’. La media de Y depende linealmente de X: ii XXYE βα +=)/( 2 )/( σ=iXYVar ii XXYE βα +=)/( ),(/ 2 σβα ii XNXY +≈ 0)( =iE ε 2 )( σε =iVar ),0( 2 σε Ni ≈
  • 17. Resumen gráfico de las hipótesis básicas formuladas en términos de la variable criterio X1, X2, X3, X4 Distribución Normal 2 / 2 / 2 / 2 / 4321 xyxyxyxy σσσσ ===
  • 18. Resumen gráfico de las hipótesis básicas formuladas en términos de los residuos 0 X1, X2, X3, X4 
  • 19. El objetivo del análisis de regresión será estimar los parámetros del modelo presentado y contrastar las hipótesis de partida todo ello a partir de una muestra.
  • 20. 1.3. Estimación de los parámetros del modelo de regresión lineal simple 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1.3.2. La recta de regresión en puntuaciones diferenciales 1.3.3. La recta de regresión en puntuaciones típicas 1.3.4. Relación entre la pendiente de la recta y el coeficiente de correlación 1.3.5. Interpretación de los coeficientes de la recta de regresión
  • 21. 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Partimos de una muestra de sujetos extraídos de una población en la que se han tomado valores de las variables X e Y. La situación más frecuente es que los puntos estén dispersos en el plano definido por X e Y. La primera pregunta a plantearnos es de las infinitas rectas que podemos ajustar a la nube de puntos ¿Cuál estimará mejor los parámetros?. Existen diferentes criterios.
  • 22. 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades Y a b X e Y e Y b b X e Y e Y b b X e Y Y i i i i i i i i i i i i i i i = + + = + = + + = + = + = −     0 1 0 1 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00 X: Análisis de datos I 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 Y:AnálisisdeDatosII          
  • 23. Criterio de mínimos cuadrados: ( ) ( )( ) ( )( ) ( )( ) e Y Y Y a b X a Y a b X b Y a b X i i N i i i i i N i N i i i N i i i N 2 1 2 2 11 2 1 2 1 0 0 = − = − + = − + = − + = = == = = ∑ ∑∑ ∑ ∑  m i n ∂ ∂ ∂ ∂ 1.3.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades
  • 24. Recta de regresión mínimo cuadrática (puntuaciones directas): ( )( ) ( ) ( ) a Y b X b X X Y Y X X S S r S S Y a b X Y b X X i i N i i i N x y x x y y x i i i = − = − − − = = = + = + − = = ∑ ∑ 1 1 2 2 º  1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades
  • 25. Ejemplo de cálculo de la recta de regresión de mínimos cuadrados 56,582,5004155 17,5520,253,94,5810 6,6512,251,93,569 7,256,252,92,548 1,352,250,91,557 -0,550,25-1,10,536 1,050,25-2,1-0,525 0,152,25-0,1-1,544 2,756,25-1,1-2,533 10,8512,25-3,1-3,512 9,4520,25-2,1-4,521 yx X X Y Y   X X Y Y ( )X X 2
  • 26. Recta de regresión mínimo cuadrática:      a Y bX b X X Y Y X X Y X i i N i i i N i i                   4 1 0 743 55 0 021 56 50 82 50 0 743 0 021 0 743 1 1 2 , , , , , , ,  , , 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades iXY 742,0021,0ˆ += dependencia de escalas.xls
  • 27. Propiedades de la Recta de regresión mínimo cuadrática: 1.4.1. La recta de regresión de mínimos cuadrados en puntuaciones directas y principales propiedades 1) La media de las puntuaciones predichas es igual a la media de Y 2) Los errores tienen media cero 3) La recta de mínimos cuadrados pasa por el punto: 4) Los errores no correlacionan ni con la variable predictora ni con las puntuaciones predichas  X Y,
  • 28. 1.4.2. La recta de regresión de mínimos cuadrados en puntuaciones diferenciales a) Modelo y recta en puntuaciones diferenciales ( ) ( ) bxy ebxy eXXbYY ebXXbYebXaY = += +−=− ++−=++= ˆ
  • 29. 1.4.2. La recta de regresión de mínimos cuadrados en puntuaciones estandarizadas a) Modelo y recta en puntuaciones estandarizadas xixyi eixixyyi y i x i xy y i ii x y xyi ZrZ ZZrZ S e S x r S y ex S S ry ebxy = += += +      = += ˆ
  • 30. iXY 742,0021,0ˆ += xy 742,0ˆ = xZZ 86,0ˆ = Recta de regresión en diferenciales y en tipificadas. Relación entre b y r. Interpretación de los coeficientes de la regresión a) En puntuaciones directas b) En puntuaciones diferenciales c) En puntuaciones estandarizadas y x xy S S br =
  • 35. Xi Yi 1.4. El contraste de la regresión: introducción ii bXaY +=ˆ
  • 36. Xi Yi Y Desviación Desviación Desviación total explicada residual ii bXaY +=ˆ 1.4.1.Componentes de variabilidad y bondad de ajuste ( ) ( ) ( )iiii YYYYYY ˆˆ −+−=−
  • 37. 1.4.1. Componentes de variabilidad y bondad de ajuste Xi SC SC SCt res exp Variación Total Variación Explicada Variación Residual ( ) ( ) ( ) 2 1 2 1 2 1 ˆˆ ∑∑∑ === −+−=− N i ii N i i N i YYYYYY
  • 38.    SC Y Y y Y Y N N St i i N i i N i i i N i N y                    1 2 2 1 2 1 2 1 2 1 1.4.1. Componentes de variabilidad y bondad de ajuste ( ) ( ) ( ) 22 1 2 122 1 22 2 1 2 2 1 exp 1ˆ x N i N i i i N i i N i N i SNb N X XbxbXXbYYSC −=                     −==−=−= ∑ ∑ ∑∑∑ = = === Fórmulas para calcular las sumas de cuadrados en puntuaciones directas y diferenciales: ( ) exp 1 2 2 1 ˆ SCSCeYYSC t N i i N i iires −==−= ∑∑ ==
  • 39. 1.4.1. Componentes de variabilidad y bondad de ajuste Fórmulas para calcular las sumas de cuadrados en tipificadas: SC SC SCt res exp ( ) ( )( )2 2 1 22 1 2 exp 1 2 11 1ˆ 1 xyres xy N i xxy N i i N i yt rNSC NrZrZSC NZSC −−= −=== −== ∑∑ ∑ == =
  • 40. 1.4.1. Componentes de variabilidad y bondad de ajuste Bondad de ajuste o Coeficiente de determinación   SC SC SC SC SC SC R R t t t res t      exp 1 12 2 ( ) ( ) ( ) ( ) 2 2 22 1 2 22 1 2 1 2 exp2 ˆ xy y x N i i N i i N i i t r S Sb YY XXb YY YY SC SC R == − − = − − == ∑∑ ∑ == =
  • 41. 1.4.1. Componentes de variabilidad y bondad de ajuste r2 xy= 1 r2 xy= 0 r2 xy Representación en diagramas de Venn Y X Y X XY
  • 42. Esquema del Contraste de Hipótesis Contrastar una Hipótesis Estadísticamente es juzgar si cierta propiedad supuesta para una población es compatible con lo observado en una muestra de ella. 1.4.2. Validación del modelo
  • 43. Elementos de una Prueba de Hipótesis 1.- Hipótesis Nula (H0), Hipótesis Alternativa. 2.- Estadístico de Contraste (Discrepancia). 3.- Región de Rechazo (Región Crítica): nivel de significación. 4.- Regla de Decisión.
  • 44. 1.4.2. Validación del modelo 1.- Hipótesis Nula (H0), Hipótesis Alternativa. 2.- Estadístico de Contraste (Discrepancia). F S S SC k SC N K r K r N K res res xy xy         exp exp 2 2 2 2 1 1 1 ( ) ( ) iiii ii XYXXYEH YXYEH εββββ εµµβ ++=⇒+= +=⇒== 10101 00 /: /:
  • 45. 1.4.2. Validación del modelo 3.- Región de Rechazo (Región Crítica): nivel de significación. Región de aceptación de H0 Región de rechazo de H0 1- Fc
  • 46. 4.- Regla de Decisión. 1.4.2. Validación del modelo Se rechaza la H0 si: F >Fc o de manera equivalente si: p <  Por el contrario, se acepta la H0 si: F  ≤Fc o de manera equivalente si: p ≥
  • 49. 1.4.3. Significación de parámetros 1.- Hipótesis Nula (H0), Hipótesis Alternativa. 2.- Estadístico de Contraste (Discrepancia).   t b S b S X X b S X X N r r N b res i i N res i i i N i N xy xy                        1 2 2 1 2 2 1 2 1 2 1 2 H H H H 0 1 1 1 0 1 0 0 0 0 : : : :         Nota: en regresión simple t2 = F
  • 50. 1.4.3. Significación de parámetros 3.- Región de Rechazo (Región Crítica): nivel de significación. ∀ Fc Región de aceptación de H0 Regiones de rechazo de H0  2  2 1 
  • 51. 4.- Regla de Decisión. Se rechaza la H0 si: t  >+tc o de manera equivalente si: p <  Por el contrario, se acepta la H0 si:  t  ≤  +tc o de manera equivalente si: p≥ 1.4.3. Significación de parámetros
  • 53. Tabla t de Student
  • 54. Calculadoras estadísticas en internet http://faculty.vassar.edu/lowry/VassarStats.htm http://davidmlane.com/hyperstat/t_table.html http://davidmlane.com/hyperstat/F_table.html http://calculators.stat.ucla.edu/cdf/ http://members.aol.com/johnp71/pdfs.html http://www.psychstat.missouristate.edu/introbook/tdist.htm http://www.psychstat.missouristate.edu/introbook/fdist.htm
  • 55. 1.6. Predicción Intervalos de predicción: ( ) ( ) ( ) Y Y t S N X X X X o N K r e s o i i N:  , ± + + − −             − − = ∑ α 1 2 2 2 1 1 1

Notas del editor

  1. Como ya hemos comentado en la presentación la organización del temario de la asignatura está función del número de variables que vamos a manejar y del criterio de medida utilizado. La situación investigación más simple en la que podemos plantearnos construir un modelo de regresión se refiere casos en los que pretendamos relacionar dos variables siendo la variable dependiente cuantitativa. Ejemplos: En este tema estudiaremos cómo construir un modelo para representar la dependencia lineal de una variable de respuesta, Y, respecto a otra variables explicativa, X. Empezaremos por situar el problema en el ámbito de la investigación en psicología y pasaremos a describir la metodología a utilizar para construir un modelo de regresión que en cualquier caso debe comenzar con un gráfico de los datos, seguirá por la estimación de parámetros, posterioremente se efectúan constrastes de hipótesis respecto a los parámetros y, finalmente se comprueban las hipótesis de partida mediante el análisis de residuos.
  2. El número de filas de las matrices de datos corresponde al tamaño de la muestra (N) y el número de columnas a las variables medidas. La matriz de datos se representan genéricamente por X y su orden es de Nx2.
  3. Decimos que dos variables están relacionadas cuando podemos detectar algún patrón de variación conjunta. La primera herramienta que vamos a utilizar para identificar y describir una relación entre dos variables es el gráfico de dispersión. El gráfico de dispersión, o nube de puntos, es una representación gráfica de la relación entre dos variables que se construye representando los pares de valores de las variables medidas en el plano cartesiano. La diapositiva muestra diferentes nubes de puntos todas tienen en común que representan relaciones funcionales o deterministas entre las variables. Difieren en que los tres de arriba muestran tendencias lineales o ausencia de relación y los dos de abajo muestran tendencias no lineales.
  4. Lo que tienen en común estos gráficos es que representan relaciones estadísticas, estocásticas o probabilísticas. Son de este tipo de relaciones de las que nos ocuparemos en esta asignatura. Concretamente aprenderemos a estimar y comprobar la existencia de relaciones lineales en las poblaciones de las que proceden las muestras.
  5. Los gráficos de dispersión son una herramienta muy útil para hacer una primera exploración, más cualitativa, de la existencia de relación entre las variables, del tipo de relación y de anomalías en la muestra que tendremos que resolver. Pero la estimación de dónde hay más relación comparando varios gráficos no es tan sencilla pues la inferencia a partir de la inspección visual está sujeta a múltiples factores: escalas, marcadores, colores, etc. Es por ello que necesitamos índices analíticos que nos permitan establecer la magnitud de la relación lineal entre las variables.
  6. En prácticas desarrollaremos fórmulas que permitan calcular la covarianza de manera rápida. Pero
  7. En los apartados que siguen estudiaremos como construir un modelo para representar la dependencia lineal de una variable de respuesta, y, respecto a otra variable explicativa, x. Desde Galton, los modelos estadísticos que explican la dependencia de una variable y respecto de una o varias variables se denominan modelos de regresión. Poner un ejemplo de predicción. Por ejemplo si conocemos la distribución de las notas en análisis de datos II de los alumnos de psicología y queremos predecir cual será la nota de cualquiera de vosotros ¿Cuál sería la mejor estimación?. y si sabemos que las notas dependen de las horas de estudio ¿Cuál será la mejor estimación?. la media de las notas correspondiente a las horas de estudio. Recordemos el diagrama de dispersión de una relación directa y admitamos que todos los factores o causas que influyen en una variable de respuesta, dependiente, endógena o criterio (y) se pueden dividir en dos grupos: el primero contiene a una variable (x) llamada predictora, explicativa, exógena o independiente y que se supone no aleatoria y conocida al observar (y); el segundo incluye el resto de factores, cada uno de los cuales influye en la respuesta sólo en pequeña magnitud, que englobaremos dentro del nombre común de perturbación aleatoria o término de error. La expresión matemática que relaciona esos tres términos le denominamos modelo de regresión. Si la función que relaciona Y con X es la ecuación de una recta el modelo es de regresión lineal.
  8. Vamos a suponer que si los datos se han extraído de una población para la que es válido el modelo de regresión formulado en la muestra dicho modelo también se cumple y podemos escribir que: