25/05/14 Mgter. Roberto M. Bula M. 1
Análisis de
Regresión
Por:
Roberto M. Bula M.
25/05/14 Mgter. Roberto M. Bula M. 2
Análisis de Regresión
En los negocios, en las ciencias naturales en la
planificación de los recursos humanos y del gasto, en
todas las ciencias, generalmente, se pueden expresar las
relaciones funcionales entre dos o más variables.
Ejemplo:
•El peso y la talla. A mayor talla mayor peso.
• La experiencia y la productividad del personal de la
empresa. A mayor años de experiencia mayor es la
productividad.
En estos ejemplos, la relación funcional es directa o
positiva.
25/05/14 Mgter. Roberto M. Bula M. 3
Análisis de Regresión
 El análisis de regresión es una herramienta estadística
poderosa y versátil, que permite cuantificar, a través de
una función matemática, la relación entre dos o más
variables.
 En la relación de variables se considera la presencia de
una variable dependiente en función de una (regresión
simple) o más variables independientes (regresión
múltiple).
Una función matemática de Y con respecto a X, es
representada por:
Y=f(x),
es decir, la ecuación matemática que representa en el plano
cartesiano la relación de dos variables.
25/05/14 Mgter. Roberto M. Bula M. 4
Función matemática
 Ejemplos de dos funciones matemáticas
x
eY =
bXaY +=
Función No Lineal Función Lineal
)(xfY =
)(xfY =
http://www.becarioenmoncloa.com/archives/date/2008/07.html25/05/14 Mgter. Roberto M. Bula M. 5
Panamá-Balance Fiscal 2011. http://pma507pty.com/
25/05/14 Mgter. Roberto M. Bula M. 6
Ejemplo
25/05/14 Mgter. Roberto M. Bula M. 7
25/05/14 Mgter. Roberto M. Bula M. 8
Objetivos de la Regresión
Los dos objetivos fundamentales de este análisis serán, 1.
Determinar si dichas variables están asociadas y en qué
sentido se da dicha asociación (es decir, si los valores de
una de las variables tienden a aumentar –o disminuir-
al aumentar los valores de la otra); y
2. Estudiar si los valores de una variable pueden ser
utilizados para predecir el valor de la otra.
25/05/14 Mgter. Roberto M. Bula M. 9
Diagrama de Dispersión (Nube de Puntos):
El análisis de regresión o la aplicación de esta herramienta
estadística, puede iniciar con la verificación de la relación entre
dos variables, representando los datos en una gráfica, llamada
Diagrama de Dispersión.
El Diagrama de Dispersión, es la representación gráfica de los
puntos o pares ordenados (x,y) en el plano cartesiano. También
es llamado Nube de Puntos.
El par (X, Y), es el punto coordenada de las dos variables de
estudio. Un punto coordenada, será por ejemplo, tu peso y talla.
Donde para una misma unidad se le toman dos mediciones (X y
Y). Supóngase que su peso y talla es 125 lbs y 1.60 de estatura
el punto coordenada, será (1.60, 125 lbs). Esto es considerando
la talla como la variable independiente (X) y al peso como la
variable dependiente (Y).
El análisis de regresión o la aplicación de esta herramienta
estadística, puede iniciar con la verificación de la relación entre
dos variables, representando los datos en una gráfica, llamada
Diagrama de Dispersión.
El Diagrama de Dispersión, es la representación gráfica de los
puntos o pares ordenados (x,y) en el plano cartesiano. También
es llamado Nube de Puntos.
El par (X, Y), es el punto coordenada de las dos variables de
estudio. Un punto coordenada, será por ejemplo, tu peso y talla.
Donde para una misma unidad se le toman dos mediciones (X y
Y). Supóngase que su peso y talla es 125 lbs y 1.60 de estatura
el punto coordenada, será (1.60, 125 lbs). Esto es considerando
la talla como la variable independiente (X) y al peso como la
variable dependiente (Y).
25/05/14 Mgter. Roberto M. Bula M. 10
Diagrama de Dispersión
Para representar los puntos coordenadas en el diagrama o
gráfica de dispersión, en el eje X se representarán los datos
de la variable independiente y en el eje Y, los que
corresponden a la variable dependiente.
X Y
2 6
3 15
4 23
5 28
6 32
El diagrama de dispersión se puede elaborar fácilmente utilizando Gráficas de Excel.
Seleccione la opción XY dispersión. Antes debe haber seleccionado sus datos en el mismo
orden. Observe la ilustración.
25/05/14 Mgter. Roberto M. Bula M. 11
Diagrama de Dispersión
En el análisis de regresión, son importantes dos datos: 1. El
indicador coeficiente de determinación (R2
); y 2. El modelo de
regresión o ecuación matemática.
Estos datos, se
pueden obtener
fácilmente a través
de la herramienta
Gráfica, luego
Agregar línea de
tendencia y luego
Opciones.
Observe la figura.
Una vez completado el cuadro de diálogo, aparecerá en la gráfica la
ecuación y el R2
que se explicará más adelante.
25/05/14 Mgter. Roberto M. Bula M. 12
Diagrama de Dispersión
La buena interpretación del diagrama de dispersión es el
primer paso para un buen análisis de los datos X,Y.
Observe los distintos modelos, como ejemplo.
25/05/14 Mgter. Roberto M. Bula M. 13
No hay
Correlación
30
80
130
180
230
280
330
140 150 160 170 180 190 200
Relación directa e inversa
Relación
directa (fuerte).
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Relación
inversa
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
Para valores de X por encima de la
media tenemos valores de Y por
encima y por debajo en
proporciones similares. No hay
correlación.
Para los valores de X mayores que
la media le corresponden valores
de Y menores. Esto es relación
inversa o decreciente.
•Para valores de X mayores que la media
le corresponden valores de Y mayores
también.
Paras valores de X menores que la media
le corresponden valores de Y menores
también.
Esto se llama relación directa.
25/05/14 Mgter. Roberto M. Bula M. 14
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Parece que el peso aumenta con la
altura
Relación entre variables
25/05/14 Mgter. Roberto M. Bula M. 15
Modelo de Regresión
 La ecuación de una gráfica lineal o modelo de
regresión para el caso “Regresión Lineal
Simple”, es:
XbaY ˆˆˆ +=
Donde:
Y = variable dependiente
X= variable independiente (regresora o explicativa)
a= coeficiente de intersección. Es el valor donde la recta corta
el eje de Y.
b= coeficiente de pendiente. Es la pendiente de la recta.
25/05/14 Mgter. Roberto M. Bula M. 16
Cálculo de los Coeficientes
 La ecuación de regresión es estimada a partir de
los datos de una muestra.
 Para determinar la ecuación de regresión lineal,
hay que despejar los coeficientes estimados a y b.
 La fórmula de estos coeficientes son obtenidas
por métodos matemáticos y estadísticos
denominados “Mínimos Cuadrados”.
25/05/14 Mgter. Roberto M. Bula M. 17
Cálculo de los Coeficientes
 Las fórmulas para estimar los coeficientes son:
( ) ( )
( ) ∑
∑
∑ ∑
∑ ∑∑
−
−
=
−
−
= 2222
ˆ
XnX
YXnXY
XXn
YXXYn
b
XbY
n
X
b
n
Y
a ˆˆˆ −=−= ∑∑
25/05/14 Mgter. Roberto M. Bula M. 18
Ejemplo
5.6
10
65
)4(590
)8.20)(4(5481
ˆ
2
22
=
=
−
−
=
−
−
=
∑
∑
XnX
YXnXY
b X Y XY x
2
2 6 12 4
3 15 45 9
4 23 92 16
5 28 140 25
6 32 192 36
Suma 20 104 481 90
Media 4 20.8
Cálculos
Considere los datos del ejemplo anterior:
XbYa ˆˆ −=
2.5
4*5.68.20ˆ
−=
−=a
Dado que la media de Y es 20.8 y la
media de X es 4 y el coeficiente
pendiente es positivo (6.5). Se
reemplazan los valores en la
ecuación.
25/05/14 Mgter. Roberto M. Bula M. 19
Ecuación de regresión
XY 5.62.5ˆ +−=
Los coeficientes de regresión indican que:
Coeficiente “a”
•Para un X = 0, Y será igual a –5.2 (pérdida o decrecimiento de Y).
Coeficiente “b”
•Si X crece en una unidad, entonces Y aumentará 6.5 veces más.
Utilizando Gráfica de Excel, recuerde que puede incluir la
ecuación correspondiente a sus datos.
25/05/14 Mgter. Roberto M. Bula M. 20
Aplicación en Excel
Excel, cuenta con otra herramienta, Regresión en Análisis de
Datos. Esta herramienta, además del diagrama de dispersión
proporciona otros datos que permiten evaluar la bondad de
ajuste del modelo de regresión.
Utilizando Análisis de datos en Excel, se selecciona Regresión. Luego se debe completar
los rangos de entrada. Marque la casilla de “Curva de regresión ajustada”.
25/05/14 Mgter. Roberto M. Bula M. 21
Práctica
 Con los sigueintes datos, confeccione la gráfica de dispersión y
exprese la ecuación de regresión:
Y X
(promedio de
calificaciones)
(ingreso de los
padres en miles de
dólares)
4 21
3 15
3.5 15
2 8
3 12
3.5 18
2.5 6
2.5 12
Diagrama de dispersión del ingreso de los
padres y los promedios de calificaciones de
sus hijos
0
1
2
3
4
5
0 5 10 15 20 25
Ingreso
Promedio
Y=1.40+0.12X
Ecuación de
Regresión
25/05/14 Mgter. Roberto M. Bula M. 22
Correlación
El análisis de correlación agrupa técnicas para medir
el grado de asociación o relación entre dos o más
variables.
En 1900, Karl Pearson, desarrolló el coeficiente de
correlación, el cual describe la magnitud entre dos
conjuntos de variables de intervalo o de razón. Éste
coeficiente se designa como “r” y con frecuencia se le
llama r de Pearson. El coeficiente de correlación toma
valores de –1 hasta 1.
Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva
-1 -0.5 0 +0.5 +1
25/05/14 Mgter. Roberto M. Bula M. 23
Correlación
En el análisis de regresión se busca relacionar
variables que permitan predecir o explicar una
variable independiente. Por tanto, la relación que se
espera entre las variables independientes con la
variable dependiente, es que sea de moderada a fuerte
correlación.
Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva
-1 -0.5 0 +0.5 +1
25/05/14 Mgter. Roberto M. Bula M. 24
Coeficiente de correlación
∑∑∑∑
∑ ∑ ∑
−−
−
= 2222
)()()()(
))(()(
YYnXXn
YXXYn
r
Fórmula:
Si el coeficiente de correlación entre X y Y es bajo,
entonces la ecuación de regresión no es buena para
predecir o pronosticar. Por lo tanto es necesario
investigar otras variables independientes.
25/05/14 Mgter. Roberto M. Bula M. 25
r=0,1
30
80
130
180
230
280
330
140 150 160 170 180 190 200
r=0,4
30
40
50
60
70
80
90
100
110
120
130
140 150 160 170 180 190 200
r=0,8
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
r=0,99
30
40
50
60
70
80
90
100
140 150 160 170 180 190 200
Entrenando el ojo:
correlaciones positivas
25/05/14 Mgter. Roberto M. Bula M. 26
r=-0,5
0
10
20
30
40
50
60
70
80
90
140 150 160 170 180 190 200
r=-0,7
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
r=-0,95
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
r=-0,999
0
10
20
30
40
50
60
70
80
140 150 160 170 180 190 200
Entrenando el ojo:
correlaciones negativas
25/05/14 Mgter. Roberto M. Bula M. 27
Coeficiente de determinación: R2
Dado que la magnitud del coeficiente de correlación es
expresada como fuerte, moderada o débil, esto no da un
significado preciso de la variabilidad de Y.
Sin embargo, el coeficiente de determinación, indica la
proporción de la variación de Y que es explicada por X.
En términos porcentuales, entre más se acerca la
proporción de explicación a 100%, mejor es la
explicación que le da X a la variación de Y. Esto
permitirá una ajuste perfecto y mejores predicciones
estadísticas.
25/05/14 Mgter. Roberto M. Bula M. 28
Coeficiente de determinación
Fórmula:
22
rR =
El coeficiente de determinación se expresa como R2
, y
varía desde 0 (poca o ninguna explicación), hasta 1
(buena proporción de explicación de X sobre Y). Estos
valores se pueden expresar en términos porcentuales
multiplicándolos por 100.
Igualmente que en el coeficiente de correlación, se
espera que R2
sea de moderado a alto.
25/05/14 Mgter. Roberto M. Bula M. 29
Animación: Evolución de r y diagrama de dispersión
25/05/14 Mgter. Roberto M. Bula M. 30
Datos: Utilizando la Herramienta
Regresión de Análisis de Datos
25/05/14 Mgter. Roberto M. Bula M. 31
Datos: Utilizando la Herramienta Regresión de
Análisis de Datos
Datos de:
Coeficiente de Correlación y de
Determinación, además del
error típico para estos datos.
Estos datos permite determinar si el
modelo de regresión es bueno utilizarlo
para pronosticar. ¿Cómo decido esto?.
Observe la última columna, “Valor crítico
de F”. Si este valor es menor que 0.05,
puede aceptar la hipótesis de que el
modelo es útil o bueno (Existe una buena
relación lineal entre X y Y”.
Estos datos nos dan los coeficientes de
la ecuación: Observe que –5.2 es el
valor de “a”, y 6.5 el valor de “b”.
Reemplazando estos datos en la
ecuación general, se obtiene el modelo
para estos datos: Así Y=-5.2+6.5 X.
Estos, muestran el pronóstico para cada valor de
X (2, 3, 4, 5 y 6) Haga los cálculos manuales
para verificar esto. Reemplace en la ecuación
cada valor en X.
25/05/14 Mgter. Roberto M. Bula M. 32
Práctica
 Se recolectaron los valores mensuales
por gastos de publicidad y número de
pasajeros para los n=15 meses más
recientes. Utilice Gastos de publicidad
como la variable independiente.
Realice un análisis de regresión lineal
simple para:
– Determinar si existe relación entre
estas dos variables.
– Encuentre la ecuación o modelo de
regresión.
– Indique si este modelo es bueno
utilizarlo para pronosticar el número
de pasajeros en los próximos meses.
– Qué interpretación hace de los
hallazgos encontrados.
Observación
costo de
publicidad
Pasajeros
(en miles)
1 10 15
2 12 17
3 8 13
4 17 23
5 10 16
6 15 21
7 10 14
8 14 20
9 19 24
10 10 17
11 11 16
12 13 18
13 16 23
14 10 15
15 12 16
25/05/14 Mgtra. Elisa Mendoza G. 33
Práctica
 Describa la
tendencia
observada en la
gráfica e
indique qué se
puede esperar
de la variable
de estudio para
los próximos
años.
25/05/14 Mgter. Roberto M. Bula M. 33

Regresiòn

  • 1.
    25/05/14 Mgter. RobertoM. Bula M. 1 Análisis de Regresión Por: Roberto M. Bula M.
  • 2.
    25/05/14 Mgter. RobertoM. Bula M. 2 Análisis de Regresión En los negocios, en las ciencias naturales en la planificación de los recursos humanos y del gasto, en todas las ciencias, generalmente, se pueden expresar las relaciones funcionales entre dos o más variables. Ejemplo: •El peso y la talla. A mayor talla mayor peso. • La experiencia y la productividad del personal de la empresa. A mayor años de experiencia mayor es la productividad. En estos ejemplos, la relación funcional es directa o positiva.
  • 3.
    25/05/14 Mgter. RobertoM. Bula M. 3 Análisis de Regresión  El análisis de regresión es una herramienta estadística poderosa y versátil, que permite cuantificar, a través de una función matemática, la relación entre dos o más variables.  En la relación de variables se considera la presencia de una variable dependiente en función de una (regresión simple) o más variables independientes (regresión múltiple). Una función matemática de Y con respecto a X, es representada por: Y=f(x), es decir, la ecuación matemática que representa en el plano cartesiano la relación de dos variables.
  • 4.
    25/05/14 Mgter. RobertoM. Bula M. 4 Función matemática  Ejemplos de dos funciones matemáticas x eY = bXaY += Función No Lineal Función Lineal )(xfY = )(xfY =
  • 5.
  • 6.
    Panamá-Balance Fiscal 2011.http://pma507pty.com/ 25/05/14 Mgter. Roberto M. Bula M. 6
  • 7.
  • 8.
    25/05/14 Mgter. RobertoM. Bula M. 8 Objetivos de la Regresión Los dos objetivos fundamentales de este análisis serán, 1. Determinar si dichas variables están asociadas y en qué sentido se da dicha asociación (es decir, si los valores de una de las variables tienden a aumentar –o disminuir- al aumentar los valores de la otra); y 2. Estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra.
  • 9.
    25/05/14 Mgter. RobertoM. Bula M. 9 Diagrama de Dispersión (Nube de Puntos): El análisis de regresión o la aplicación de esta herramienta estadística, puede iniciar con la verificación de la relación entre dos variables, representando los datos en una gráfica, llamada Diagrama de Dispersión. El Diagrama de Dispersión, es la representación gráfica de los puntos o pares ordenados (x,y) en el plano cartesiano. También es llamado Nube de Puntos. El par (X, Y), es el punto coordenada de las dos variables de estudio. Un punto coordenada, será por ejemplo, tu peso y talla. Donde para una misma unidad se le toman dos mediciones (X y Y). Supóngase que su peso y talla es 125 lbs y 1.60 de estatura el punto coordenada, será (1.60, 125 lbs). Esto es considerando la talla como la variable independiente (X) y al peso como la variable dependiente (Y). El análisis de regresión o la aplicación de esta herramienta estadística, puede iniciar con la verificación de la relación entre dos variables, representando los datos en una gráfica, llamada Diagrama de Dispersión. El Diagrama de Dispersión, es la representación gráfica de los puntos o pares ordenados (x,y) en el plano cartesiano. También es llamado Nube de Puntos. El par (X, Y), es el punto coordenada de las dos variables de estudio. Un punto coordenada, será por ejemplo, tu peso y talla. Donde para una misma unidad se le toman dos mediciones (X y Y). Supóngase que su peso y talla es 125 lbs y 1.60 de estatura el punto coordenada, será (1.60, 125 lbs). Esto es considerando la talla como la variable independiente (X) y al peso como la variable dependiente (Y).
  • 10.
    25/05/14 Mgter. RobertoM. Bula M. 10 Diagrama de Dispersión Para representar los puntos coordenadas en el diagrama o gráfica de dispersión, en el eje X se representarán los datos de la variable independiente y en el eje Y, los que corresponden a la variable dependiente. X Y 2 6 3 15 4 23 5 28 6 32 El diagrama de dispersión se puede elaborar fácilmente utilizando Gráficas de Excel. Seleccione la opción XY dispersión. Antes debe haber seleccionado sus datos en el mismo orden. Observe la ilustración.
  • 11.
    25/05/14 Mgter. RobertoM. Bula M. 11 Diagrama de Dispersión En el análisis de regresión, son importantes dos datos: 1. El indicador coeficiente de determinación (R2 ); y 2. El modelo de regresión o ecuación matemática. Estos datos, se pueden obtener fácilmente a través de la herramienta Gráfica, luego Agregar línea de tendencia y luego Opciones. Observe la figura. Una vez completado el cuadro de diálogo, aparecerá en la gráfica la ecuación y el R2 que se explicará más adelante.
  • 12.
    25/05/14 Mgter. RobertoM. Bula M. 12 Diagrama de Dispersión La buena interpretación del diagrama de dispersión es el primer paso para un buen análisis de los datos X,Y. Observe los distintos modelos, como ejemplo.
  • 13.
    25/05/14 Mgter. RobertoM. Bula M. 13 No hay Correlación 30 80 130 180 230 280 330 140 150 160 170 180 190 200 Relación directa e inversa Relación directa (fuerte). 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 Relación inversa 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 Para valores de X por encima de la media tenemos valores de Y por encima y por debajo en proporciones similares. No hay correlación. Para los valores de X mayores que la media le corresponden valores de Y menores. Esto es relación inversa o decreciente. •Para valores de X mayores que la media le corresponden valores de Y mayores también. Paras valores de X menores que la media le corresponden valores de Y menores también. Esto se llama relación directa.
  • 14.
    25/05/14 Mgter. RobertoM. Bula M. 14 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 Parece que el peso aumenta con la altura Relación entre variables
  • 15.
    25/05/14 Mgter. RobertoM. Bula M. 15 Modelo de Regresión  La ecuación de una gráfica lineal o modelo de regresión para el caso “Regresión Lineal Simple”, es: XbaY ˆˆˆ += Donde: Y = variable dependiente X= variable independiente (regresora o explicativa) a= coeficiente de intersección. Es el valor donde la recta corta el eje de Y. b= coeficiente de pendiente. Es la pendiente de la recta.
  • 16.
    25/05/14 Mgter. RobertoM. Bula M. 16 Cálculo de los Coeficientes  La ecuación de regresión es estimada a partir de los datos de una muestra.  Para determinar la ecuación de regresión lineal, hay que despejar los coeficientes estimados a y b.  La fórmula de estos coeficientes son obtenidas por métodos matemáticos y estadísticos denominados “Mínimos Cuadrados”.
  • 17.
    25/05/14 Mgter. RobertoM. Bula M. 17 Cálculo de los Coeficientes  Las fórmulas para estimar los coeficientes son: ( ) ( ) ( ) ∑ ∑ ∑ ∑ ∑ ∑∑ − − = − − = 2222 ˆ XnX YXnXY XXn YXXYn b XbY n X b n Y a ˆˆˆ −=−= ∑∑
  • 18.
    25/05/14 Mgter. RobertoM. Bula M. 18 Ejemplo 5.6 10 65 )4(590 )8.20)(4(5481 ˆ 2 22 = = − − = − − = ∑ ∑ XnX YXnXY b X Y XY x 2 2 6 12 4 3 15 45 9 4 23 92 16 5 28 140 25 6 32 192 36 Suma 20 104 481 90 Media 4 20.8 Cálculos Considere los datos del ejemplo anterior: XbYa ˆˆ −= 2.5 4*5.68.20ˆ −= −=a Dado que la media de Y es 20.8 y la media de X es 4 y el coeficiente pendiente es positivo (6.5). Se reemplazan los valores en la ecuación.
  • 19.
    25/05/14 Mgter. RobertoM. Bula M. 19 Ecuación de regresión XY 5.62.5ˆ +−= Los coeficientes de regresión indican que: Coeficiente “a” •Para un X = 0, Y será igual a –5.2 (pérdida o decrecimiento de Y). Coeficiente “b” •Si X crece en una unidad, entonces Y aumentará 6.5 veces más. Utilizando Gráfica de Excel, recuerde que puede incluir la ecuación correspondiente a sus datos.
  • 20.
    25/05/14 Mgter. RobertoM. Bula M. 20 Aplicación en Excel Excel, cuenta con otra herramienta, Regresión en Análisis de Datos. Esta herramienta, además del diagrama de dispersión proporciona otros datos que permiten evaluar la bondad de ajuste del modelo de regresión. Utilizando Análisis de datos en Excel, se selecciona Regresión. Luego se debe completar los rangos de entrada. Marque la casilla de “Curva de regresión ajustada”.
  • 21.
    25/05/14 Mgter. RobertoM. Bula M. 21 Práctica  Con los sigueintes datos, confeccione la gráfica de dispersión y exprese la ecuación de regresión: Y X (promedio de calificaciones) (ingreso de los padres en miles de dólares) 4 21 3 15 3.5 15 2 8 3 12 3.5 18 2.5 6 2.5 12 Diagrama de dispersión del ingreso de los padres y los promedios de calificaciones de sus hijos 0 1 2 3 4 5 0 5 10 15 20 25 Ingreso Promedio Y=1.40+0.12X Ecuación de Regresión
  • 22.
    25/05/14 Mgter. RobertoM. Bula M. 22 Correlación El análisis de correlación agrupa técnicas para medir el grado de asociación o relación entre dos o más variables. En 1900, Karl Pearson, desarrolló el coeficiente de correlación, el cual describe la magnitud entre dos conjuntos de variables de intervalo o de razón. Éste coeficiente se designa como “r” y con frecuencia se le llama r de Pearson. El coeficiente de correlación toma valores de –1 hasta 1. Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva -1 -0.5 0 +0.5 +1
  • 23.
    25/05/14 Mgter. RobertoM. Bula M. 23 Correlación En el análisis de regresión se busca relacionar variables que permitan predecir o explicar una variable independiente. Por tanto, la relación que se espera entre las variables independientes con la variable dependiente, es que sea de moderada a fuerte correlación. Fuerte correlación negativa Correlación débil o nula Fuerte correlación positiva -1 -0.5 0 +0.5 +1
  • 24.
    25/05/14 Mgter. RobertoM. Bula M. 24 Coeficiente de correlación ∑∑∑∑ ∑ ∑ ∑ −− − = 2222 )()()()( ))(()( YYnXXn YXXYn r Fórmula: Si el coeficiente de correlación entre X y Y es bajo, entonces la ecuación de regresión no es buena para predecir o pronosticar. Por lo tanto es necesario investigar otras variables independientes.
  • 25.
    25/05/14 Mgter. RobertoM. Bula M. 25 r=0,1 30 80 130 180 230 280 330 140 150 160 170 180 190 200 r=0,4 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 r=0,8 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 r=0,99 30 40 50 60 70 80 90 100 140 150 160 170 180 190 200 Entrenando el ojo: correlaciones positivas
  • 26.
    25/05/14 Mgter. RobertoM. Bula M. 26 r=-0,5 0 10 20 30 40 50 60 70 80 90 140 150 160 170 180 190 200 r=-0,7 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 r=-0,95 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 r=-0,999 0 10 20 30 40 50 60 70 80 140 150 160 170 180 190 200 Entrenando el ojo: correlaciones negativas
  • 27.
    25/05/14 Mgter. RobertoM. Bula M. 27 Coeficiente de determinación: R2 Dado que la magnitud del coeficiente de correlación es expresada como fuerte, moderada o débil, esto no da un significado preciso de la variabilidad de Y. Sin embargo, el coeficiente de determinación, indica la proporción de la variación de Y que es explicada por X. En términos porcentuales, entre más se acerca la proporción de explicación a 100%, mejor es la explicación que le da X a la variación de Y. Esto permitirá una ajuste perfecto y mejores predicciones estadísticas.
  • 28.
    25/05/14 Mgter. RobertoM. Bula M. 28 Coeficiente de determinación Fórmula: 22 rR = El coeficiente de determinación se expresa como R2 , y varía desde 0 (poca o ninguna explicación), hasta 1 (buena proporción de explicación de X sobre Y). Estos valores se pueden expresar en términos porcentuales multiplicándolos por 100. Igualmente que en el coeficiente de correlación, se espera que R2 sea de moderado a alto.
  • 29.
    25/05/14 Mgter. RobertoM. Bula M. 29 Animación: Evolución de r y diagrama de dispersión
  • 30.
    25/05/14 Mgter. RobertoM. Bula M. 30 Datos: Utilizando la Herramienta Regresión de Análisis de Datos
  • 31.
    25/05/14 Mgter. RobertoM. Bula M. 31 Datos: Utilizando la Herramienta Regresión de Análisis de Datos Datos de: Coeficiente de Correlación y de Determinación, además del error típico para estos datos. Estos datos permite determinar si el modelo de regresión es bueno utilizarlo para pronosticar. ¿Cómo decido esto?. Observe la última columna, “Valor crítico de F”. Si este valor es menor que 0.05, puede aceptar la hipótesis de que el modelo es útil o bueno (Existe una buena relación lineal entre X y Y”. Estos datos nos dan los coeficientes de la ecuación: Observe que –5.2 es el valor de “a”, y 6.5 el valor de “b”. Reemplazando estos datos en la ecuación general, se obtiene el modelo para estos datos: Así Y=-5.2+6.5 X. Estos, muestran el pronóstico para cada valor de X (2, 3, 4, 5 y 6) Haga los cálculos manuales para verificar esto. Reemplace en la ecuación cada valor en X.
  • 32.
    25/05/14 Mgter. RobertoM. Bula M. 32 Práctica  Se recolectaron los valores mensuales por gastos de publicidad y número de pasajeros para los n=15 meses más recientes. Utilice Gastos de publicidad como la variable independiente. Realice un análisis de regresión lineal simple para: – Determinar si existe relación entre estas dos variables. – Encuentre la ecuación o modelo de regresión. – Indique si este modelo es bueno utilizarlo para pronosticar el número de pasajeros en los próximos meses. – Qué interpretación hace de los hallazgos encontrados. Observación costo de publicidad Pasajeros (en miles) 1 10 15 2 12 17 3 8 13 4 17 23 5 10 16 6 15 21 7 10 14 8 14 20 9 19 24 10 10 17 11 11 16 12 13 18 13 16 23 14 10 15 15 12 16
  • 33.
    25/05/14 Mgtra. ElisaMendoza G. 33 Práctica  Describa la tendencia observada en la gráfica e indique qué se puede esperar de la variable de estudio para los próximos años. 25/05/14 Mgter. Roberto M. Bula M. 33