El siguiente análisis de casos, está basado en las técnicas de análisis multivariante de datos (SPSS), el cual está dividido en tres preguntas, acompañadas de los análisis respectivos, referencias conceptuales y conclusiones de cada caso.
1. TALLER DE REGRESIÓN
TALLER DE REGRESIÓN
Ejercicios 2: Regresión SPSS / 15 mayo 2014
UNIVERSIDAD GALILEO
FACULTAD DE CIENCIA, TECNOLOGÍA E INDUSTRIA
DOCTORADO EN ADMINISTRACIÓN CON
ESPECIALIDAD EN FIANANZAS
ARQ. ALVARO COUTIÑO G
Carnet 1300-4393
2. TALLER DE REGRESIÓN
1
Contenido
INTRODUCCIÓN............................................................................................................ 2
1. PREGUNTA 1: ......................................................................................................... 2
Relación Gráfica:.......................................................................................................... 2
Relación numérica:....................................................................................................... 4
Correlaciones................................................................................................................ 4
Regresión...................................................................................................................... 6
2. PREGUNTA 2: ......................................................................................................... 8
Relación Gráfica:.......................................................................................................... 8
Relación numérica........................................................................................................ 9
Correlaciones............................................................................................................ 9
Regresión:............................................................................................................... 10
3. PREGUNTA 3:....................................................................................................... 19
Relación Gráfica:........................................................................................................ 20
Relación numérica:..................................................................................................... 21
Correlaciones.............................................................................................................. 22
Correlaciones.......................................................................................................... 22
Regresión................................................................................................................ 23
BIBLIOGRAFÍA............................................................................................................ 27
3. TALLER DE REGRESIÓN
2
INTRODUCCIÓN
El siguiente análisis de casos, está basado en las técnicas de análisis multivariante de
datos (SPSS), el cual está dividido en tres preguntas, acompañadas de los análisis
respectivos, referencias conceptuales y conclusiones de cada caso.
1. PREGUNTA 1:
Existe preocupación de parte del propietario de una gasolinera por el
aumento en el precio del combustible lo cuál puede afectar su negocio. El
gerente de la gasolinera piensa que el éxito de la gasolinera se basa en la
lealtad de lo clientes y no el flujo de tránsito. Se realizó un estudio
preliminar con una muestra de datos de ocho días los cuales son los
siguientes:
Día Galones vendidos (miles) Flujo de vehículos (cientos)
1 284 9
2 381 13
3 271 11
4 287 9
5 452 17
6 192 5
7 204 7
8 158 4
a. Que puede concluir usted al respecto?
b. Si el flujo promedio de vehículos bajara a 500 diarios, cuantos galones se
esperaría que vendiera la gasolinera?
Análisis Pregunta 1a: ¿Que puede concluir usted al respecto?
Lo primero es saber si las variables tienen correlación, para esto vamos a analizar si
las variables tienen una relación gráfica:
Relación Gráfica:
Para éste análisis realizamos los siguientes pasos:
1. Insertar información en Vista de datos y vista de variables
2. Gráficos
3. Cuadro de diálogos antiguos
4. Diagrama dispersión simple
5. Eje Y: Variable dependiente: Galones vendidos (Miles)
6. Eje X: Variable independiente: Flujos de vehículos (Cientos)
El siguiente paso es agregar el diagrama de dispersión:
4. TALLER DE REGRESIÓN
3
Por lo tanto, el diagrama representa el plano cartesiano y la nube de puntos
representa el flujo de vehículos y los galones vendidos
Gráfico: Diagrama de dispersión: Relación Vehículos y Galones vendidos
Ilustración 1 Diagrama de dispersión: Relación Vehículos y Galones vendidos
El siguiente paso es agregar la recta:
Gráfico: Línea de ajuste
Interpretaciones:
El diagrama representa el plano cartesiano y la nube de puntos representa el
flujo de vehículos y los galones vendidos.
R2
Lineal = 0.949
5. TALLER DE REGRESIÓN
4
Por lo tanto, representa la relación gráfica entre Galones vendidos y el Flujo de
vehículos.
En consecuencia, la recta es ascendente, lo que nos indica una correlación
positiva.
R2
= Lineal = 0.949
El siguiente paso, es la relación numérica.
Relación numérica:
Para este análisis realizaremos los siguientes pasos:
1. Analizar
2. Correlación
3. Bivariadas
4. Variables
a. Dependiente Y: Galones vendidos
b. Independiente X: Flujo de vehículos
5. Opciones:
a. Estadísticos:
i. Medias y desviaciones típicas
ii. Productos cruzados diferenciales y covarianzas
b. Valores perdidos
i. Excluir casos según pareja
6. Coeficiente de correlación:
a. Pearson
7. Prueba de significación:
a. Bilateral
8. Marcar las correlaciones significativas
Correlaciones
Estadísticos descriptivos
Estadísticos descriptivos
Media Desviación típica N
Galones vendidos 278.6250 98.79262 8
Flujo vehículos 9.3750 4.27409 8
6. TALLER DE REGRESIÓN
5
Correlaciones
Correlaciones
Galones vendidos Flujo vehículos
Galones vendidos
Correlación de Pearson
1
Sig. (bilateral) .000
Suma de cuadrados y productos cruzados 68319.875 2880.125
Covarianza 9759.982 411.446
N 8 8
Flujo vehículos
Correlación de Pearson .974**
1
Sig. (bilateral) .000
Suma de cuadrados y productos cruzados 2880.125 127.875
Covarianza 411.446 18.268
N 8 8
**. La correlación es significativa al nivel 0,01 (bilateral).
Conclusiones:
La correlación entre galones vendidos y flujo de vehículos de (0.974**). Por lo
tanto, nos está indicando una relación positiva muy fuerte.
El siguiente paso, con el fin de conocer cuánto está influenciado el flujo de
vehículos en los galones vendidos, vamos a realizar el análisis de regresión.
Para este análisis realizaremos los siguientes pasos:
1. Analizar
2. Regresión
3. Lineales
4. Variables
a. Dependiente Y: Galones vendidos
b. Independiente X: Flujo de vehículos
5. Estadísticos
a. Coeficientes de regresión:
i. Estimaciones
ii. Ajuste del modelo
iii. Cambio en R cuadrado
iv. Descriptivas
Dónde:
Como resultado del análisis anterior, obtenemos los datos de la regresión para su
análisis
.974**
7. TALLER DE REGRESIÓN
6
Regresión
Estadísticos descriptivos
Estadísticos descriptivos
Media Desviación típica N
Galones vendidos 278.6250 98.79262 8
Flujo vehículos 9.3750 4.27409 8
Correlaciones
Correlaciones
Galones vendidos Flujo vehículos
Correlación de Pearson
Galones vendidos 1.000 .974
Flujo vehículos .974 1.000
Sig. (unilateral)
Galones vendidos . .000
Flujo vehículos .000 .
N
Galones vendidos 8 8
Flujo vehículos 8 8
Variables introducidas / eliminadas
Variables introducidas/eliminadasa
Modelo Variables introducidas Variables eliminadas Método
1 Flujo vehículos . Introducir
a. Variable dependiente: Galones vendidos
b. Todas las variables solicitadas introducidas.
Resumen del modelo
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
Estadísticos de cambio
Cambio en R
cuadrado
Cambio en F gl1 gl2
Sig. Cambio
en F
1 .974a
.949 .941 23.98229 .949 112.786 1 6 .000
a. Variables predictoras: (Constante), Flujo vehículos
Por lo tanto, en el análisis podemos observar los mismos datos de la correlación de
Pearson.
Dónde:
Correlación de Pearson = 0.974** (Ver tabla).
Sin embargo, lo que interesa es el R2 = 0.949. (Ver gráfica 2). Que al multiplicarlo
por 100, nos indica un porcentaje del 94.9%.
Conclusión:
Se puede afirmar que el flujo de vehículos influenciar en un 94.9% en los
galones vendidos.
8. TALLER DE REGRESIÓN
7
Anova
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1
Regresión 64868.974 1 64868.974 112.786 .000b
Residual 3450.901 6 575.150
Total 68319.875 7
a. Variable dependiente: Galones vendidos
b. Variables predictoras: (Constante), Flujo vehículos
El siguiente paso, es aplicar la fórmula de regresión en el análisis anterior.
Por lo tanto, se substituyen los valores en la fórmula de regresión obtenidos en el
análisis anterior.
Fórmula
Y = a+ bx
Análisis fórmula regresión
Coeficientesa
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados t Sig.
B Error típ. Beta
1
(Constante) 67.472 21.615 3.122 .021
Flujo vehículos 22.523 2.121 .974 10.620 .000
a. Variable dependiente: Galones vendidos
Variables
a b X Y
67.472 22.523 5 180.087 Y = a+ bx
Dónde:
Interpretación:
Al remplazar los valores en la fórmula de regresión tenemos que el valor de a =
67.472 y el valor de b = 22.523 y el valor de X = 5 (cientos).
Por lo tanto, el valor de Y = 180.087.
Conclusión:
El consumo de combustible probable para en flujo diario de 500 vehículos sería
= 180.087 galones diarios.
Y = a + bx
Y = 67.472 + (22.523)(5)
Y = 180.087
9. TALLER DE REGRESIÓN
8
2. PREGUNTA 2:
El gerente de ventas de una compañía de distribución al mayoreo de
repuestos para automóviles quiere desarrollar un modelo para predecir
ventas anuales para un país, basándose en las variables: número de
distribuidores y número de automóviles registrados a partir de los
siguientes datos:
País Ventas (millones) Número distribuidores
Número de automóviles
registrados (millones)
1 52.3 2011 24.6
2 26 2850 22.1
3 20.2 650 7.9
4 16 480 12.5
5 30 1694 9
6 46.2 2302 11.5
7 35 2214 20.5
8 3.5 125 4.1
9 33.1 1840 8.9
10 25.2 1233 6.1
11 38.2 1699 9.5
a. Como observa la correlación entre variables?
b. Existe problema de multicolinealidad?
c. Que recomienda?
d. Escribir la ecuación?
e. Cuál sería el error de la ecuación de acuerdo al coeficiente de determinación1
? (R2)
Análisis Pregunta 2:
Lo primero es saber si las variables tienen correlación, para esto vamos a analizar si
las variables tienen una relación gráfica:
Relación Gráfica:
Para éste análisis realizamos los siguientes pasos:
1. Insertar información en Vista de datos y vista de variables
2. Gráficos
3. Generador de gráficos
4. Diagrama dispersión 3D simple
5. Eje Y: Variable dependiente: Ventas (millones)
6. Eje X: Variable independiente: Numero de distribuidores
1
Coeficiente determinación: El R² es simplemente el cuadrado del coeficiente de correlación de Pearson.
http://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n
10. TALLER DE REGRESIÓN
9
7. Eje Z: Variable independiente: Numero de automóviles registrados (millones)
El siguiente paso es agregar el diagrama de dispersión:
Por lo tanto, el diagrama representa el plano cartesiano 3D y la nube de puntos
representa las ventas en millones, el número de automóviles y el número de
distribuidores.
Gráfico G
Relación numérica
Correlaciones
Correlaciones
Ventas millones
Número de
distribuidores
Número de
automóviles
registrados
Ventas millones
Correlación de Pearson 1 .739**
.548
Sig. (bilateral) .009 .081
N 11 11 11
Número de distribuidores
Correlación de Pearson .739**
1 .670*
Sig. (bilateral) .009 .024
N 11 11 11
Número de automóviles registrados
Correlación de Pearson .548 .670*
1
Sig. (bilateral) .081 .024
N 11 11 11
**. La correlación es significativa al nivel 0,01 (bilateral).
*. La correlación es significante al nivel 0,05 (bilateral).
Interpretación:
Podemos observar una correlación positiva entre la variable dependiente Y
(Ventas millones) y las variable independiente X (Numero de distribuidores) de
0.739**.
11. TALLER DE REGRESIÓN
10
Además existe una relación alta o colinealidad (0.670*) entre las variables
independientes, (por lo tanto se debe de eliminar del análisis la variable
independiente (Número de automóviles registrados) , ya que este valor nos está
diciendo que una está explicando a la otra, por lo tanto somos redundantes al
incluirlas la dos en el modelo.
El valor de significancia siempre que sea menor a 0.05 es admisible, en este caso
es ventas en millones (0.009) y número de distribuidores (.024) respectivamente,
lo que es viable.
Regresión:
Estadísticos descriptivos
Estadísticos descriptivos
Media Desviación típica N
Ventas millones 29.6091 13.75947 11
Número de distribuidores 1554.3636 843.90536 11
Correlaciones
Correlaciones
Ventas millones Número de
distribuidores
Correlación de Pearson
Ventas millones 1.000 .739
Número de distribuidores .739 1.000
Sig. (unilateral)
Ventas millones . .005
Número de distribuidores .005 .
N
Ventas millones 11 11
Número de distribuidores 11 11
Interpretación:
La correlación entre Ventas millones y numero de distribuidores es alta y
positiva con 0.739.
El valor de significancia es 0.05 (Admisible)
La variable independiente eliminada debido a su colinealidad con número de
distribuidores fue número de automóviles registrados. Por lo tanto, se introdujo
la variable número de distribuidores. (Ver tabla)
Variables introducidas / eliminadas
Variables introducidas/eliminadas
a
Modelo Variables introducidas Variables eliminadas Método
1 Número de distribuidoresb
.Número de automóviles reg. Introducir
a. Variable dependiente: Ventas millones
b. Todas las variables solicitadas introducidas.
12. TALLER DE REGRESIÓN
11
Resumen del Modelo
Resumen del modelo
Modelo
R
R
cuadrado
R cuadrado
corregida
Error típ.
de la
estimación
Estadísticos de cambio
Cambio en
R cuadrado
Cambio en
F
gl1 gl2 Sig. Cambio
en F
1 .739a
.546 .496 9.77180 .546 10.827 1 9 .009
a. Variables predictores: (Constante), Número de distribuidores
Interpretación:
Lo que nos dice la R2 es la cantidad en la cual estas variables independientes
afectan al modelo total, es decir que el total de influencia es explicado en un
54.6%.
La R2 ajustada, es cuando la muestra es muy pequeña, se debe de reporta la R2
ajustada, ya que la R2 normal tiende a ser muy optimista.
ANOVA
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1
Regresión 1033.836 1 1033.836 10.827 .009b
Residual 859.393 9 95.488
Total 1893.229 10
a. Variable dependiente: Ventas millones
b. Variables predictoras: (Constante), Número de distribuidores
El siguiente paso, es aplicar la fórmula de regresión en el análisis anterior.
Por lo tanto, se substituyen los valores en la fórmula de regresión obtenidos en el
análisis anterior.
Fórmula
Y = a+ bx
Coeficientes
Coeficientes
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados t Sig.
B Error típ. Beta
1
(Constante) 10.881 6.409 1.698 .124
Número de distribuidores .012 .004 .739 3.290 .009
a. Variable dependiente: Ventas millones
13. TALLER DE REGRESIÓN
12
Aplicación de la Fórmula de Regresión
a b X Y
10.881 .012 ventas Y=a+bx
Y= 10.881+0.012(X)
10.881 + (0.012)(1700) =31.28 millones en ventas
Interpretación:
Al remplazar los valores en la fórmula de regresión tenemos que el valor de a =
10.881 y el valor de b = 0.012 y el valor de X = 1700 distribuidores
Por lo tanto, el valor de Y = 31.28 ventas (millones)
Conclusión:
Las probables ventas en millones para un número de distribuidores de 1700 sería
de 31.28 millones
En el siguiente análisis, se introduce al modelo la variable ingreso personal. Por lo
tanto, para este análisis se repetirá los pasos realizados nuevamente y se procede a
analizar gráficamente y numéricamente el modelo, para así ver en primer lugar si existe
una correlación significativa entre las variables y además revisar la existencia o no de
una multicolinealidad entre las variables independientes.
f. Si se introduce la variable ingreso personal, cuál sería el mejor modelo múltiple
a utilizar?
Y = a + bx
Y = 10.881 + (0.012) (1700)
Y = 31.28 millones en ventas
Ingreso Personal (miles de millones)
98.5
31.1
34.8
32.7
68.8
94.7
67.6
19.7
67.9
61.4
85.6
14. TALLER DE REGRESIÓN
13
Correlaciones
Correlaciones
Ventas millones
Número de
distribuidores
Ingreso personal
Ventas millones
Correlación de Pearson 1 .739**
.936**
Sig. (bilateral) .009 .000
N 11 11 11
Número de distribuidores
Correlación de Pearson .739**
1 .556
Sig. (bilateral) .009 .075
N 11 11 11
Ingreso personal
Correlación de Pearson .936**
.556 1
Sig. (bilateral) .000 .075
N 11 11 11
**. La correlación es significativa al nivel 0,01 (bilateral).
Interpretación:
Podemos observar una correlación positiva entre la variable dependiente Y
(Ventas millones) y las variable independiente X (Numero de distribuidores) de
0.739**.
Además, se puede observar que no existe una relación alta o colinealidad (0.556)
entre las variables independientes.
El valor de significancia siempre que sea menor a 0.05 es admisible, en este caso
es ventas en millones (0.009) y número de distribuidores (.00) respectivamente,
lo que es viable.
Gráfico de dispersión 3D simple
Interpretación:
El diagrama representa el plano cartesiano 3D y la nube de puntos representa
las ventas en millones, el número de distribuidores y los ingresos personales
R2
Lineal = 0.546
15. TALLER DE REGRESIÓN
14
Regresión:
Estadísticos descriptivos
Estadísticos descriptivos
Media Desviación típica N
Ventas (millones) 29.6091 13.75947 11
m de distribuidores 1554.3636 843.90536 11
Ingreso personal 60.2545 27.16650 11
Variables introducidas o eliminadas
Variables introducidas/eliminadas
a
Modelo Variables introducidas Variables eliminadas Método
1
Ingreso personal,
m de distribuidoresb Numero de automóviles registrados Introducir
a. Variable dependiente: Ventas (millones)
b. Todas las variables solicitadas introducidas.
Resumen del modelos
Resumen del modelo
Modelo R R cuadrado R cuadrado
corregida
Error típ. de la
estimación
Estadísticos de cambio
Cambio en R
cuadrado
Cambio en F gl1 gl2 Sig. Cambio
en F
1 .972a
.946 .932 3.58666 .946 69.586 2 8 .000
a. Variables predictoras: (Constante), Ingreso personal, m de distribuidores
b. Variable dependiente: Ventas (millones)
Interpretación:
Lo que nos dice la R2 es la cantidad en la cual estas variables independientes
afectan al modelo total, es decir que el total de influencia es explicado en un
94.6%.
La R2 ajustada, es cuando la muestra es muy pequeña, se debe de reporta la R2
ajustada, ya que la R2 normal tiende a ser muy optimista.
Anova
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1
Regresión 1790.316 2 895.158 69.586 .000b
Residual 102.913 8 12.864
Total 1893.229 10
a. Variable dependiente: Ventas (millones)
b. Variables predictoras: (Constante), Ingreso personal, m de distribuidores
16. TALLER DE REGRESIÓN
Coeficientes
Interpretación:
Al analizar la estadística de colinealidad, la Tolerancia debe ser un valor mayor 0.10 para aceptarse, en este caso la tolerancia es 0.690 y
en el caso del FIV tiene que ser un valor menor a 10 para aceptarse, en este caso el FIV es menor a 10 con 1.448. En consecuencia,
ambas variables independientes cumplen con esos requisitos lo que nos indica que no hay una colinealidad relevante.
El siguiente paso, es aplicar la fórmula de regresión en el análisis anterior.
Por lo tanto, se substituyen los valores en la fórmula de regresión obtenidos en el análisis anterior.
Fórmula
Y = a + b1X1 + b2X2 + b3X3 +…bkXk
Y = (-1.608+1.25+38.115) = 37.757 millones
Coeficientes
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados
t Sig.
Intervalo de confianza de 95.0%
para B
Correlaciones Estadísticos de colinealidad
B Error típ. Beta Límite inferior Límite superior Orden cero Parcial Semiparcial Tolerancia FIV
1
(Constante) -1.608 2.861 -.562 .589 -8.206 4.990
m de
distribuidores
.005 .002 .316 3.182 .013 .001 .009 .739 .747 .262 .690 1.448
Ingreso personal .385 .050 .761 7.668 .000 .269 .501 .936 .938 .632 .690 1.448
a. Variable dependiente: Ventas (millones)
Y = a + b1X1 + b2X2 + b3X3 +…bkXk
Y = (-1.608) + (0.005 X1) + (.385 X2)
-1.608 + (0.005 x 250) + (.385 x 99)
17. TALLER DE REGRESIÓN
Diagnósticos de colinealidad
Diagnósticos de colinealidada
Modelo Dimensión Autovalores Índice de condición
Proporciones de la varianza
(Constante) m de distribuidores Ingreso personal
1
1 2.816 1.000 .02 .02 .01
2 .112 5.015 .62 .67 .00
3 .072 6.245 .37 .31 .99
a. Variable dependiente: Ventas (millones)
Interpretación:
Estadístico sobre los residuos
Estadísticos sobre los residuos
a
Mínimo Máximo Media Desviación típica N
Valor pronosticado 6.6257 46.7294 29.6091 13.38027 11
Residual -3.62045 5.60434 .00000 3.20801 11
Valor pronosticado tip. -1.718 1.280 .000 1.000 11
Residuo típ. -1.009 1.563 .000 .894 11
a. Variable dependiente: Ventas (millones)
Interpretación:
Gráfica Ventas / distribuidores / Ingreso personal
20. TALLER DE REGRESIÓN
19
Gráfico regresión parcial: Ventas / ingreso personal
3. PREGUNTA 3:
Las tasas de interés aplicados a los créditos hipotecarios en años recientes
han tenido un impacto en el número de construcciones iniciadas. Los datos
a continuación presentan tasas de interés por trimestre y el número
correspondientes de construcciones iniciadas.
Trimestre Tasa % Número construcciones iniciadas
1 11.5 260
2 11.4 250
3 11.6 241
4 12.4 256
5 12.8 270
6 13.2 220
7 13.5 190
8 13.0 195
9 12.7 200
10 12.9 210
11 12.5 230
12 12 245
a. Cuál sería el número de construcciones pronosticadas correspondiente a un
11% de interés.
b. El modelo de regresión lineal será adecuado si se quiere un 99% de
confiabilidad.
21. TALLER DE REGRESIÓN
20
Análisis Pregunta 3a: ¿Cuál sería el número de construcciones pronosticadas
correspondiente a un 11% de interés?
Relación Gráfica:
Para éste análisis realizamos los siguientes pasos:
1. Insertar información en Vista de datos y vista de variables
2. Gráficos
3. Cuadro de diálogos antiguos
4. Diagrama dispersión simple
5. Eje Y: Variable dependiente: Número de construcciones iniciadas
6. Eje X: Variable independiente: Tasa (%)
El siguiente paso es agregar el diagrama de dispersión:
Por lo tanto, el diagrama representa el plano cartesiano y la nube de puntos
representa el número de construcciones iniciadas y las tasas de interés
Diagrama Número de construcciones iniciadas y Tasas de interés bancarias
22. TALLER DE REGRESIÓN
21
El siguiente paso es agregar la recta:
Gráfico: Línea de ajuste
Interpretaciones
El diagrama representa el plano cartesiano y la nube de puntos representa el
número de construcciones iniciadas y las tasas de interés bancarias.
Por lo tanto, representa la relación gráfica entre Número de construcciones
iniciadas y las tasas de interés bancarias.
En consecuencia, la recta es descendente, lo que nos indica una correlación
negativa.
R2
= Lineal = 0.444
El siguiente paso, es la relación numérica.
Relación numérica:
Para este análisis realizaremos los siguientes pasos:
1. Analizar
2. Correlación
3. Bivariadas
4. Variables
4.1. Dependiente Y: Galones vendidos
4.2. Independiente X: Flujo de vehículos
5. Opciones:
5.1. Estadísticos:
5.1.1. Medias y desviaciones típicas
R2
Lineal = 0.444
23. TALLER DE REGRESIÓN
22
5.1.2. Productos cruzados diferenciales y covarianzas
5.2. Valores perdidos
5.2.1. Excluir casos según pareja
6. Coeficiente:
6.1. Pearson
7. Prueba de significación:
7.1. Bilateral
8. Marcar las correlaciones significativas
Correlaciones
Estadísticos descriptivos
Estadísticos descriptivos
Media Desviación típica N
Número construcciones iniciadas 230.5833 27.20781 12
Tasas interés bancarias para construcción 12.4583 .69342 12
Correlaciones
Correlaciones
Tasas interés
bancarias para
construcción
Número
construcciones
iniciadas
Tasas interés bancarias para
construcción
Correlación de Pearson 1 -.666*
Sig. (bilateral) .018
N 12 12
Número construcciones iniciadas
Correlación de Pearson -.666*
1
Sig. (bilateral) .018
N 12 12
*. La correlación es significante al nivel 0,05 (bilateral).
Conclusiones:
La correlación entre número de construcciones iniciadas y tasas de interés
bancarias es de (-0.666*). Por lo tanto, nos está indicando una relación negativa
no muy fuerte, que no llega a 0.70.
El siguiente paso, con el fin de conocer cuánto está influenciado las tasas de interés
bancarias en los números de construcciones iniciadas, vamos a realizar el análisis
de regresión.
24. TALLER DE REGRESIÓN
23
Para este análisis realizaremos los siguientes pasos:
1. Analizar
2. Regresión
3. Lineales
4. Variables
4.1. Dependiente Y: Galones vendidos
4.2. Independiente X: Flujo de vehículos
5. Estadísticos
5.1. Coeficientes de regresión:
5.1.1. Estimaciones
5.1.2. Ajuste del modelo
5.1.3. Cambio en R cuadrado
5.1.4. Descriptivas
Dónde:
Como resultado del análisis anterior, obtenemos los datos de la regresión para su
análisis.
Regresión
Variables introducidas/eliminadas}
Variables introducidas/eliminadas
Modelo Variables introducidas Variables eliminadas Método
1 Tasas interés bancarias para construcción . Introducir
a. Variable dependiente: Número construcciones iniciadas
b. Todas las variables solicitadas introducidas.
Resumen del Modelo
Resumen del modelo
Modelo R R cuadrado
R cuadrado
corregida
Error típ. de la
estimación
Estadísticos de cambio
Cambio en R
cuadrado
Cambio en F gl1 gl2
Sig. Cambio
en F
1 .666a
.444 .388 21.28725 .444 7.970 1 10 .018
a. Variables predictoras: (Constante), Tasas interés bancarias para construcción
b. Variable dependiente: Número construcciones iniciadas
Por lo tanto, en el análisis podemos observar los mismos datos de la correlación de
Pearson.
Dónde:
Correlación de Pearson = 0.666* (Ver tabla).
Sin embargo, lo que interesa es el R2 = 0.444. (Ver gráfica 2). Que al
multiplicarlo por 100, nos indica un porcentaje del 44.4%.
25. TALLER DE REGRESIÓN
24
En consecuencia, lo que nos dice la R2 es la cantidad en la cual variable
independiente X (Tasa de interés) afecta al modelo total, es decir que el total de
influencia es explicado en un 44.4%.
Conclusión:
Se puede afirmar que las tasas de interés puede influenciar en un 44.4% en las
construcciones iniciadas.
Por lo tanto, no cumple con el modelo de regresión adecuado, en el cual se
solicita un 99% de confiabilidad.
ANOVA
ANOVAa
Modelo Suma de cuadrados gl Media cuadrática F Sig.
1
Regresión 3611.447 1 3611.447 7.970 .018b
Residual 4531.470 10 453.147
Total 8142.917 11
a. Variable dependiente: Número construcciones iniciadas
b. Variables predictoras: (Constante), Tasas interés bancarias para construcción
El siguiente paso, es aplicar la fórmula de regresión en el análisis anterior.
Por lo tanto, se substituyen los valores en la fórmula de regresión obtenidos en el
análisis anterior.
Fórmula
Y = a+ bx
26. TALLER DE REGRESIÓN
Coeficientes
Coeficientes
Modelo
Coeficientes no estandarizados
Coeficientes
tipificados t Sig.
Correlaciones
Estadísticos de
colinealidad
B Error típ. Beta Orden cero Parcial Semiparcial Tolerancia FIV
1
(Constante) 556.125 115.479 4.816 .001
Tasas interés
bancarias para
construcción
-26.130 9.256 -.666 -2.823 .018 -.666 -.666 -.666 1.000 1.000
a. Variable dependiente: Número construcciones iniciadas
Aplicación de la Fórmula de Regresión
a b X Y
556.125 -26.130 # construcciones Y=a+bx
Y= 556.125+(-26.130) (11)
Interpretación:
Al remplazar los valores en la fórmula de regresión tenemos que el valor de a = 556.125 y el valor de b = -26.130 y el valor de X = 11 %
Por lo tanto, el valor de Y = 31.28 ventas (millones)
Conclusión: En respuesta a la Pregunta 3ª:
Las probables construcciones iniciadas para una tasa de interés del 11% serían de 268.695 construcciones.
Y = a + bx
Y = 556.125 + (-26.130) (11)
Y = 268.695 construcciones iniciadas
27. TALLER DE REGRESIÓN
Diagnóstico de colinealidad
Diagnósticos de colinealidada
Modelo Dimensión Autovalores Índice de condición
Proporciones de la varianza
(Constante)
Tasas interés bancarias
para construcción
1
1 1.999 1.000 .00 .00
2 .001 37.557 1.00 1.00
a. Variable dependiente: Número construcciones iniciadas
Estadísticos sobre los residuos
Estadísticos sobre los residuos
Mínimo Máximo Media Desviación típica N
Valor pronosticado 203.3641 258.2381 230.5833 18.11942 12
Residual -24.26847 48.34457 .00000 20.29660 12
Valor pronosticado tip. -1.502 1.526 .000 1.000 12
Residuo típ. -1.140 2.271 .000 .953 12
a. Variable dependiente: Número construcciones iniciadas
Gráficos
Histograma: Variable dependendiente número de construcciones iniciadas
Gráfico de dispersión
28. TALLER DE REGRESIÓN
27
BIBLIOGRAFÍA
Mollinedo, K. (6 de Enero de 2007). Google. Recuperado el 3 de Mayo de 2014, de
http://es.scribd.com/doc/51801258/Tesis-K-Mollinedo-Diagrama-de-la-persona