Este documento presenta un modelo econométrico para explicar el número de empresas del sector industrial en España. Se propone un modelo teórico inicial que relaciona la variable dependiente (número de empresas industriales) con 10 variables explicativas como población, número de empresas en otros sectores, etc. Luego, se realizan análisis estadísticos como detección de multicolinealidad, normalidad de residuos y otros para validar el modelo y obtener un modelo final. El objetivo es predecir el número de empresas industriales en función de las variables explicativas sele
Trabajo econometria. Modelo econométrico para explicar el número de empresas del sector Industria en España
1. Modelo econométrico para explicar el número de empresas del sector industria
en España
ALEJANDRO PEREZ- ALEX BOHORQUEZ- NICOLE LA FAYE
2. INTRODUCCION
1.- MODELO TEORICO PROPUESTO
2. ESTUDIO DE MULTICOLINEALIDAD
3. PRIMERAESTIMACION DELMODELOAJUSTADO
4.ANALISIS DE LASIGNIFICATIVIDAD
5.DETECCION GRAFICADE POSIBLES PROBLEMAS
6.ESTUDIO DE LANORMALIDAD DE LOS RESIDUOS
7. ESTUDIO DE LAHETEROCEDASTICIDAD
8. ESTUDIO DE LAAUTOCORRELACION
9.PUNTOSANOMALOS / INFLUYENTES
MODELO FINAL
PREDICCIONES
CONCLUSION
3. INTRODUCCIÓN
3
PORQUE NOS INTERESA ESTA VARIABLE ? (Y)
VARIBALES EXPLICATIVAS
Y Numero de empesas en el Sector industria
X1 Padrón: Población Total (nº varones)
X2 Padrón: Población Total ( nº mujeres)
X3 Construcción (nº empresas)
X4 Comercio, transporte y hostelería (nº empresas)
X5 Total servicios (nº empresas)
X6 Información y comunicaciones (nº empresas)
X7 Actividades financieras y de seguros (nº
mpresas)
X8 Actividades inmobiliarias (nº empresas)
X9 Actividades profesionales y técnicas (nº
empresas)
X10 Educación, sanidad y servicios sociales (nº
empresas)
4. 1.- MODELO TEORICO
PROPUESTO
DEFINICION DE PARAMETROS (EJ)
B0
B1
X1
Modelo Inicial Téorico (Antes de Correlación
número 1)
Y=Bo+B1*X1+B2*X2+B3*X3+B4*X4+B5*X5+
+B6*X6+B7*X7+B8*X8+B9*X9+B10*X10+U
4
5. Y INDUSTRIA (Número de empresas) nº emp
Industria Variable en Statgraphics (programa paraanálisis estadistico)
Número de empresas del sector industrial cuya
casa matriz esta dentro del territorio español y
ejercen corrientemente su actividad en elpaís.
B0
Valor medio del número de empresas del sector
industrial cuando las variables explicativas valen
cero“0”
X1 PADRÓN: POBLACIÓN TOTAL(Nº
VARONES) Nº VARONES VARIABLE EN STATGRAPHICS (PROGRAMA PARA
ANÁLISIS ESTADISTICO)
Totalde personas residenciadasen España de
sexo masculino.
B1
Incremento medio del número de empresas del
sector industrial cuando aumenta en unaperso-
na lapoblación residenciadaen España de sexo
masculino, y elresto de las variablesexplicativas
permanecenconstantes.
X2 PADRÓN: POBLACIÓN TOTAL(Nº
MUJERES)Nº MUJERES VARIABLE EN STATGRAPHICS (PROGRAMA PARA
ANÁLISIS ESTADISTICO)
Totalde personas residenciadasen España de
sexo femenino.
B2
Incremento medio del número de empresas
del sector industrial cuando aumenta en una
persona la población residenciada en España
de sexo femenino y elresto de las variables
explicativas permanecenconstantes.
X3 CONSTRUCCIÓN (Nº EMPRESAS) Nº EMP
CONSTRUCCIÓN VARIABLE EN STATGRAPHICS (PROGRAMA PARA ANÁLISIS
ESTADISTICO)
Número de empresas del sector de la
construcción cuya casa matriz estadentro del
territorio español y ejercencorrientementesu
actividad en elpaís.
B3
Incremento medio delnúmero de
empresas del sector industrial cuando aumenta
en una sociedad (forma legal de empresa en
España)elnúmero de empresas delsector de la
constrcución cuya casa matriz esta dentro del
territorio español y ejercen corrientemente su
actividaden elpaís y elresto de las variables
explicativas permanecenconstantes.
B5
Incremento medio del número de empresas
del sector servicios cuya casa matriz esta dentro
del territorio español y ejercencorrientementesu
actividad en el país y el resto de las variables
explicativas permanecen constantes.
X6 INFORMACIÓN Y COMUNICACIONES
(Nº EMPRESAS) Nº EMP INFO COM VARIABLE EN STATGRAPHICS
(PROGRAMA PARA ANÁLISIS ESTADISTICO)
Número de empresas del sector de Información
y comunicaciones cuya casa matriz esta dentro
del territorio español y ejercencorrientementesu
actividad en elpaís.
B6
Incremento medio del número de empresas
del sector industrial cuando aumenta en una
sociedad (forma legal de empresa en España)
el número de empresas delsector de Información
y comunicaciones cuya casa matriz esta dentro
del territorio español y ejercencorrientementesu
actividad en el país y el resto de las variables
explicativas permanecen constantes.
X7 ACTIVIDADES FINANCIERAS Y DESEG-
UROS (Nº EMPRESAS) Nº EMP _ACT_FINANCIERAS
VARIABLE EN STATGRAPHICS (PROGRAMA PARA ANÁLISIS ESTADISTICO)
Número de empresas del sector financieroy de segu-
ros cuya casa matriz esta dentro del territorio espa-
ñol y ejercencorrientementesu actividaden elpaís.
X4 COMERCIO,TRANSPORTEY
HOSTELERÍA (Nº EMPRESAS) Nº EMP COM-
ERCIO, TRANSPORTEY HO VARIABLE EN STATGRAPHICS (PROGRAMA
PARA ANÁLISIS ESTADISTICO)
Número de empresas de comercio
transporte y hostelería cuya casa matriz
estadentro delterritorio españoly ejercen
corrientementesu actividaden elpaís.
B4
Incremento medio del número
de empresas del sector industrial
cuando aumenta en una sociedad
( forma legal de empresa en España)
el número de empresas de comercio
transporte y hostelería cuya casa
matriz esta dentro del territorio
español y ejercen corrientemente su
actividad en el país y el resto de las
variables explicativas permanecen
constantes.
X5 TOTALSERVICIOS (Nº EMPRE-
SAS)Nº EMP SERVICIOS VARIABLE EN STATGRAPHICS (PROGRAMA
PARA ANÁLISIS ESTADISTICO)
Número de empresas del sector servicios
cuya casa matriz esta dentro del territorio
español y ejercen corrientemente su acti-
vidad en elpaís.
FULLSCREEN HOME
DEFINCION DE PARAMETROS
(COMPLETO)
5
6. B7
Incremento medio del número de empresas
del sector industrial cuando aumenta en una
sociedad (forma legal de empresa enEspaña)
el número de empresas del sector financiero
y de seguroscuya casa matriz estadentro del
territorio y ejercen corrientemente su actividad
en el país y el resto de las variables explicativas
permanecen constantes.
X8 ACTIVIDADES INMOBILIARIAS (Nº
EMPRESAS) Nº EMP _ACT_INMOBILIARI VARIABLE EN STATGRAPHICS
Número de empresas del sector inmobiliario cuya
casa matriz esta dentro del territorio español y
ejercencorrientementesu actividaden elpaís.
B8
Incremento medio del número de empresas
del sector industrial cuando aumenta en una
sociedad ( forma legal de empresa en España)
el número de empresas del sector inmobiliario
cuya casa matriz estadentro del territorioy
ejercen corrientemente su actividad en el país
y el resto de las variablesexplicativas
permanecen constantes.
X9 ACTIVIDADES PROFESIONALESYTÉC-
NICAS (NºEMPRESAS)
Nº EMP _ACT_PROFESIONAL VARIABLE EN STATGRAPHICS (PROGRAMA PARA
ANÁLISIS ESTADISTICO)
Número de empresas dedicadas a actividades
profesionalesy técnicascuya casa matriz esta
dentro del territorio español y ejercen
corrientementesu actividaden elpaís.
B9
Incremento medio del número de empresas
del sector industrial cuando aumenta en
una sociedad (forma legal de empresa en
España) el úmero de empresas dedicadas
a actividades profesionales y técnicas cuya
casa matriz esta dentro del territorio español
y ejercen corrientemente su actividad en el
país y el resto de las variables explicativas
permanecen constantes.
X10 EDUCACIÓN, SANIDAD Y SERVICIOS
SOCIALES (Nº EMPRESAS) Nº EMP _ACT_EDU_SAN_SE
VARIABLE EN STATGRAPHICS (PROGRAMA PARA ANÁLISIS ESTADISTICO)
Número de empresas dedicadas a actividades
Educación,sanidad y servicios sociales cuya casa
matriz estadentro del territorio español y ejercen
corrientementesu actividaden elpaís.
B10
Incremento medio del número de empresas
del sector industrial cuando aumenta en
una sociedad (forma legal de empresa en
España) el número de empresas dedicadas a ac-
tividades educación,sanidad y servicios sociales
cuya casa matriz esta dentro del territorio espa-
ñol y ejercen corrientemente su actividad en el
país. y el resto de las variables explicativas
permanecen constantes.
U
Perturbación del modelo econométrico. Rep-
resentalas variables explicativasque afectanal
número de empresas del sector industrial en
España,y que no se han tenido en cuentaen el
modelo.
DEFINCION DE PARAMETROS
(COMPLETO)
6
7. cualeselmodelodebeseguirrespectoalos
residuos o lo que llamamos en el modelo,
la variable U, que serán verificadas en los
siguientesanánalisis.
FULLSCREEN HOME
7
HIPÓTESIS(sobre residuos/U)
Las perturbaciones U son variables
aleatorias
Todas las perturbaciones tienen la
misma varianza
Todas las perturbaciones estan
incorrelacionadas entre si
Las perturbaciones tienen una
distribucion normal
21. Nueva matriz ( preparado para matriz de correlaciones 5)
Eliminado variable nº emp _Act_profesional
Nº varones nº emp
Construcción
nº empInfo
com
nº emp_Act_
financieras
nº emp_Act_
inmobiliari
nº emp_Act_
Edu_san_se
Nº varones 1 0,966554 0,81794 0,977025 0,918709 0,962153
nº emp
Construcción
0,966554 1 0,879365 0,976959 0,962055 0,980572
nº empInfo
com
0,81794 0,879365 1 0,90894 0,913537 0,93895
nº emp_Act_
financieras
0,977025 0,976959 0,90894 1 0,9461 0,989212
nº emp_Act_
inmobiliari
0,918709 0,962055 0,913537 0,9461 1 0,972773
nº emp_Act_
Edu_san_se
0,962153 0,980572 0,93895 0,989212 0,972773 1
DEBAJO DE LA DIAGONAL PRINCIPAL:
VALORES SUPERIORES
A 0,7
MULTICOLINEALIDAD
REALIZAMOS MATRIZ INVERSA DE
CORRELACION
21
22. 22
En DP valores > 10
Multicolinealidad
Identificamos valor
mas grande : “ Nº emp
_Act_ Edu_san_se”
23. Análisis deComponentes
Principales
Componente Porcentajede Porcentaje
Número Eigenvalor Varianza Acumulado
1 5,70646 95,108 95,108
2 0,202805 3,38 98,488
3 0,063737 1,062 99,55
4 0,0204801 0,341 99,891
5 0,00579101 0,097 99,988
6 0,000724747 0,012 100
23
I.C> 10
Multicolinealidad
ELIMINAMOS DE NUESTRO
MODELO “Nº emp _Act_
Edu_san_se” (Valor + grande en matriz
inversa)
IC 88,734
24. Nueva matriz ( preparado para matriz de correlaciones 6) Eliminado
variable nº emp_Act_Edu_san_se
Nº varones nº emp
Construcción
nº empInfo
com
nº emp_Act_
financieras
nº emp_Act_
inmobiliari
Nº varones 1 0,966554 0,81794 0,977025 0,918709
nº emp
Construcción
0,966554 1 0,879365 0,976959 0,962055
nº empInfo
com
0,81794 0,879365 1 0,90894 0,913537
nº emp_Act_
financieras
0,977025 0,976959 0,90894 1 0,9461
nº emp_Act_
inmobiliari
0,918709 0,962055 0,913537 0,9461 1
24
DEBAJO DE LA DIAGONAL PRINCIPAL:
VALORES SUPERIORES
A 0,7
MULTICOLINEALIDAD
REALIZAMOS MATRIZ INVERSA DE
CORRELACION
25. ESTUDIO DE
MULTICOLINEALIDAD
Problema 6 de multicolinealidad (algún valor de la DP de la matriz
inversa>10)
Nº varones 70,43982505 -3,329090488 31,70087296 -83,78683214 -11,20013158
nº emp -3,329090488 37,69525141 5,658171916 -22,97629503 -16,63751637
nº empInfo
com
31,70087296 5,658171916 22,4592973 -45,74888878 -11,80172529
nº emp
_Act_ financieras
-83,78683214 -22,97629503 -45,74888878 129,7616829 18,10595073
nº emp
_Act_ inmobiliari
-11,20013158 -16,63751637 -11,80172529 18,10595073 20,94714023
25
En DP valores > 10
Multicolinealidad
Identificamos valor mas
grande :Nº emp
_Act_ financieras
26. Análisis deComponentes
Principales
Componente Porcentaje de Porcentaje
Número Eigenvalor Varianza Acumulado
1 4,70919 94,184 94,184
2 0,202427 4,049 98,232
3 0,0633198 1,266 99,499
4 0,0203242 0,406 99,905
5 0,00473556 0,095 100
FULLSCREEN HOME
26
I.C 31,53
I.C> 10
Multicolinealidad
ELIMINAMOS DE NUESTRO MODELO “Nº
emp _Act_ financieras ” (Valor + grande en
matriz inversa)
27. Nueva matriz (preparado para matriz de correlaciones 7) Eliminado variable nº emp
_Act_financieras
Nº varones nº emp
Construcción
nº empInfo
com
nº emp_Act_
inmobiliari
Nº varones 1 0,966554 0,81794 0,918709
nº emp
Construcción
0,966554 1 0,879365 0,962055
nº empInfo
com
0,81794 0,879365 1 0,913537
nº emp_Act_
inmobiliari
0,918709 0,962055 0,913537 1
27
DEBAJO DE LA DIAGONAL PRINCIPAL:
VALORES SUPERIORES
A 0,7
MULTICOLINEALIDAD
REALIZAMOS MATRIZ INVERSA DE
CORRELACION
28. En DP valores > 10 y 1 valor < 10 (nº
emp Info com)
Multicolinealidad
Identificamos valor mas grande :Nº emp
Construccion
Problema 7 de multicolinealidad (algún valor de la
DP de la matriz inversa>10)
Nº varones 16,33885253 -18,16483346 2,160916483 0,49084083
nº empConstrucción -18,16483346 33,62694618 -2,442370114 -13,43158025
nº emp Info com 2,160916483 -2,442370114 6,33003034 -5,418275968
nº emp_Act_
inmobiliari
0,49084083 -13,43158025 -5,418275968 18,42077463
FULLSCREEN HOME
28
29. Análisis deComponentes
Principales
Componente Porcentaje de Porcentaje
Número Eigenvalor Varianza Acumulado
1 3,73081 93,27 93,27
2 0,198546 4,964 98,234
3 0,0504839 1,262 99,496
4 0,0201602 0,504 100
IA
29
I.C> 10
Multicolinealidad moderada
ELIMINAMOS DE NUESTRO MODELO “Nº
emp _construccion” (Valor + grande en matriz
inversa)
I.C 13,604
30. Problema 8 de multicolinealidad (algún valor de la DP
de la matrizinversa>10)
Nº varones 6,526448718 0,841580313 -6,76472193
nº emp Info com 0,841580313 6,15263773 -6,393829622
nº emp_Act_inmobiliari -6,76472193 -6,393829622 13,05581085
Nueva matriz ( preparado para matriz de correlaciones)
Eliminado variable nº emp Construcción
Nº varones nº emp Info com nº emp
_Act_inmobiliari
Nº varones 1 0,81794 0,918709
nº emp Info com 0,81794 1 0,913537
nº emp_Act_inmobiliari 0,918709 0,913537 1
30
DEBAJO DE LA DIAGONAL PRINCIPAL:
VALORES SUPERIORES A 0,7
MULTICOLINEALIDAD
REALIZAMOS MATRIZ INVERSA DE CORRELACION
En DP 1 valor > 10 (nº emp _Act_inmobiliari)
Multicolinealidad
Identificamos valor mas grande :Nº nº emp
_Act_inmobiliari
31. I.C < 10
No existe Multicolinealidad
(en otras pruebas si)
ELIMINAMOS DE NUESTRO
MODELO “Nº emp
_Act_inmobiliari ” (Valor +
grande en matriz inversa)
31
Componente PorcentajedePorcentaje 7,418
Número Eigenvalor Varianza Acumulado
1 2,76758 92,253 92,253
2 0,182125 6,071 98,324
3 0,0502949 1,676 100
I.C 7.418
32. Nueva matriz ( preparado para matriz de
correlaciones)
Eliminado variable nº emp _Act_inmobiliari
Nº varones nº emp Info com
Nº varones 1 0,81794
nº empInfo
com
0,81794 1
Problema 9 de multicolinealidad(algún valor de la DP de la matriz
inversa>10)
Nº varones 3,021383938 -2,471310778
nº emp Info com -2,471310778 3,021383938
32
Estudio de multicolinealidad
No logramos concluir con la matriz inversa
Valores < 10
No existe multicolinearidad
ESTUDIO DE
DEBAJO DE LA DIAGONAL
PRINCIPAL:
VALORES SUPERIORES
A 0,7
MULTICOLINEALIDAD
REALIZAMOS MATRIZ INVERSA
DE CORRELACION
IC < 10
No existe
multicolinealidad en
esta prueba
Comparar regresiones
: multicolinealidad en
el modelo
1
2
3
33. 33
DOS MODELOS(ELIMINAR
MULTICOLINEALIDAD)
R^2
63,42 "Regresión Multiple sobre la variable nº
emp Infocom "
92,77 "Regresión Multiple sobre la variable Nº
varones "
Comparamos 2
regresiones
R^2 mas alto : N
varones
Estudio de multicolinealidad
IC < 10
No existe
multicolinealidad
38. 6.ESTUDIO DE LA NORMALIDAD DE LOS RESIDUOS
Contraste de hipótesis para la normalidad de residuos
Ho: Los residuos se distribuyen normalmente
H1: Los residuos NO se distribuyen normalmente
P-Valor ≥ α aceptamos H0
Análisis deVarianza
Prueba Estadístico
FULLS
Valor-P
CREEN HOME
Chi-Cuadrado 10,6842 0,297977
EstadísticoW
de Shapiro- Wilk 0,973675 0,830776
Valor-Z para
asimetría
0,105986 0,915588
Valor-Z para
curtosis
Datos Insuficientes
38
39. Valor-P de N varones respectos a los
residuos^2 < 0.05 , existe
heterocedasticidad
Solucionar el problema
7. ESTUDIO DELA HETEROCEDASTICIDAD
39
HETEROCEDASTICIDAD
e 2 = β0 + β1X1 + β2X2 + ... + βkXk + U
H0: σ ^2 = constante La variable no genera
heterocedasticidad
H1: σ ^2 diferente de la constante La
variable genera heterocedasticidad
41. Modelo no tiene heterolasticidad
RES ^2 (modelo con el que seguimos el
analisis)
VERIFICACIÓN DE HETEROCEDASTICIDAD
41
42. Autocorrelaciones Parciales Estimadas para RESIDUOS2
0 2 6 84
retraso
-1
-0,6
-0,2
0,2
0,6
1
AutocorrelacionesParciales
Autocorrelaciones Estimadas para RESIDUOS2
0 2 6 84
retraso
-1
-0,6
-0,2
0,2
0,6
1
Autocorrelaciones
FAS yFAP
Los factores de autocorrelación no superan los limites de
autocorrelación = No existe autocorrelacion
42
8. ESTUDIO DE
AUTOCORRELACION
43. + no -
Gráfico deDurbin-Watson 1
n=19
k=1
α = 0,05
DL =1,18
DU =1,40
0 41,40 2,6 2,821,18
Estadístico Durbin-Watson =
0,991486
Presencia de autocorrelación
positiva de primer orden
FULLSCREEN HOME
43
44. Contraste de hipótesis de Durbin-Watson
no poseemos
el Valor-P del Estadistico de
Durbin Watson
La Razón-F es lo
suficientemente aceptable
suponemos que
NO existe autocorrelación
.
44
45. Puntos Influyentes
Distancia de
MahalanobisFila Influencia DFITS
10 0,508072 16,6135 -0,147333
15 0,485712 15,111 -0,373854
19 0,164336 2,39866 3,22643
Influencia media de un solo punto = 0,105263
Puntos atípicos
Fila Y Predicha Residuo Estudentizado
19 0,0000379624 0,0000223515 0,0000156109 7,28
PUNTOS INFLUYENTES:
2*√0.105263= 0.64889
FILA 19 IDFITSI > 0.64889
A Posteriori Candidato a ser eliminado
PUNTOS ATIPICOS:
FILA 19
Residuos estudentizados > 3
A priori Candidato a ser eliminado
Eliminamos FILA 19 “La Rioja”
PuntoAnómalo
PuntoAnómalo candidato aeliminar del
modelo
9.Estudio puntos anómalos e influyentes
45
46. + no -
Gráfico de Durbin-Watson2
n=18
k=1
α = 0,05
DL =1,16
DU =1,39
0 41,39 2,61 2,841,16
n= 18
Estadístico Durbin-Watson = 1,54773
No existe autocorrelación
FULLSCREEN HOME
46
47. R-cuadrada = 100,0 porciento
R-cuadrado (ajustado para g.l.) = 0
porciento Error estándardel est. = 0
Error absoluto medio = 0,0000014617
Estadístico Durbin-Watson
= 1,54773
Autocorrelación de residuos en retraso 1 =
0,205636
La ecuación del modelo ajustado es
Nº emp Industria/(Nº varones^1,5) = -
337,635*1/ (Nº varones^1,5) + 0,00977479*Nº
varones/(Nº varones^1,5)
Análisis deVarianza
Fuente Suma deCuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 2,01237E-9 2 1,00618E-9
Residuo 0 16 0
Total 2,01237E-9 18
Parámetro Estimación Estándar T Valor-P
1/(Nº
varones^1,5)
-337,635 0
Nº varones/(Nº
varones^1,5)
0,00977479 0
PROPUESTA DE MODELO FINAL
47
48. Resultados de la Regresión para nº emp Industria/(Nº varones^1,5)
Ajustado Error Est. Inferior 95,0% Superior 95,0% Inferior 95,0%
Fila LC para
Pronóstico
LC para
Pronóstico
LC para
Pronóstico
LC para laMedia
19 4,0658E-06 0 4,0658E-06 4,0658E-06 4,0658E-06
(Nº varones^1,5) 1102017841
Predicción (Industria/
(Nº varones^1,5))*(Nº
varones^1,5)
4480,584139 4480,584139 4480,584139 4480,584139
Superior 95,0%
Fila LC para laMedia
19 4,0658E-06
PREDICCIONES
48
4,0658E-06 * (1066905)^1,5 = 4480,54
Prediccion puntual es de 4480,58
(4480,58 ≤ nº emp Industria ≤ 4480,58)
49. Explicar el numero de empresas en el sector industrial en las diferentes comunidades españolas, usamos 10
variables explicativas
Debido a los problemas de multicolinealidad eliminamos 9 variables y nos quedamos con 1 : N varones
Encontramos que :
la variable y el modelo son sgnificativos
los residuos estan distribuidos de forma normal
no existen problemas de heterocedasticidad
no existen problemas de autocorrelacion
no existen puntos anomalos/ influyentes
Podemos concluir que el numero de varones que residen en una comunidad española explica el numero
de empresas en el sector industrial que existe en esa comunidad.
R^2 = 100 %
CONCLUSIONES
49
50. Modelo econométrico para explicar el número de empresas del sector industria
en España
ALEJANDRO PEREZ- ALEX BOHORQUEZ- NICOLE LA FAYE