SlideShare una empresa de Scribd logo
1 de 26
Descargar para leer sin conexión
Variables no estacionarias y cointegración

                               Roberto Montero Granados

                                Universidad de Granada
                                     marzo, 2007


RESUMEN.

       La econometría de series temporales se encuentra con un problema al medir las
relaciones entre aquellas variables que tienen una tendencia temporal. Este problema
puede llegar a que se consideren significativas relaciones completamente espurias.

      Cuando, en lugar de series estacionarias, se utilizan datos de panel el problema
también puede surgir.

       Las variables que tienen una tendencia temporal definida se denominan “no
estacionarias”. Las estimaciones de regresiones con variables no estacionarias son
espurias salvo que estas estén cointegradas. Dos variables no estacionarias cointegradas
son aquellas cuyos residuos son estacionarios. Si los residuos son estacionarios las
estimaciones de variables no estacionarias son superconsistentes.

INTRODUCCIÓN A LAS SERIES NO ESTACIONARIAS

       Una serie es estacionaria cuando su valor medio es estable. Por el contrario es no
estacionaria cuando sistemáticamente crece o disminuye en el tiempo.

        Intuitivamente podemos entender que las relaciones entre variables no
estacionarias pueden estar sesgadas y, sin embargo, tener errores estándar muy bajos y
ajuste (R2) muy altos. Por ejemplo el número de libros editados en España ha crecido en
los últimos 20 años y la estatura media también. Una regresión de una sobre otra es
posible que arroje resultados significativos y un buen ajuste, sin embargo la relación
entre ambas no es directa, en este caso estaríamos ante lo que se denomina una
regresión espuria (Granger Newbold, 1974). En otras ocasiones podemos no conocer si
dos variables no estacionarias tienes relación la una sobre la otra (Por ejemplo salud y
descentralización) o que, teniendo alguna relación, en que grado la relación entre ambas
es correcta o espuria (por ejemplo crecimiento económico y crecimiento de la cantidad
de dinero).

       Ejemplos de funciones que son no estacionarias son:

yt = yt-1 + ut donde: ut ~ N (a,s2). Este es un ejemplo de paseo aleatorio.




                                                                                       1
16

              14
              12

              10

               8

               6

               4

               2
               0
                   1

                       5

                           9

                               13

                                    17

                                         21

                                              25

                                                   29

                                                        33

                                                             37

                                                                  41

                                                                       45

                                                                            49

                                                                                 53

                                                                                      57
yt = ao + yt-1 + ut donde: ut ~ N (0,s2); ao es la que recoge la tasa de crecimiento medio.
              10
               9
               8
               7
               6
               5
               4
               3
               2
               1
               0
                   1

                       5

                           9

                               13

                                    17

                                         21

                                              25

                                                   29

                                                        33

                                                             37

                                                                  41

                                                                       45

                                                                            49

                                                                                 53

                                                                                      57




yt = ao yt-1 + ut donde: ut ~ N (0,s2); Si 1 > ao > 1 entonces la serie es estacionaria. En
nuestro ejemplo ao > 1
              25

              20

              15

              10

               5

               0
                   1

                       5

                           9

                               13

                                    17

                                         21

                                              25

                                                   29

                                                        33

                                                             37

                                                                  41

                                                                       45

                                                                            49

                                                                                 53

                                                                                      57




              -5



       Por ejemplo el siguiente gráfico muestra la represtación gráfica de la relación
entre dos paseos aleatorios




                                                                                              2
12       y = 1.2415x + 1.7051
                        2
                      R = 0.9252
        10

         8

         6

         4

         2

         0
             0      1       2        3        4       5          6    7        8



       Tanto la variable x como y se han generado aleatoriamente con una perturbación
N(0.2, 0.08), pero aparentemente tienen un alto grado de correlación que, sin embargo,
es completamente espuria.

        Algunas propuestas iniciales para solucionar este problema (Granger,Newbold
1977) fueron: ser más exigente con las t para la significación de las estimaciones o
convertir las series en estacionarias mediante ajustes tendenciales, mediante ajustes con
los residuos, vectores autoregresivos, etc. Sin embargo la primera solución es absurda
(ya que las t crecen con las observaciones de la muestra) y la segunda es insatisfactoria
porque puede ser arbitraria y hace perder información de las variables. Por ello los
mayores esfuerzos posteriores se han dedicado a intentar determinar los límites dentro
de los cuales una regresión es correcta o espuria.

       Se dice de una serie temporal xt que es estacionaria si

E(xt) = cte ∀ t
Var (xt)= cte ∀ t
Cov (xt xt-k)=cte ∀ t ∀ k


PROCEDIMIENTO DE ESTIMACIÓN ANTE SERIES TEMPORALES
ESTACIONARIAS

       El algoritmo de estimación es:

a) si las series son estacionarias
         Se estima por los procedimientos habituales (MCO o GLM)
b) si las series son no estacionarias de orden distinto:
         No puede estimarse la relación
c) si las series son no estacionarias del mismo orden no cointegradas
         La regresión con las variables en estado es espuria. Se puede intentar
estacionalizar las series (mediante alguna operación, logaritmos o diferencias o ratios
con otras variables) o hacer una regresión por primeras diferencias (el resultado nos
indicará si la correlación existe o no.


                                                                                       3
d) si la series son no estacionarias pero están cointegradas
         Se puede pasar la regresión habitual (MCO GLM) para estimar los efectos a
largo plazo y el modelo de corrección de errores para estimar los efectos a corto plazo.

        El método de Engle y Granger tiene tres fases: a) estimación de la
estacionariedad de las series; b) pruebas de cointegración y c) método de corrección de
errores.

I) Pruebas de estacionariedad

a) visual (wntestb var y ac var)

        Observar, en gráficas si la variable crece/decrece monótonamente, si los shocks
son persistentes o por el contrario no se puede establecer un patrón de comportamiento
definitivo. Visualizar el correlograma, el periodograma, etc. Estas pruebas no formales
no son definitivas.

       El correlograma es una representación de la función de autocorrelación

                 cov( xt , xt + k )
        ρk =                           ; ∀k = 1,...m
               var( xt ) var( xt + k )

       Un correlograma que desciende lentamente, como los anteriores, es típico de
variables no estacionarias. Un correlograma que desciende rápidamente o
cuasialeatorio, como los anteriores, es típico de variables estacionarias.

b) Dickey-Fuller (Dickey-Fuller, 1979, 1984; Said-Dickey 1984)

        Es un test exigente. Tiene la ventaja de que la hipótesis nula no es si la serie es
ruido blanco, sino que busca si tiene una raíz unitaria, es decir si no existe relación entre
el incremento de cada valor y el inmediato anterior la serie es estacionaria (I(0)), si
existe dicha relación se dice que la serie tiene raíz unitaria (I(1)).

        Tipos de relación lineal pueden ser (con origen, sin origen, con tendencia, etc.)
El test puede realizarse en tres versiones

                                        dxt = r xt-1 + ut
                                      dxt = ao + r xt-1 + ut
                                  dxt = ao + r xt-1 + a1 t + ut

         donde dxt = xt - xt-1, y, en los tres casos, pasamos el test Ho: r =0 contra H1: r ≠
0. Si no puede rechazarse la nula (p-valor > 0.05) la serie es estacionaria y tiene raíz 0
(I(0)) si se rechaza la nula (p-valor<0.05) la serie es estacionaria y tiene una raíz
unitaria (I(1)).

       Es interesante notar que el estadístico de contraste para la r no son la t usual sino
que Dickey-Fuller (1979) y MacKinnon (1994) mediante simulaciones de Montecarlo,
construyeron unas tablas especiales en las que la t es superior.




                                                                                                4
En realidad dicha prueba sólo es correcta cuando la correlación de la variable a
testar no contiene retardo en la correlación, como esa posibilidad limita mucho sus
posibilidades de análisis los mismos autores propusieron una prueba aumentada que se
conoce como Dickey-Fuller aumentada (dfuller var), que es igual que la anterior con la
diferencia de que, en cada regresión, se incluyen retardos de la variable como
independientes. Es decir:
                                                  p
                               dxt = r xt-1 +   ∑ bx
                                                t =1
                                                              t −1    + ut
                                                        p
                            dxt = ao + r xt-1 +        ∑ bx
                                                       t =1
                                                                     t −1   + ut
                                                                p
                         dxt = ao + r xt-1 + a1 t +           ∑ bx
                                                               t =1
                                                                            t −1   + ut


        Un problema es ahora el de determinar el numero de retardos (p) apropiados.
Según Verbeek, si es demasiado grande o demasiado pequeño puede provocar que
series no estacionarias aparezcan como estacionarias. Para ello se proponen varios
métodos: El criterio de información de Akaike (AIC) o el criterio de Schwarz Bayesian
(SBC) (en ambos caso se escoge el retardo con mayor valor). Otra opción es incluir
retardos, mediante prueba y error, hasta eliminar la correlación serial en las ut medida
con un estadístico usual como el de Durbin-Watson. En Stata está implementado un
sistema standar el de Dickey-Fuller GLS test (dfgls var). Este nos permite escoger entre
los retados aquel más conveniente. Si nos decidimos por este método el procedimiento
más correcto sería:
        b1) pasar dfgls a la variable para obtener el número de retardos (lags) apropiado
        b2) pasar dfuller a la variable con el número de retardos obtenido anteriormente.


b) Otros test interesantes son B de Bartlett (wntestb var), Q de Pormateau (wntestq var;
también conocido como test Ljung-Box)y Z de Phillips-Perron (pperron var)


       La especificación de los dos primeros es:
                                                n ˆ k
                                 B = max          Fk −
                                       1≤ k ≤ q 2      q

       donde Fk es función del periodograma acumulado de la serie definido en
términos de la función de densidad espectral y:

                                              m
                                                   ˆ2 
                                                    ρ
                            Q LB = n( n + 2 )∑  k  ~ χ m
                                                  n−k 
                                                         2

                                             k =1     
       En ambos casos las hipótesis del test son:

       Ho: (p-valor >0.05)la serie es White noise = estacionaria
       H1: (p-valor < 0.05)La serie es Random walk = no estacionaria.

       El tercero (Phillips y Perron, 1988) calcula dos parámetros Zp y Zτ, que son:




                                                                                          5
1 n 2σ 2 ˆ 2
                            Z ρ = n (ρ n − 1) −
                                     ˆ
                                                  2 sn
                                                       ˆ
                                                       2
                                                          (λn − γˆ 0 ,n )
                                 γ 0 ,n ρ n − 1 1 ˆ 2           1 nσ
                                               − (λn − γ 0 ,n )
                                 ˆ ˆ                                ˆ
                          Zτ =                         ˆ
                                  ˆ
                                  λn σ
                                    2
                                          ˆ
                                            2
                                                2               ˆ
                                                                λn sn

        Sus valores críticos y la significación se basan en la misma t modificada del test
Dickey-Fuller. Este test tiene dos ventajas sobre los anteriores:
a) la Ho consiste en que las serie es integrada de orden 1. Es decir con un p valor < 0.05
se rechaza la nula, lo que indica que la serie no es I(1)
b) se puede introducir rezagos (lags) en el test lo que lo hace insustituible en el caso que
el dfgls nos haya recomendado la introducción de los mismos.

        Serie estacionaria, ruido blanco (withe noise) y raiz nula (I(0)) y por otra parte
serie no estacionaria, camino aleatorio (ramdom walk) y raíz unitaria (I(1)) no son
exactamente sinónimos entre sí, pero si aluden a distintas formas del comportamiento de
las variables (ciclos, tendencias, etc.) que pueden hacer que las variable pueden ser
útiles o completamente inútiles.

       Todos los test descritos son ineficientes en el caso de cambio estructural (Perron,
1989). Es decir una serie estacionaria con cambio estructural puede aparecer como no
estacionaria y viceversa.

II) Pruebas de Cointegración

        Supongamos que dos variables temporales xt e yt son estacionarias de orden 1 (es
decir son I(1)) (si son estacionarias en otros ordenes (I(2), I(3)...) o en dos ordenes
distintos el problema se complica). Se dice que dichas variables están cointegradas
cuando puede practicarse una regresión lineal o no lineal del siguiente tenor:

                                     yt = a + bxt + ut

       que generalmente tendrá un buen ajuste. Pero donde debe suceder que los
residuos, es decir ut = – a + yt + bxt sea I(0). Es decir, requisitos para definir la
cointegración son:

       a) que dos variables sean estacionarias de orden 1
       b) que exista una combinación lineal de ambas que sea estacionaria de orden 0

       Cuando ambas condiciones se cumplen se dice que las variables están
cointegradas. Cointegración significa que existe una relación, a largo plazo, entre las
variables. En definitiva, si xt e yt están cointegradas significa que, aunque crezcan en el
tiempo (t), lo hacen de una forma completamente acompasada, de forma que el error
entre ambas no crece. Es decir, si en la regresión,

                                       y= a + bx + u

                                  ˆ
u es estacionaria (I(0)) entonces b no sólo es consistente sino superconsistente (es
ˆ
decir la estimación converge a su valor real de forma inversamente proporcional al
número de observaciones, en lugar de la raíz cuadrada del número de observaciones que


                                                                                          6
es el caso de las variables estacionarias (Engle, Granger, 1987)). En definitiva probar la
cointegración entre dos variables I(1) es igual que probar la estacionariedad de los
recursos.

       Para testar la cointegración sólo hay que estimar los residuos del modelo de
regresión y pasar la prueba de Dickey-Fuller aumentada (dfuller var) a los residuos
estimados ( u ). Si se cumple la Ho entonces xt e yt están cointegradas y b es
            ˆ                                                                 ˆ
superconsistente.

III) Modelo de corrección de errores.


        Como una extensión del modelo, si las variables están cointegradas se pueden
utilizar los residuos para corregir los errores y estimar también los efectos a corto plazo
de depvar sobre indepvar. El modelo a estimar se denomina de corrección de errores y
su especificación es:

                      yt – yt-1 = β (xt – xt-1) + γ (yt-1 – a – b xt-1) + εt

        Donde γ (yt-1 – a – b xt-1) = γ (ut-1) es el mecanismo de corrección en que
                     ˆ                                                 ˆ
forzosamente γ<0, b es la influencia, a largo plazo de x sobre y, y β es la estimación
de la influencia, a corto plazo de x sobre y. El modelo también suele escribirse:

                                     ∆yt = β (∆xt) + γ (ut-1) + εt




                                                                                         7
Ejemplo:

Todas las variables se han transformado en sus correspondientes logaritmos naturales.

lnirpf: Logaritmo de la recaudación por el Impuesto sobre la Renta de las Personas
Físicas.
lnsoc: Logaritmo de la recaudación por el Impuesto sobre Sociedades.
lniva: Logaritmo de la recaudación por el Impuesto sobre el Valor Añadido.
lnremun: Logaritmo de la remuneración de asalariados.
lnrentas: Logaritmo de las rentas de la propiedad.
lneeb: Logaritmo del excedente de explotación bruto / Renta mixta bruta.
lntp: Logaritmo de la recaudación territorializada por el Impuesto sobre Transmisiones
Patrimoniales.
lncons_terr: Logaritmo del consumo final de las familias sobre el territorio económico.

Datos España desde 1986 hasta 2003 (INEbase y BADESPE)

              Queremos estimar los siguientes modelos

modelo 1:           lnirpft = β1o + β11 lnremumt + β12lnrentast + β12lneebt + β12lntpt + u1t
modelo 2:           lnsoct = β2o + β11lneebt + u2t
modelo 3:           lnivat = β3o + β31cons_terrt + u3t


MODELO 1
1 Pruebas de estacionariedad
1a) gráficos
line lnirpf lnremum lnrentas lntp lneeb year
  14
  12
  10
  8
  6




       1985         1990          1995         2000   2005
                                  year

                           lnirpf         lnremum
                           lnrentas       lntp
                           lneeb




Correlogramas
ac var




                                                                                               8
1.00




                                                                                                                   1.00
                           0.50




                                                                                                                              0.50
                                                                                                      Autocorrelations of lnremum
    Autocorrelations of lnirpf
             0.00




                                                                                                                  0.00
 -0.50




                                                                                                     -0.50
               -1.00




                                                                                                                   -1.00
                                  0                       2                      4      6       8                                    0                       2                      4    6        8
                                                                                Lag                                                                                                Lag
                                  Bartlett's formula for MA(q) 95% confidence bands                                                  Bartlett's formula for MA(q) 95% confidence bands
               1.00




                                                                                                                   1.00
                          0.50




                                                                                                                              0.50
  Autocorrelations of lnrentas




                                                                                                       Autocorrelations of lneeb
             0.00




                                                                                                                 0.00
 -0.50




                                                                                                     -0.50
               -1.00




                                                                                                                   -1.00




                                  0                       2                      4      6       8                                    0                       2                      4    6        8
                                                                                Lag                                                                                                Lag
                                  Bartlett's formula for MA(q) 95% confidence bands                                                  Bartlett's formula for MA(q) 95% confidence bands




Parecen no estacionarias.

B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags())

Para determinar el número de retardos se utiliza la prueba DF-GLS test.
. dfgls lnirpf

DF-GLS for lnirpf                                                                                                                                                Number of obs =             10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -2.260           -3.770            -6.020            -4.383
    6            -2.275           -3.770            -4.391            -3.191
    5            -3.280           -3.770            -3.438            -2.535
    4            -5.171           -3.770            -3.012            -2.292
    3            -3.118           -3.770            -2.965            -2.340
    2            -1.384           -3.770            -3.151            -2.558
    1            -1.317           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) =                                                           4 with RMSE   .0153774
Min SC   = -7.363117 at lag                                                           5 with RMSE   .0126217
Min MAIC = -5.592253 at lag                                                           1 with RMSE    .037169


. dfgls                                      lnremum

DF-GLS for lnremum                                                                                                                                               Number of obs =             10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -1.085           -3.770            -6.020            -4.383
    6            -1.292           -3.770            -4.391            -3.191
    5            -1.408           -3.770            -3.438            -2.535
    4            -1.476           -3.770            -3.012            -2.292




                                                                                                                                                                                                      9
3                -1.594       -3.770              -2.965             -2.340
    2                -1.572       -3.770              -3.151             -2.558
    1                -1.780       -3.770              -3.421             -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.456219 at lag 1 with RMSE .0314811
Min MAIC = -4.983993 at lag 2 with RMSE .0304348


. dfgls   lnrentas

DF-GLS for lnrentas                                        Number of obs =        10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -1.418           -3.770            -6.020            -4.383
    6            -1.461           -3.770            -4.391            -3.191
    5            -2.648           -3.770            -3.438            -2.535
    4            -1.426           -3.770            -3.012            -2.292
    3            -1.972           -3.770            -2.965            -2.340
    2            -1.478           -3.770            -3.151            -2.558
    1            -1.580           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -3.989102 at lag 5 with RMSE .0681989
Min MAIC = -3.239434 at lag 1 with RMSE .1155362


DF-GLS for lntp                                            Number of obs =        10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -0.654           -3.770            -6.020            -4.383
    6            -1.876           -3.770            -4.391            -3.191
    5            -2.399           -3.770            -3.438            -2.535
    4            -1.430           -3.770            -3.012            -2.292
    3            -1.689           -3.770            -2.965            -2.340
    2            -1.312           -3.770            -3.151            -2.558
    1            -1.586           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -4.935668 at lag 1 with RMSE .0673338
Min MAIC = -4.35767 at lag 1 with RMSE .0673338

DF-GLS for lneeb                                           Number of obs =        10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -1.343           -3.770            -6.020            -4.383
    6            -1.758           -3.770            -4.391            -3.191
    5            -2.247           -3.770            -3.438            -2.535
    4            -2.411           -3.770            -3.012            -2.292
    3            -2.331           -3.770            -2.965            -2.340
    2            -2.092           -3.770            -3.151            -2.558
    1            -2.087           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.220494 at lag 1 with RMSE    .035419
Min MAIC = -5.04291 at lag 1 with RMSE     .035419


En el caso de lnirpf recomienda 4 retados, en el resto cero retardos. La prueba DF
aumentada queda


. dfuller lnirpf, lags(4)

Augmented Dickey-Fuller test for unit root           Number of obs   =            13




                                                                                       10
---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)              0.933            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.9935

. dfuller lnremun, lags(0)

Dickey-Fuller test for unit root                   Number of obs   =        17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -2.240            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.1921


. dfuller lnrentas, lags(0)

Dickey-Fuller test for unit root                   Number of obs   =        17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -2.439            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.1311

. dfuller lntp, lags(0)

Dickey-Fuller test for unit root                   Number of obs   =        17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -0.821            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.8128

. dfuller lneeb, lags(0)

Dickey-Fuller test for unit root                   Number of obs   =        17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -1.925            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.3206


b) Otros test

        Se pasan los test B de Bartlett y Q de Portmanteau (wntestb y wntestq)
wntestb var




                                                                                 11
Cumulative Periodogram White Noise Test

                    1.00
 Cumulative periodogram for lnirpf
  0.20    0.40     0.60
                    0.00   0.80




                                           0.00                 0.10               0.20         0.30   0.40   0.50
                                                                                       Frequency
                                            Bartlett's (B) statistic =   1.36 Prob > B = 0.0506




                                                         Cumulative Periodogram White Noise Test                                                                              Cumulative Periodogram White Noise Test
                                    1.00




                                                                                                                                                         1.00
 Cumulative periodogram for lnremun




                                                                                                                     Cumulative periodogram for lnrentas
                             0.80




                                                                                                                                                 0.80
                    0.60




                                                                                                                                        0.60
            0.40




                                                                                                                                0.40
   0.20




                                                                                                                       0.20
                    0.00




                                                                                                                                        0.00




                                           0.00                 0.10               0.20         0.30   0.40   0.50                                              0.00                 0.10               0.20          0.30   0.40   0.50
                                                                                       Frequency                                                                                                            Frequency
                                            Bartlett's (B) statistic =   1.66 Prob > B = 0.0079                                                                  Bartlett's (B) statistic =   2.10 Prob > B = 0.0003




                                                         Cumulative Periodogram White Noise Test                                                                              Cumulative Periodogram White Noise Test
                    1.00




                                                                                                                                        1.00
                                                                                                                     Cumulative periodogram for lneeb
 Cumulative periodogram for lntp
                          0.80




                                                                                                                                                0.80
                  0.60




                                                                                                                                       0.60
         0.40




                                                                                                                              0.40
 0.20




                                                                                                                      0.20
                    0.00




                                                                                                                                        0.00




                                           0.00                 0.10               0.20         0.30   0.40   0.50                                              0.00                 0.10               0.20          0.30   0.40   0.50
                                                                                       Frequency                                                                                                            Frequency
                                            Bartlett's (B) statistic =   1.59 Prob > B = 0.0131                                                                  Bartlett's (B) statistic =   1.52 Prob > B = 0.0191




. wntestq lnirpf

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     22.5712
 Prob > chi2(7)            =      0.0020

. wntestq lnremun

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     32.9494
 Prob > chi2(7)            =      0.0000

. wntestq lnrentas

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     24.9321
 Prob > chi2(7)            =      0.0008

. wntestq lntp




                                                                                                                                                                                                                                           12
Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     30.7291
 Prob > chi2(7)            =      0.0001

. wntestq lneeb

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     27.2311
 Prob > chi2(7)            =      0.0003


Cuadro resumen

                                                                    test
variable           DF           retardos       test Barlet                           diagnóstico
                                                                Portmanteau
                   0.933                          1.36             22.57
lnirpf                             4                                                      I(1)
                  (0.994)                       (0.050)           (0.002)
                  -2.240                          1.66             32.94
lnremun                            0                                                      I(1)
                  (0.192)                       (0.008)           (0.000)
                  -2.439                          2.10             24.93
lnrentas                           0                                                      I(1)
                  (0.131)                       (0.000)           (0.001)
                  -0.821                          1.59             30.72
lntp                               0                                                      I(1)
                  (0.813)                       (0.013)           (0.000)
                  -1.925                          1.52             27.23
lneeb                              0                                                      I(1)
                  (0.321)                       (0.019)           (0.000)

        Todos los test coinciden. Todas las variables son I(1). El caso de lnirpf está en el
límite en el caso del test de Barlet, pero dada la rotundidad del resto de pruebas hemos e
concluir que también es I(1). A efectos de la significación (entre paréntesis) es necesario
tener en cuenta que la hipótesis nula de DF test es que la serie es integrada en orden uno
mientras que la de los test es que es ruido blanco.


PRUEBA DE COINTEGRACIÓN

Estimación a largo plazo y estimación de los residuos u1
. regress lnirpf lnremun lnrentas lntp lneeb

      Source |       SS       df       MS                    Number of obs   =       18
-------------+------------------------------                 F( 4,     13)   =   428.63
       Model |   3.3024046     4 .825601151                  Prob > F        =   0.0000
    Residual |   .02503956    13   .00192612                 R-squared       =   0.9925
-------------+------------------------------                 Adj R-squared   =   0.9902
       Total | 3.32744416     17   .19573201                 Root MSE        =   .04389

------------------------------------------------------------------------------
      lnirpf |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
     lnremun |   .3425318   .1979751     1.73   0.107    -.0851675     .770231
    lnrentas |   .3603197    .056176     6.41   0.000     .2389588    .4816806
        lntp |   .1363144   .1040068     1.31   0.213    -.0883785    .3610074
       lneeb |   .5506441   .2543343     2.17   0.050     .0011882      1.1001
       _cons | -4.784673    1.175606    -4.07   0.001    -7.324414   -2.244931
------------------------------------------------------------------------------

. predict u1, residuals




                                                                                                 13
Se comprueba la estacionariedad de los residuos. Gráficamente parecen
estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma)
. line u1 year

. ac u1

. wntestb u1
               .1




                                                                                                                        0.50
               .05




                                                                                                              Autocorrelations of u1
 Residuals




                                                                                                                      0.00
     0         -.05




                                                                                                                        -0.50
               -.1




                                                                                                                                       0                       2                      4           6        8
                                 1985                      1990                  1995        2000      2005                                                                          Lag
                                                                                 year                                                  Bartlett's formula for MA(q) 95% confidence bands




                                               Cumulative Periodogram White Noise Test
               1.00       0.80
 Cumulative periodogram for u1
 0.20    0.40     0.60
               0.00




                                 0.00                 0.10               0.20         0.30      0.40   0.50
                                                                             Frequency
                                  Bartlett's (B) statistic =   0.40 Prob > B = 0.9975




Parece evidente la ausencia de estacionariedad en los residuos. Los test formales:


. dfgls u1

DF-GLS for u1                                                                                                                                                      Number of obs =                    10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -0.094           -3.770            -6.020            -4.383
    6            -0.784           -3.770            -4.391            -3.191
    5            -1.310           -3.770            -3.438            -2.535
    4            -2.388           -3.770            -3.012            -2.292
    3            -1.896           -3.770            -2.965            -2.340
    2            -1.781           -3.770            -3.151            -2.558
    1            -2.265           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.436426 at lag 1 with RMSE .0317942
Min MAIC = -5.875307 at lag 7 with RMSE .0226678

. dfgls u1

DF-GLS for u1                                                                                                                                                      Number of obs =                    10
Maxlag = 7 chosen by Schwert criterion

                                                                 DF-GLS tau                   1% Critical                                   5% Critical                                    10% Critical
     [lags]                                                    Test Statistic                     Value                                         Value                                           Value




                                                                                                                                                                                                               14
------------------------------------------------------------------------------
    7            -0.094           -3.770            -6.020            -4.383
    6            -0.784           -3.770            -4.391            -3.191
    5            -1.310           -3.770            -3.438            -2.535
    4            -2.388           -3.770            -3.012            -2.292
    3            -1.896           -3.770            -2.965            -2.340
    2            -1.781           -3.770            -3.151            -2.558
    1            -2.265           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.436426 at lag 1 with RMSE .0317942
Min MAIC = -5.875307 at lag 7 with RMSE .0226678

. dfuller u1, lags(0)

Dickey-Fuller test for unit root                      Number of obs      =           17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -4.097            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.0010

. wntestb u1

. wntestq u1

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     7.3805
 Prob > chi2(7)            =     0.3904


      Sugieren, en primer lugar que el número de retardos sea de cero. El cuadro
resumen:

                                                                    test
variable          DF          retardos         test Barlet                           diagnóstico
                                                                Portmanteau
                 4.097                            0.4               7.38
u1                                 0                                                      I(0)
                (0.001)                         (0.997)           (0.390)

        En este primer modelo todos los test coinciden, los residuos son ruido blanco o
I(0), por lo tanto las variables están cointegradas y las estimaciones resultantes son
superconsistentes.

MODELO DE CORRECCIÓN DE ERRORES

       También se pueden estimar las relaciones a corto plazo. Para ello usaremos la
regresión auxiliar correspondiente. El resultado es:


. regress dlnirpf dlnremum dlnrentas dlntp dlneeb u1t1

      Source |       SS       df       MS                    Number of obs   =       17
-------------+------------------------------                 F( 5,     11)   =    14.02
       Model | .099018866      5 .019803773                  Prob > F        =   0.0002
    Residual | .015534073     11 .001412188                  R-squared       =   0.8644
-------------+------------------------------                 Adj R-squared   =   0.8028
       Total | .114552939     16 .007159559                  Root MSE        =   .03758

------------------------------------------------------------------------------
     dlnirpf |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
    dlnremum |   .6396547   .3155149     2.03   0.068    -.0547889    1.334098
   dlnrentas |   .3724583   .1048175     3.55   0.005     .1417565      .60316
       dlntp |    .227702   .1017538     2.24   0.047     .0037434    .4516606



                                                                                                 15
dlneeb |   .2339523   .3611132     0.65   0.530    -.5608525    1.028757
        u1t1 | -1.000077    .2529111    -3.95   0.002    -1.556731   -.4434235
       _cons |   -.012096   .0464382    -0.26   0.799    -.1143057    .0901137
------------------------------------------------------------------------------


        En nuestro caso dicho mecanismo es significativo. La relación a corto plazo
difiere un tanto de la relación a largo plazo y su grado de ajuste (que ahora es el correcto
exento de la tendencia temporal) es del 80.28%. No debemos ser muy exigentes con la
significación de las variables incluidas en el modelo debido a la falta de grados de
libertad, pero parece que, a corto plazo el excedente de explotación es el componente
que menos aporta a la recaudación por IRPF.

MODELO 2
1 Pruebas de estacionariedad
1a) gráficos
. line lnirpf lnremum lnrentas lntp lneeb year

. ac var
                                                                                                                         1.00
  12




                                                                                                                                    0.50
  11




                                                                                                             Autocorrelations of lnsoc
  10




                                                                                                                       0.00
  9




                                                                                                           -0.50
  8




                                                                                                                         -1.00




                  1985                              1990                     1995            2000   2005
                                                                             year                                                          0                       2                      4    6        8
                                                                                                                                                                                         Lag
                                                                       lnsoc         lneeb
                                                                                                                                           Bartlett's formula for MA(q) 95% confidence bands
               1.00       0.50
   Autocorrelations of lneeb
 -0.50       0.00
               -1.00




                                 0                       2                      4             6      8
                                                                               Lag
                                 Bartlett's formula for MA(q) 95% confidence bands




Visualmente parece que hay evidencia que son no estacionarias.

B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags())

Para determinar el número de retardos se utiliza la prueba DF-GLS test.
. dfgls lnsoc

DF-GLS for lnsoc                                                                                                                                                       Number of obs =             10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------



                                                                                                                                                                                                            16
7                                    -0.902                    -3.770       -6.020             -4.383
                                    6                                    -0.662                    -3.770       -4.391             -3.191
                                    5                                    -1.920                    -3.770       -3.438             -2.535
                                    4                                    -1.599                    -3.770       -3.012             -2.292
                                    3                                    -2.570                    -3.770       -2.965             -2.340
                                    2                                    -1.974                    -3.770       -3.151             -2.558
                                    1                                    -1.675                    -3.770       -3.421             -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -4.333827 at lag 7 with RMSE .0455954
Min MAIC = -3.698859 at lag 1 with RMSE .0920008

. dfgls lneeb

DF-GLS for lneeb                                                                                                     Number of obs =        10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -1.343           -3.770            -6.020            -4.383
    6            -1.758           -3.770            -4.391            -3.191
    5            -2.247           -3.770            -3.438            -2.535
    4            -2.411           -3.770            -3.012            -2.292
    3            -2.331           -3.770            -2.965            -2.340
    2            -2.092           -3.770            -3.151            -2.558
    1            -2.087           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.220494 at lag 1 with RMSE    .035419
Min MAIC = -5.04291 at lag 1 with RMSE     .035419

. dfuller lnsoc, lags(0)

Dickey-Fuller test for unit root                                                                               Number of obs   =            17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -1.315            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.6222

. dfuller lneeb, lags(0)

Dickey-Fuller test for unit root                                                                               Number of obs   =            17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -1.925            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.3206

. wntestb lnsoc
                                                  Cumulative Periodogram White Noise Test
                1.00
 Cumulative periodogram for lnsoc
  0.20    0.40     0.60
                0.00       0.80




                                    0.00                 0.10               0.20         0.30   0.40    0.50
                                                                                Frequency
                                     Bartlett's (B) statistic =   1.44 Prob > B = 0.0314



. wntestb lneeb




                                                                                                                                                 17
Cumulative Periodogram White Noise Test

                1.00
 Cumulative periodogram for lneeb
  0.20    0.40     0.60
                0.00        0.80




                                    0.00                 0.10               0.20         0.30    0.40       0.50
                                                                                Frequency
                                     Bartlett's (B) statistic =   1.52 Prob > B = 0.0191



. wntestq lnsoc

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     22.1621
 Prob > chi2(7)            =      0.0024

. wntestq lneeb

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     27.2311
 Prob > chi2(7)            =      0.0003


Cuadro resumen

                                                                                                                                        test
variable                                                                      DF                retardos           test Barlet                           diagnóstico
                                                                                                                                    Portmanteau
                                                                         -1.315                                       1.44             22.16
lnsoc                                                                                                   0                                                     I(1)
                                                                         (0.622)                                    (0.031)           (0.002)
                                                                         -1.925                                       1.52             27.23
lneeb                                                                                                   0                                                     I(1)
                                                                         (0.321)                                    (0.019)           (0.000)

       Todos los test coinciden. Todas las variables son I(1). En el caso de lnsoc, el test
de Barlet está en el límite, pero dada la rotundidad del resto de pruebas hemos e
concluir que también es I(1). A efectos de la significación (entre paréntesis) es necesario
tener en cuenta que la hipótesis nula de DF test es que la serie es integrada en orden uno
mientras que la de los test es que es ruido blanco.


PRUEBA DE COINTEGRACIÓN

Estimación a largo plazo y estimación de los residuos u2
. regress lnsoc lneeb

      Source |       SS       df       MS                                                                                        Number of obs   =       18
-------------+------------------------------                                                                                     F( 1,     16)   =   104.60
       Model | 4.69320111      1 4.69320111                                                                                      Prob > F        =   0.0000
    Residual | .717908413     16 .044869276                                                                                      R-squared       =   0.8673
-------------+------------------------------                                                                                     Adj R-squared   =   0.8590
       Total | 5.41110953     17   .31830056                                                                                     Root MSE        =   .21182

------------------------------------------------------------------------------
       lnsoc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       lneeb |   1.635002   .1598668    10.23   0.000       1.2961    1.973905
       _cons | -9.635709    1.833375    -5.26   0.000    -13.52229   -5.749126
------------------------------------------------------------------------------




                                                                                                                                                                     18
. predict u2, residuals



       Se comprueba la estacionariedad de los residuos. Gráficamente parecen no
estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma)
               .4
               .2
 Residuals
     0         -.2
               -.4




                                 1985                  1990                    1995    2000    2005
                                                                               year
               1.00




                                                                                                                                                     Cumulative Periodogram White Noise Test
                                                                                                                     1.00
                          0.50




                                                                                                                                0.80
                                                                                                       Cumulative periodogram for u2
     Autocorrelations of u2




                                                                                                                        0.60
             0.00




                                                                                                               0.40
 -0.50




                                                                                                       0.20
               -1.00




                                                                                                                     0.00




                                  0                       2                      4      6       8                                      0.00                 0.10               0.20          0.30   0.40    0.50
                                                                                Lag                                                                                                Frequency
                                  Bartlett's formula for MA(q) 95% confidence bands                                                     Bartlett's (B) statistic =   1.96 Prob > B = 0.0009




Los test formales:


. dfgls u2

DF-GLS for u2                                                                                                                                                         Number of obs =                  10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -1.062           -3.770            -6.020            -4.383
    6            -1.303           -3.770            -4.391            -3.191
    5            -1.173           -3.770            -3.438            -2.535
    4            -1.379           -3.770            -3.012            -2.292
    3            -3.615           -3.770            -2.965            -2.340
    2            -2.796           -3.770            -3.151            -2.558
    1            -1.843           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) =                                                           2 with RMSE     .0862708
Min SC   = -4.444164 at lag                                                           3 with RMSE     .0683852
Min MAIC = -3.294883 at lag                                                           1 with RMSE     .1068462

. dfuller u2, lags(2)

Augmented Dickey-Fuller test for unit root                                                                                                          Number of obs                             =        15

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -2.800            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.0583



                                                                                                                                                                                                                   19
. wntestq u2

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     35.5411
 Prob > chi2(7)            =      0.0000

      Sugieren, en primer lugar que el número de retardos sea de 2. El cuadro
resumen:

                                                                    test
variable           DF          retardos        test Barlet                          diagnóstico
                                                                Portmanteau
                 -2.800                           1.96             35.54
u2                                 2                                                     I(1)
                 (0.058)                        (0.009)           (0.000)

       Tras el análisis quedan muchas sombras acerca de la estacionariedad de los
residuos. Mientras que para el test DF (el más consistente) la estacionariedad es casi
alcanzada para los otros dos test está claro la no estacionariedad . Quizá deban incluirse
más variables en el modelo o exista algún tipo de cambio estructural (provocado por el
cambio en la legislación) que hace que los test fallen ante lo que parece una evidencia
de que la recaudación por el impuesto sobre sociedades debe depender del excedente de
explotación.

MODELO DE CORRECCIÓN DE ERRORES

       También se pueden estimar las relaciones a corto plazo. Para ello usaremos la
regresión auxiliar correspondiente. El resultado es:


. regress dlnsoc dlneeb u2t1

      Source |       SS       df       MS                    Number of obs   =      17
-------------+------------------------------                 F( 2,     14)   =    0.54
       Model | .026027168      2 .013013584                  Prob > F        = 0.5921
    Residual |   .33479635    14 .023914025                  R-squared       = 0.0721
-------------+------------------------------                 Adj R-squared   = -0.0604
       Total | .360823518     16   .02255147                 Root MSE        = .15464

------------------------------------------------------------------------------
      dlnsoc |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      dlneeb |   .9440714   1.085129     0.87   0.399    -1.383298    3.271441
        u2t1 | -.2050166    .2157877    -0.95   0.358    -.6678352    .2578019
       _cons |    .050891   .0827027     0.62   0.548    -.1264886    .2282707
------------------------------------------------------------------------------

        Como cabía esperar, en este caso dicho mecanismo, aunque negativo, no es
significativo. La relación a corto plazo tampoco es significativa y el ajuste general muy
bajo.

      Sin embargo, si se estima la relación lineal, en cortes transversales, año a año,
del modelo

                               lnsocr = a + b · lneebr + ur

       donde lnsocr es la recaudación territorializada por el impuesto sobre sociedades
de la CCAA r, lneebr es el excedente de explotación/renta bruta mixta, ur son los


                                                                                                20
residuos normales y a y b parámetros a estimar. La R2 del modelo y la significación del
           ˆ
parámetro b no dejan lugar a dudas de la relación entre ambas. Los resultados son:


                              año                 Coef.                                           P>t                                R2
                              1986                1.314                                          0.000                             0.679
                              1987                1.328                                          0.000                             0.717
                              1988                1.359                                          0.000                             0.728
                              1989                1.325                                          0.000                             0.643
                              1990                1.270                                          0.000                             0.678
                              1991                1.259                                          0.000                             0.724
                              1992                1.206                                          0.000                             0.630
                              1993                1.285                                          0.000                             0.685
                              1994                1.219                                          0.000                             0.764
                              1995                1.210                                          0.000                             0.756
                              1996                1.274                                          0.000                             0.778
                              1997                1.336                                          0.000                             0.743
                              1998                1.355                                          0.000                             0.781
                              1999                1.272                                          0.000                             0.790
                              2000                1.208                                          0.000                             0.788
                              2001                1.218                                          0.000                             0.706
                              2002                1.182                                          0.000                             0.771
                              2003                1.234                                          0.000                             0.806

      La existencia de una relación no espuria entre ambas parece quedar fuera de toda
duda por lo que una explicación plausible a los resultados de los test es la existencia de
un cambio estructural en las series (previsiblemente de recaudación) que invalida los
test.

MODELO 3
1 Pruebas de estacionariedad

. line lniva lncons_terr year

. ac var
                                                                          1.00
 13




                                                                                      0.50
 12




                                                               Autocorrelations of lniva
 11




                                                                        0.00
 10




                                                            -0.50
 9




                                                                          -1.00




      1985   1990           1995           2000      2005
                            year                                                             0                       2                      4    6   8
                                                                                                                                           Lag
                    lniva          lncons_terr
                                                                                             Bartlett's formula for MA(q) 95% confidence bands




                                                                                                                                                         21
1.00
 Autocorrelations of lncons_terr
 -0.50        0.00
                -1.00     0.50




                                   0                       2                      4      6       8
                                                                                 Lag
                                   Bartlett's formula for MA(q) 95% confidence bands




Visualmente parece que hay evidencia que son no estacionarias.

B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags())

Para determinar el número de retardos se utiliza la prueba DF-GLS test.

. dfgls lniva

DF-GLS for lniva                                                                                                      Number of obs =   10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -0.452           -3.770            -6.020            -4.383
    6            -0.620           -3.770            -4.391            -3.191
    5            -2.112           -3.770            -3.438            -2.535
    4            -1.779           -3.770            -3.012            -2.292
    3            -2.272           -3.770            -2.965            -2.340
    2            -1.537           -3.770            -3.151            -2.558
    1            -1.583           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -6.940659 at lag 1 with RMSE    .024709
Min MAIC = -4.799559 at lag 1 with RMSE    .024709

. dfgls                                       lncons_terr

DF-GLS for lncons_terr                                                                                                Number of obs =   10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -0.357           -3.770            -6.020            -4.383
    6            -0.183           -3.770            -4.391            -3.191
    5            -0.154           -3.770            -3.438            -2.535
    4            -0.542           -3.770            -3.012            -2.292
    3            -0.401           -3.770            -2.965            -2.340
    2            -0.282           -3.770            -3.151            -2.558
    1            -0.254           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) =                                                            1 with RMSE   .0053626
Min SC   = -9.996085 at lag                                                            1 with RMSE   .0053626
Min MAIC = -10.2093 at lag                                                             1 with RMSE   .0053626


Para lniva se recomiendan cero retardos, para lncons_terr se recomiendan 1 retardo

. dfuller lniva, lags(0)

Dickey-Fuller test for unit root                                                                                Number of obs   =       17

                                                                                         ---------- Interpolated Dickey-Fuller ---------



                                                                                                                                             22
Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -1.645            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.4597


. dfuller                                                           lncons_terr, lags(1)

Augmented Dickey-Fuller test for unit root                                                                               Number of obs   =   16

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -0.819            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.8134

. wntestb lniva
                                                             Cumulative Periodogram White Noise Test
                      1.00
 Cumulative periodogram for lniva
  0.20    0.40     0.60
                      0.00 0.80




                                               0.00                 0.10               0.20         0.30   0.40   0.50
                                                                                           Frequency
                                                Bartlett's (B) statistic =   1.53 Prob > B = 0.0184



. wntestb lncons_terr
                                                             Cumulative Periodogram White Noise Test
                                        1.00
 Cumulative periodogram for lncons_terr
    0.20     0.40     0.60
                      0.00     0.80




                                               0.00                 0.10               0.20         0.30   0.40   0.50
                                                                                           Frequency
                                                Bartlett's (B) statistic =   1.64 Prob > B = 0.0090




. wntestq lniva

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     29.5251
 Prob > chi2(7)            =      0.0001

. wntestq                                                           lncons_terr

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     32.3507
 Prob > chi2(7)            =      0.0000




Cuadro resumen



                                                                                                                                                  23
test
variable                                                                   DF                 retardos                 test Barlet                                                                            diagnóstico
                                                                                                                                                                                  Portmanteau
                                                                      -1.645                                                                1.53                                     29.52
lniva                                                                                                  0                                                                                                          I(1)
                                                                      (0.460)                                                             (0.018)                                   (0.000)
                                                                      -0.819                                                                1.64                                     32.35
lncons_terr                                                                                            1                                                                                                          I(1)
                                                                      (0.813)                                                             (0.009)                                   (0.000)

                                          Todos los test coinciden. Ambas variables son no estacionarias I(1).


PRUEBA DE COINTEGRACIÓN

Estimación a largo plazo y estimación de los residuos u2

. regress lniva lncons_terr

      Source |       SS       df       MS                                                                                                                              Number of obs                  =      18
-------------+------------------------------                                                                                                                           F( 1,     16)                  = 1069.60
       Model | 3.38880259      1 3.38880259                                                                                                                            Prob > F                       = 0.0000
    Residual | .050692461     16 .003168279                                                                                                                            R-squared                      = 0.9853
-------------+------------------------------                                                                                                                           Adj R-squared                  = 0.9843
       Total | 3.43949505     17 .202323238                                                                                                                            Root MSE                       = .05629

------------------------------------------------------------------------------
       lniva |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
 lncons_terr |   1.182991   .0361718    32.70   0.000      1.10631    1.259671
       _cons | -4.840681    .4512371   -10.73   0.000    -5.797261   -3.884101
------------------------------------------------------------------------------

. predict u3, residuals


       Se comprueba la estacionariedad de los residuos. Gráficamente parecen no
estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma)
                                                                                                                                1.00
               .1




                                                                                                                                           0.50
               .05




                                                                                                                      Autocorrelations of u3
 Residuals




                                                                                                                              0.00
      0




                                                                                                                  -0.50
               -.05




                                                                                                                                -1.00
               -.1




                                                                                                                                                  0                       2                      4        6         8
                                 1985                      1990                  1995        2000          2005                                                                                 Lag
                                                                                 year                                                             Bartlett's formula for MA(q) 95% confidence bands




                                               Cumulative Periodogram White Noise Test
               1.00       0.80
 Cumulative periodogram for u3
 0.20    0.40     0.60
               0.00




                                 0.00                 0.10               0.20         0.30      0.40       0.50
                                                                             Frequency
                                  Bartlett's (B) statistic =   1.28 Prob > B = 0.0770




                                                                                                                                                                                                                         24
Los test formales:

. dfgls u3

DF-GLS for u3                                                  Number of obs =       10
Maxlag = 7 chosen by Schwert criterion

               DF-GLS tau      1% Critical       5% Critical      10% Critical
  [lags]     Test Statistic        Value             Value             Value
------------------------------------------------------------------------------
    7            -0.567           -3.770            -6.020            -4.383
    6            -1.151           -3.770            -4.391            -3.191
    5            -2.816           -3.770            -3.438            -2.535
    4            -1.898           -3.770            -3.012            -2.292
    3            -2.388           -3.770            -2.965            -2.340
    2            -1.661           -3.770            -3.151            -2.558
    1            -1.783           -3.770            -3.421            -2.823

Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)]
Min SC   = -7.037693 at lag 6 with RMSE .0132368
Min MAIC = -5.982853 at lag 1 with RMSE .0243098

. dfuller u3, lags(0)

Dickey-Fuller test for unit root                      Number of obs      =           17

                               ---------- Interpolated Dickey-Fuller ---------
                  Test         1% Critical       5% Critical      10% Critical
               Statistic           Value             Value             Value
------------------------------------------------------------------------------
 Z(t)             -2.653            -3.750            -3.000            -2.630
------------------------------------------------------------------------------
MacKinnon approximate p-value for Z(t) = 0.0825



. wntestq u3

Portmanteau test for white noise
---------------------------------------
 Portmanteau (Q) statistic =     20.6237
 Prob > chi2(7)            =      0.0044



                                                                    test
variable             DF        retardos        test Barlet                           diagnóstico
                                                                Portmanteau
                 -2.653                           1.28             20.62
u3                                   0                                                    I(0)
                 (0.083)                        (0.077)           (0.004)

       Tras el análisis quedan algunas sombras acerca de la estacionariedad de los
residuos. Para los test DF y B de Barlet la estacionariedad es casi alcanzada (también
para el test pperron que se ha efectuado - Zρ=11,57 y Zτ=2.76; p-valor 0.06) sin
embargo para el test Pormanteau está clara la no estacionariedad.

MODELO DE CORRECCIÓN DE ERRORES

       También se pueden estimar las relaciones a corto plazo. Para ello usaremos la
regresión auxiliar correspondiente. El resultado es:

. regress dlniva dlncons_terr u3t1

      Source |       SS       df       MS                    Number of obs =         17
-------------+------------------------------                 F( 2,     14) =      19.13
       Model | .059820026      2 .029910013                  Prob > F      =     0.0001




                                                                                                 25
Residual | .021885854     14 .001563275            R-squared     =   0.7321
-------------+------------------------------           Adj R-squared =   0.6939
       Total |   .08170588    16 .005106618            Root MSE      =   .03954

------------------------------------------------------------------------------
      dlniva |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
dlncons_terr |   2.784293   .5051581     5.51   0.000     1.700837    3.867749
        u3t1 | -.6977856    .1804603    -3.87   0.002    -1.084835   -.3107367
       _cons | -.1133794    .0384137    -2.95   0.011    -.1957685   -.0309902
------------------------------------------------------------------------------


        Las dos variables son significativas y, en el caso de los residuos, también el
coeficiente estimado es negativo. Por su parte el ajuste general es bueno (R2=69.39%)
ambos resultados pueden interpretarse como que, efectivamente ambas variables están
cointegradas. Como puede observarse la elasticidad entre recaudación por IVA y
consumo territorializado difiere un tanto a largo (1.2) y a corto plazo (2.8).


Bibliografía

Dickey, DA. Fuller, WA. (1979): “Distribution of the Estimators for Autoregressive
Time Series with a Unit Root,” Journal of the American Statistical Association, 74, pp.
427–431.
Engle, R. Granger, W. (1987): “Cointegration and error correction representation,
estimation and testing”. Econometrica # 55. Págs 251-276.
Granger ,C. Newbold, P. (1974): “Spurious regressions in econometrics”. Journal of
econometrics # 2. Págs 111-120.
Granger, C. Newbold. P.(1977): "Identification of two-way causal models," Frontiers of
Quantitative Economics, Vol III. pp. 337-360
MacKinnon, JG. (1994): “Aproximate asympotic distribution functions for unit-root and
cointegration test”. journal of Bussines and Economics Statistics. vol 12. pp. 167-176.
Perron, P. (1990): "Testing for a Unit Root in a Time Series with a Changing Mean,"
Journal of Business & Economic Statistics, American Statistical Association, vol. 8(2),
pp. 153-162.
Said, E. Dickey, DA. (1984): "Testing for Unit Roots in Autoregressive Moving
Average Models of Unknown Order", Biometrika, 71, pp. 599–607.
Phillips PCB y Perron P (1988): “Testing for a unit root in times series regresion”.
Biometrika, 75, 335-346.




                                                                                    26

Más contenido relacionado

Más de Bruno Apellidos

Más de Bruno Apellidos (8)

Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
V y v p ropios definicion
V y v p ropios definicionV y v p ropios definicion
V y v p ropios definicion
 
Unam fac. ciencias
Unam fac. cienciasUnam fac. ciencias
Unam fac. ciencias
 
Tesis 2 de econometría
Tesis 2 de econometríaTesis 2 de econometría
Tesis 2 de econometría
 
Series de tiempo 1
Series de tiempo 1Series de tiempo 1
Series de tiempo 1
 
Modelos econometricos
Modelos econometricosModelos econometricos
Modelos econometricos
 
Ejercicios de econometría (1)
Ejercicios de econometría (1)Ejercicios de econometría (1)
Ejercicios de econometría (1)
 
Eigenvalores
EigenvaloresEigenvalores
Eigenvalores
 

Variables no estacionarias y cointegración: análisis de series temporales

  • 1. Variables no estacionarias y cointegración Roberto Montero Granados Universidad de Granada marzo, 2007 RESUMEN. La econometría de series temporales se encuentra con un problema al medir las relaciones entre aquellas variables que tienen una tendencia temporal. Este problema puede llegar a que se consideren significativas relaciones completamente espurias. Cuando, en lugar de series estacionarias, se utilizan datos de panel el problema también puede surgir. Las variables que tienen una tendencia temporal definida se denominan “no estacionarias”. Las estimaciones de regresiones con variables no estacionarias son espurias salvo que estas estén cointegradas. Dos variables no estacionarias cointegradas son aquellas cuyos residuos son estacionarios. Si los residuos son estacionarios las estimaciones de variables no estacionarias son superconsistentes. INTRODUCCIÓN A LAS SERIES NO ESTACIONARIAS Una serie es estacionaria cuando su valor medio es estable. Por el contrario es no estacionaria cuando sistemáticamente crece o disminuye en el tiempo. Intuitivamente podemos entender que las relaciones entre variables no estacionarias pueden estar sesgadas y, sin embargo, tener errores estándar muy bajos y ajuste (R2) muy altos. Por ejemplo el número de libros editados en España ha crecido en los últimos 20 años y la estatura media también. Una regresión de una sobre otra es posible que arroje resultados significativos y un buen ajuste, sin embargo la relación entre ambas no es directa, en este caso estaríamos ante lo que se denomina una regresión espuria (Granger Newbold, 1974). En otras ocasiones podemos no conocer si dos variables no estacionarias tienes relación la una sobre la otra (Por ejemplo salud y descentralización) o que, teniendo alguna relación, en que grado la relación entre ambas es correcta o espuria (por ejemplo crecimiento económico y crecimiento de la cantidad de dinero). Ejemplos de funciones que son no estacionarias son: yt = yt-1 + ut donde: ut ~ N (a,s2). Este es un ejemplo de paseo aleatorio. 1
  • 2. 16 14 12 10 8 6 4 2 0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 yt = ao + yt-1 + ut donde: ut ~ N (0,s2); ao es la que recoge la tasa de crecimiento medio. 10 9 8 7 6 5 4 3 2 1 0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 yt = ao yt-1 + ut donde: ut ~ N (0,s2); Si 1 > ao > 1 entonces la serie es estacionaria. En nuestro ejemplo ao > 1 25 20 15 10 5 0 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 -5 Por ejemplo el siguiente gráfico muestra la represtación gráfica de la relación entre dos paseos aleatorios 2
  • 3. 12 y = 1.2415x + 1.7051 2 R = 0.9252 10 8 6 4 2 0 0 1 2 3 4 5 6 7 8 Tanto la variable x como y se han generado aleatoriamente con una perturbación N(0.2, 0.08), pero aparentemente tienen un alto grado de correlación que, sin embargo, es completamente espuria. Algunas propuestas iniciales para solucionar este problema (Granger,Newbold 1977) fueron: ser más exigente con las t para la significación de las estimaciones o convertir las series en estacionarias mediante ajustes tendenciales, mediante ajustes con los residuos, vectores autoregresivos, etc. Sin embargo la primera solución es absurda (ya que las t crecen con las observaciones de la muestra) y la segunda es insatisfactoria porque puede ser arbitraria y hace perder información de las variables. Por ello los mayores esfuerzos posteriores se han dedicado a intentar determinar los límites dentro de los cuales una regresión es correcta o espuria. Se dice de una serie temporal xt que es estacionaria si E(xt) = cte ∀ t Var (xt)= cte ∀ t Cov (xt xt-k)=cte ∀ t ∀ k PROCEDIMIENTO DE ESTIMACIÓN ANTE SERIES TEMPORALES ESTACIONARIAS El algoritmo de estimación es: a) si las series son estacionarias Se estima por los procedimientos habituales (MCO o GLM) b) si las series son no estacionarias de orden distinto: No puede estimarse la relación c) si las series son no estacionarias del mismo orden no cointegradas La regresión con las variables en estado es espuria. Se puede intentar estacionalizar las series (mediante alguna operación, logaritmos o diferencias o ratios con otras variables) o hacer una regresión por primeras diferencias (el resultado nos indicará si la correlación existe o no. 3
  • 4. d) si la series son no estacionarias pero están cointegradas Se puede pasar la regresión habitual (MCO GLM) para estimar los efectos a largo plazo y el modelo de corrección de errores para estimar los efectos a corto plazo. El método de Engle y Granger tiene tres fases: a) estimación de la estacionariedad de las series; b) pruebas de cointegración y c) método de corrección de errores. I) Pruebas de estacionariedad a) visual (wntestb var y ac var) Observar, en gráficas si la variable crece/decrece monótonamente, si los shocks son persistentes o por el contrario no se puede establecer un patrón de comportamiento definitivo. Visualizar el correlograma, el periodograma, etc. Estas pruebas no formales no son definitivas. El correlograma es una representación de la función de autocorrelación cov( xt , xt + k ) ρk = ; ∀k = 1,...m var( xt ) var( xt + k ) Un correlograma que desciende lentamente, como los anteriores, es típico de variables no estacionarias. Un correlograma que desciende rápidamente o cuasialeatorio, como los anteriores, es típico de variables estacionarias. b) Dickey-Fuller (Dickey-Fuller, 1979, 1984; Said-Dickey 1984) Es un test exigente. Tiene la ventaja de que la hipótesis nula no es si la serie es ruido blanco, sino que busca si tiene una raíz unitaria, es decir si no existe relación entre el incremento de cada valor y el inmediato anterior la serie es estacionaria (I(0)), si existe dicha relación se dice que la serie tiene raíz unitaria (I(1)). Tipos de relación lineal pueden ser (con origen, sin origen, con tendencia, etc.) El test puede realizarse en tres versiones dxt = r xt-1 + ut dxt = ao + r xt-1 + ut dxt = ao + r xt-1 + a1 t + ut donde dxt = xt - xt-1, y, en los tres casos, pasamos el test Ho: r =0 contra H1: r ≠ 0. Si no puede rechazarse la nula (p-valor > 0.05) la serie es estacionaria y tiene raíz 0 (I(0)) si se rechaza la nula (p-valor<0.05) la serie es estacionaria y tiene una raíz unitaria (I(1)). Es interesante notar que el estadístico de contraste para la r no son la t usual sino que Dickey-Fuller (1979) y MacKinnon (1994) mediante simulaciones de Montecarlo, construyeron unas tablas especiales en las que la t es superior. 4
  • 5. En realidad dicha prueba sólo es correcta cuando la correlación de la variable a testar no contiene retardo en la correlación, como esa posibilidad limita mucho sus posibilidades de análisis los mismos autores propusieron una prueba aumentada que se conoce como Dickey-Fuller aumentada (dfuller var), que es igual que la anterior con la diferencia de que, en cada regresión, se incluyen retardos de la variable como independientes. Es decir: p dxt = r xt-1 + ∑ bx t =1 t −1 + ut p dxt = ao + r xt-1 + ∑ bx t =1 t −1 + ut p dxt = ao + r xt-1 + a1 t + ∑ bx t =1 t −1 + ut Un problema es ahora el de determinar el numero de retardos (p) apropiados. Según Verbeek, si es demasiado grande o demasiado pequeño puede provocar que series no estacionarias aparezcan como estacionarias. Para ello se proponen varios métodos: El criterio de información de Akaike (AIC) o el criterio de Schwarz Bayesian (SBC) (en ambos caso se escoge el retardo con mayor valor). Otra opción es incluir retardos, mediante prueba y error, hasta eliminar la correlación serial en las ut medida con un estadístico usual como el de Durbin-Watson. En Stata está implementado un sistema standar el de Dickey-Fuller GLS test (dfgls var). Este nos permite escoger entre los retados aquel más conveniente. Si nos decidimos por este método el procedimiento más correcto sería: b1) pasar dfgls a la variable para obtener el número de retardos (lags) apropiado b2) pasar dfuller a la variable con el número de retardos obtenido anteriormente. b) Otros test interesantes son B de Bartlett (wntestb var), Q de Pormateau (wntestq var; también conocido como test Ljung-Box)y Z de Phillips-Perron (pperron var) La especificación de los dos primeros es: n ˆ k B = max Fk − 1≤ k ≤ q 2 q donde Fk es función del periodograma acumulado de la serie definido en términos de la función de densidad espectral y: m  ˆ2  ρ Q LB = n( n + 2 )∑  k  ~ χ m n−k  2 k =1   En ambos casos las hipótesis del test son: Ho: (p-valor >0.05)la serie es White noise = estacionaria H1: (p-valor < 0.05)La serie es Random walk = no estacionaria. El tercero (Phillips y Perron, 1988) calcula dos parámetros Zp y Zτ, que son: 5
  • 6. 1 n 2σ 2 ˆ 2 Z ρ = n (ρ n − 1) − ˆ 2 sn ˆ 2 (λn − γˆ 0 ,n ) γ 0 ,n ρ n − 1 1 ˆ 2 1 nσ − (λn − γ 0 ,n ) ˆ ˆ ˆ Zτ = ˆ ˆ λn σ 2 ˆ 2 2 ˆ λn sn Sus valores críticos y la significación se basan en la misma t modificada del test Dickey-Fuller. Este test tiene dos ventajas sobre los anteriores: a) la Ho consiste en que las serie es integrada de orden 1. Es decir con un p valor < 0.05 se rechaza la nula, lo que indica que la serie no es I(1) b) se puede introducir rezagos (lags) en el test lo que lo hace insustituible en el caso que el dfgls nos haya recomendado la introducción de los mismos. Serie estacionaria, ruido blanco (withe noise) y raiz nula (I(0)) y por otra parte serie no estacionaria, camino aleatorio (ramdom walk) y raíz unitaria (I(1)) no son exactamente sinónimos entre sí, pero si aluden a distintas formas del comportamiento de las variables (ciclos, tendencias, etc.) que pueden hacer que las variable pueden ser útiles o completamente inútiles. Todos los test descritos son ineficientes en el caso de cambio estructural (Perron, 1989). Es decir una serie estacionaria con cambio estructural puede aparecer como no estacionaria y viceversa. II) Pruebas de Cointegración Supongamos que dos variables temporales xt e yt son estacionarias de orden 1 (es decir son I(1)) (si son estacionarias en otros ordenes (I(2), I(3)...) o en dos ordenes distintos el problema se complica). Se dice que dichas variables están cointegradas cuando puede practicarse una regresión lineal o no lineal del siguiente tenor: yt = a + bxt + ut que generalmente tendrá un buen ajuste. Pero donde debe suceder que los residuos, es decir ut = – a + yt + bxt sea I(0). Es decir, requisitos para definir la cointegración son: a) que dos variables sean estacionarias de orden 1 b) que exista una combinación lineal de ambas que sea estacionaria de orden 0 Cuando ambas condiciones se cumplen se dice que las variables están cointegradas. Cointegración significa que existe una relación, a largo plazo, entre las variables. En definitiva, si xt e yt están cointegradas significa que, aunque crezcan en el tiempo (t), lo hacen de una forma completamente acompasada, de forma que el error entre ambas no crece. Es decir, si en la regresión, y= a + bx + u ˆ u es estacionaria (I(0)) entonces b no sólo es consistente sino superconsistente (es ˆ decir la estimación converge a su valor real de forma inversamente proporcional al número de observaciones, en lugar de la raíz cuadrada del número de observaciones que 6
  • 7. es el caso de las variables estacionarias (Engle, Granger, 1987)). En definitiva probar la cointegración entre dos variables I(1) es igual que probar la estacionariedad de los recursos. Para testar la cointegración sólo hay que estimar los residuos del modelo de regresión y pasar la prueba de Dickey-Fuller aumentada (dfuller var) a los residuos estimados ( u ). Si se cumple la Ho entonces xt e yt están cointegradas y b es ˆ ˆ superconsistente. III) Modelo de corrección de errores. Como una extensión del modelo, si las variables están cointegradas se pueden utilizar los residuos para corregir los errores y estimar también los efectos a corto plazo de depvar sobre indepvar. El modelo a estimar se denomina de corrección de errores y su especificación es: yt – yt-1 = β (xt – xt-1) + γ (yt-1 – a – b xt-1) + εt Donde γ (yt-1 – a – b xt-1) = γ (ut-1) es el mecanismo de corrección en que ˆ ˆ forzosamente γ<0, b es la influencia, a largo plazo de x sobre y, y β es la estimación de la influencia, a corto plazo de x sobre y. El modelo también suele escribirse: ∆yt = β (∆xt) + γ (ut-1) + εt 7
  • 8. Ejemplo: Todas las variables se han transformado en sus correspondientes logaritmos naturales. lnirpf: Logaritmo de la recaudación por el Impuesto sobre la Renta de las Personas Físicas. lnsoc: Logaritmo de la recaudación por el Impuesto sobre Sociedades. lniva: Logaritmo de la recaudación por el Impuesto sobre el Valor Añadido. lnremun: Logaritmo de la remuneración de asalariados. lnrentas: Logaritmo de las rentas de la propiedad. lneeb: Logaritmo del excedente de explotación bruto / Renta mixta bruta. lntp: Logaritmo de la recaudación territorializada por el Impuesto sobre Transmisiones Patrimoniales. lncons_terr: Logaritmo del consumo final de las familias sobre el territorio económico. Datos España desde 1986 hasta 2003 (INEbase y BADESPE) Queremos estimar los siguientes modelos modelo 1: lnirpft = β1o + β11 lnremumt + β12lnrentast + β12lneebt + β12lntpt + u1t modelo 2: lnsoct = β2o + β11lneebt + u2t modelo 3: lnivat = β3o + β31cons_terrt + u3t MODELO 1 1 Pruebas de estacionariedad 1a) gráficos line lnirpf lnremum lnrentas lntp lneeb year 14 12 10 8 6 1985 1990 1995 2000 2005 year lnirpf lnremum lnrentas lntp lneeb Correlogramas ac var 8
  • 9. 1.00 1.00 0.50 0.50 Autocorrelations of lnremum Autocorrelations of lnirpf 0.00 0.00 -0.50 -0.50 -1.00 -1.00 0 2 4 6 8 0 2 4 6 8 Lag Lag Bartlett's formula for MA(q) 95% confidence bands Bartlett's formula for MA(q) 95% confidence bands 1.00 1.00 0.50 0.50 Autocorrelations of lnrentas Autocorrelations of lneeb 0.00 0.00 -0.50 -0.50 -1.00 -1.00 0 2 4 6 8 0 2 4 6 8 Lag Lag Bartlett's formula for MA(q) 95% confidence bands Bartlett's formula for MA(q) 95% confidence bands Parecen no estacionarias. B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags()) Para determinar el número de retardos se utiliza la prueba DF-GLS test. . dfgls lnirpf DF-GLS for lnirpf Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -2.260 -3.770 -6.020 -4.383 6 -2.275 -3.770 -4.391 -3.191 5 -3.280 -3.770 -3.438 -2.535 4 -5.171 -3.770 -3.012 -2.292 3 -3.118 -3.770 -2.965 -2.340 2 -1.384 -3.770 -3.151 -2.558 1 -1.317 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 4 with RMSE .0153774 Min SC = -7.363117 at lag 5 with RMSE .0126217 Min MAIC = -5.592253 at lag 1 with RMSE .037169 . dfgls lnremum DF-GLS for lnremum Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -1.085 -3.770 -6.020 -4.383 6 -1.292 -3.770 -4.391 -3.191 5 -1.408 -3.770 -3.438 -2.535 4 -1.476 -3.770 -3.012 -2.292 9
  • 10. 3 -1.594 -3.770 -2.965 -2.340 2 -1.572 -3.770 -3.151 -2.558 1 -1.780 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.456219 at lag 1 with RMSE .0314811 Min MAIC = -4.983993 at lag 2 with RMSE .0304348 . dfgls lnrentas DF-GLS for lnrentas Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -1.418 -3.770 -6.020 -4.383 6 -1.461 -3.770 -4.391 -3.191 5 -2.648 -3.770 -3.438 -2.535 4 -1.426 -3.770 -3.012 -2.292 3 -1.972 -3.770 -2.965 -2.340 2 -1.478 -3.770 -3.151 -2.558 1 -1.580 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -3.989102 at lag 5 with RMSE .0681989 Min MAIC = -3.239434 at lag 1 with RMSE .1155362 DF-GLS for lntp Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -0.654 -3.770 -6.020 -4.383 6 -1.876 -3.770 -4.391 -3.191 5 -2.399 -3.770 -3.438 -2.535 4 -1.430 -3.770 -3.012 -2.292 3 -1.689 -3.770 -2.965 -2.340 2 -1.312 -3.770 -3.151 -2.558 1 -1.586 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -4.935668 at lag 1 with RMSE .0673338 Min MAIC = -4.35767 at lag 1 with RMSE .0673338 DF-GLS for lneeb Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -1.343 -3.770 -6.020 -4.383 6 -1.758 -3.770 -4.391 -3.191 5 -2.247 -3.770 -3.438 -2.535 4 -2.411 -3.770 -3.012 -2.292 3 -2.331 -3.770 -2.965 -2.340 2 -2.092 -3.770 -3.151 -2.558 1 -2.087 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.220494 at lag 1 with RMSE .035419 Min MAIC = -5.04291 at lag 1 with RMSE .035419 En el caso de lnirpf recomienda 4 retados, en el resto cero retardos. La prueba DF aumentada queda . dfuller lnirpf, lags(4) Augmented Dickey-Fuller test for unit root Number of obs = 13 10
  • 11. ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) 0.933 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.9935 . dfuller lnremun, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -2.240 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.1921 . dfuller lnrentas, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -2.439 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.1311 . dfuller lntp, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -0.821 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.8128 . dfuller lneeb, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -1.925 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.3206 b) Otros test Se pasan los test B de Bartlett y Q de Portmanteau (wntestb y wntestq) wntestb var 11
  • 12. Cumulative Periodogram White Noise Test 1.00 Cumulative periodogram for lnirpf 0.20 0.40 0.60 0.00 0.80 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.36 Prob > B = 0.0506 Cumulative Periodogram White Noise Test Cumulative Periodogram White Noise Test 1.00 1.00 Cumulative periodogram for lnremun Cumulative periodogram for lnrentas 0.80 0.80 0.60 0.60 0.40 0.40 0.20 0.20 0.00 0.00 0.00 0.10 0.20 0.30 0.40 0.50 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Frequency Bartlett's (B) statistic = 1.66 Prob > B = 0.0079 Bartlett's (B) statistic = 2.10 Prob > B = 0.0003 Cumulative Periodogram White Noise Test Cumulative Periodogram White Noise Test 1.00 1.00 Cumulative periodogram for lneeb Cumulative periodogram for lntp 0.80 0.80 0.60 0.60 0.40 0.40 0.20 0.20 0.00 0.00 0.00 0.10 0.20 0.30 0.40 0.50 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Frequency Bartlett's (B) statistic = 1.59 Prob > B = 0.0131 Bartlett's (B) statistic = 1.52 Prob > B = 0.0191 . wntestq lnirpf Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 22.5712 Prob > chi2(7) = 0.0020 . wntestq lnremun Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 32.9494 Prob > chi2(7) = 0.0000 . wntestq lnrentas Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 24.9321 Prob > chi2(7) = 0.0008 . wntestq lntp 12
  • 13. Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 30.7291 Prob > chi2(7) = 0.0001 . wntestq lneeb Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 27.2311 Prob > chi2(7) = 0.0003 Cuadro resumen test variable DF retardos test Barlet diagnóstico Portmanteau 0.933 1.36 22.57 lnirpf 4 I(1) (0.994) (0.050) (0.002) -2.240 1.66 32.94 lnremun 0 I(1) (0.192) (0.008) (0.000) -2.439 2.10 24.93 lnrentas 0 I(1) (0.131) (0.000) (0.001) -0.821 1.59 30.72 lntp 0 I(1) (0.813) (0.013) (0.000) -1.925 1.52 27.23 lneeb 0 I(1) (0.321) (0.019) (0.000) Todos los test coinciden. Todas las variables son I(1). El caso de lnirpf está en el límite en el caso del test de Barlet, pero dada la rotundidad del resto de pruebas hemos e concluir que también es I(1). A efectos de la significación (entre paréntesis) es necesario tener en cuenta que la hipótesis nula de DF test es que la serie es integrada en orden uno mientras que la de los test es que es ruido blanco. PRUEBA DE COINTEGRACIÓN Estimación a largo plazo y estimación de los residuos u1 . regress lnirpf lnremun lnrentas lntp lneeb Source | SS df MS Number of obs = 18 -------------+------------------------------ F( 4, 13) = 428.63 Model | 3.3024046 4 .825601151 Prob > F = 0.0000 Residual | .02503956 13 .00192612 R-squared = 0.9925 -------------+------------------------------ Adj R-squared = 0.9902 Total | 3.32744416 17 .19573201 Root MSE = .04389 ------------------------------------------------------------------------------ lnirpf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnremun | .3425318 .1979751 1.73 0.107 -.0851675 .770231 lnrentas | .3603197 .056176 6.41 0.000 .2389588 .4816806 lntp | .1363144 .1040068 1.31 0.213 -.0883785 .3610074 lneeb | .5506441 .2543343 2.17 0.050 .0011882 1.1001 _cons | -4.784673 1.175606 -4.07 0.001 -7.324414 -2.244931 ------------------------------------------------------------------------------ . predict u1, residuals 13
  • 14. Se comprueba la estacionariedad de los residuos. Gráficamente parecen estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma) . line u1 year . ac u1 . wntestb u1 .1 0.50 .05 Autocorrelations of u1 Residuals 0.00 0 -.05 -0.50 -.1 0 2 4 6 8 1985 1990 1995 2000 2005 Lag year Bartlett's formula for MA(q) 95% confidence bands Cumulative Periodogram White Noise Test 1.00 0.80 Cumulative periodogram for u1 0.20 0.40 0.60 0.00 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 0.40 Prob > B = 0.9975 Parece evidente la ausencia de estacionariedad en los residuos. Los test formales: . dfgls u1 DF-GLS for u1 Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -0.094 -3.770 -6.020 -4.383 6 -0.784 -3.770 -4.391 -3.191 5 -1.310 -3.770 -3.438 -2.535 4 -2.388 -3.770 -3.012 -2.292 3 -1.896 -3.770 -2.965 -2.340 2 -1.781 -3.770 -3.151 -2.558 1 -2.265 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.436426 at lag 1 with RMSE .0317942 Min MAIC = -5.875307 at lag 7 with RMSE .0226678 . dfgls u1 DF-GLS for u1 Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value 14
  • 15. ------------------------------------------------------------------------------ 7 -0.094 -3.770 -6.020 -4.383 6 -0.784 -3.770 -4.391 -3.191 5 -1.310 -3.770 -3.438 -2.535 4 -2.388 -3.770 -3.012 -2.292 3 -1.896 -3.770 -2.965 -2.340 2 -1.781 -3.770 -3.151 -2.558 1 -2.265 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.436426 at lag 1 with RMSE .0317942 Min MAIC = -5.875307 at lag 7 with RMSE .0226678 . dfuller u1, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -4.097 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.0010 . wntestb u1 . wntestq u1 Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 7.3805 Prob > chi2(7) = 0.3904 Sugieren, en primer lugar que el número de retardos sea de cero. El cuadro resumen: test variable DF retardos test Barlet diagnóstico Portmanteau 4.097 0.4 7.38 u1 0 I(0) (0.001) (0.997) (0.390) En este primer modelo todos los test coinciden, los residuos son ruido blanco o I(0), por lo tanto las variables están cointegradas y las estimaciones resultantes son superconsistentes. MODELO DE CORRECCIÓN DE ERRORES También se pueden estimar las relaciones a corto plazo. Para ello usaremos la regresión auxiliar correspondiente. El resultado es: . regress dlnirpf dlnremum dlnrentas dlntp dlneeb u1t1 Source | SS df MS Number of obs = 17 -------------+------------------------------ F( 5, 11) = 14.02 Model | .099018866 5 .019803773 Prob > F = 0.0002 Residual | .015534073 11 .001412188 R-squared = 0.8644 -------------+------------------------------ Adj R-squared = 0.8028 Total | .114552939 16 .007159559 Root MSE = .03758 ------------------------------------------------------------------------------ dlnirpf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- dlnremum | .6396547 .3155149 2.03 0.068 -.0547889 1.334098 dlnrentas | .3724583 .1048175 3.55 0.005 .1417565 .60316 dlntp | .227702 .1017538 2.24 0.047 .0037434 .4516606 15
  • 16. dlneeb | .2339523 .3611132 0.65 0.530 -.5608525 1.028757 u1t1 | -1.000077 .2529111 -3.95 0.002 -1.556731 -.4434235 _cons | -.012096 .0464382 -0.26 0.799 -.1143057 .0901137 ------------------------------------------------------------------------------ En nuestro caso dicho mecanismo es significativo. La relación a corto plazo difiere un tanto de la relación a largo plazo y su grado de ajuste (que ahora es el correcto exento de la tendencia temporal) es del 80.28%. No debemos ser muy exigentes con la significación de las variables incluidas en el modelo debido a la falta de grados de libertad, pero parece que, a corto plazo el excedente de explotación es el componente que menos aporta a la recaudación por IRPF. MODELO 2 1 Pruebas de estacionariedad 1a) gráficos . line lnirpf lnremum lnrentas lntp lneeb year . ac var 1.00 12 0.50 11 Autocorrelations of lnsoc 10 0.00 9 -0.50 8 -1.00 1985 1990 1995 2000 2005 year 0 2 4 6 8 Lag lnsoc lneeb Bartlett's formula for MA(q) 95% confidence bands 1.00 0.50 Autocorrelations of lneeb -0.50 0.00 -1.00 0 2 4 6 8 Lag Bartlett's formula for MA(q) 95% confidence bands Visualmente parece que hay evidencia que son no estacionarias. B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags()) Para determinar el número de retardos se utiliza la prueba DF-GLS test. . dfgls lnsoc DF-GLS for lnsoc Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 16
  • 17. 7 -0.902 -3.770 -6.020 -4.383 6 -0.662 -3.770 -4.391 -3.191 5 -1.920 -3.770 -3.438 -2.535 4 -1.599 -3.770 -3.012 -2.292 3 -2.570 -3.770 -2.965 -2.340 2 -1.974 -3.770 -3.151 -2.558 1 -1.675 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -4.333827 at lag 7 with RMSE .0455954 Min MAIC = -3.698859 at lag 1 with RMSE .0920008 . dfgls lneeb DF-GLS for lneeb Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -1.343 -3.770 -6.020 -4.383 6 -1.758 -3.770 -4.391 -3.191 5 -2.247 -3.770 -3.438 -2.535 4 -2.411 -3.770 -3.012 -2.292 3 -2.331 -3.770 -2.965 -2.340 2 -2.092 -3.770 -3.151 -2.558 1 -2.087 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.220494 at lag 1 with RMSE .035419 Min MAIC = -5.04291 at lag 1 with RMSE .035419 . dfuller lnsoc, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -1.315 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.6222 . dfuller lneeb, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -1.925 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.3206 . wntestb lnsoc Cumulative Periodogram White Noise Test 1.00 Cumulative periodogram for lnsoc 0.20 0.40 0.60 0.00 0.80 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.44 Prob > B = 0.0314 . wntestb lneeb 17
  • 18. Cumulative Periodogram White Noise Test 1.00 Cumulative periodogram for lneeb 0.20 0.40 0.60 0.00 0.80 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.52 Prob > B = 0.0191 . wntestq lnsoc Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 22.1621 Prob > chi2(7) = 0.0024 . wntestq lneeb Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 27.2311 Prob > chi2(7) = 0.0003 Cuadro resumen test variable DF retardos test Barlet diagnóstico Portmanteau -1.315 1.44 22.16 lnsoc 0 I(1) (0.622) (0.031) (0.002) -1.925 1.52 27.23 lneeb 0 I(1) (0.321) (0.019) (0.000) Todos los test coinciden. Todas las variables son I(1). En el caso de lnsoc, el test de Barlet está en el límite, pero dada la rotundidad del resto de pruebas hemos e concluir que también es I(1). A efectos de la significación (entre paréntesis) es necesario tener en cuenta que la hipótesis nula de DF test es que la serie es integrada en orden uno mientras que la de los test es que es ruido blanco. PRUEBA DE COINTEGRACIÓN Estimación a largo plazo y estimación de los residuos u2 . regress lnsoc lneeb Source | SS df MS Number of obs = 18 -------------+------------------------------ F( 1, 16) = 104.60 Model | 4.69320111 1 4.69320111 Prob > F = 0.0000 Residual | .717908413 16 .044869276 R-squared = 0.8673 -------------+------------------------------ Adj R-squared = 0.8590 Total | 5.41110953 17 .31830056 Root MSE = .21182 ------------------------------------------------------------------------------ lnsoc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lneeb | 1.635002 .1598668 10.23 0.000 1.2961 1.973905 _cons | -9.635709 1.833375 -5.26 0.000 -13.52229 -5.749126 ------------------------------------------------------------------------------ 18
  • 19. . predict u2, residuals Se comprueba la estacionariedad de los residuos. Gráficamente parecen no estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma) .4 .2 Residuals 0 -.2 -.4 1985 1990 1995 2000 2005 year 1.00 Cumulative Periodogram White Noise Test 1.00 0.50 0.80 Cumulative periodogram for u2 Autocorrelations of u2 0.60 0.00 0.40 -0.50 0.20 -1.00 0.00 0 2 4 6 8 0.00 0.10 0.20 0.30 0.40 0.50 Lag Frequency Bartlett's formula for MA(q) 95% confidence bands Bartlett's (B) statistic = 1.96 Prob > B = 0.0009 Los test formales: . dfgls u2 DF-GLS for u2 Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -1.062 -3.770 -6.020 -4.383 6 -1.303 -3.770 -4.391 -3.191 5 -1.173 -3.770 -3.438 -2.535 4 -1.379 -3.770 -3.012 -2.292 3 -3.615 -3.770 -2.965 -2.340 2 -2.796 -3.770 -3.151 -2.558 1 -1.843 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 2 with RMSE .0862708 Min SC = -4.444164 at lag 3 with RMSE .0683852 Min MAIC = -3.294883 at lag 1 with RMSE .1068462 . dfuller u2, lags(2) Augmented Dickey-Fuller test for unit root Number of obs = 15 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -2.800 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.0583 19
  • 20. . wntestq u2 Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 35.5411 Prob > chi2(7) = 0.0000 Sugieren, en primer lugar que el número de retardos sea de 2. El cuadro resumen: test variable DF retardos test Barlet diagnóstico Portmanteau -2.800 1.96 35.54 u2 2 I(1) (0.058) (0.009) (0.000) Tras el análisis quedan muchas sombras acerca de la estacionariedad de los residuos. Mientras que para el test DF (el más consistente) la estacionariedad es casi alcanzada para los otros dos test está claro la no estacionariedad . Quizá deban incluirse más variables en el modelo o exista algún tipo de cambio estructural (provocado por el cambio en la legislación) que hace que los test fallen ante lo que parece una evidencia de que la recaudación por el impuesto sobre sociedades debe depender del excedente de explotación. MODELO DE CORRECCIÓN DE ERRORES También se pueden estimar las relaciones a corto plazo. Para ello usaremos la regresión auxiliar correspondiente. El resultado es: . regress dlnsoc dlneeb u2t1 Source | SS df MS Number of obs = 17 -------------+------------------------------ F( 2, 14) = 0.54 Model | .026027168 2 .013013584 Prob > F = 0.5921 Residual | .33479635 14 .023914025 R-squared = 0.0721 -------------+------------------------------ Adj R-squared = -0.0604 Total | .360823518 16 .02255147 Root MSE = .15464 ------------------------------------------------------------------------------ dlnsoc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- dlneeb | .9440714 1.085129 0.87 0.399 -1.383298 3.271441 u2t1 | -.2050166 .2157877 -0.95 0.358 -.6678352 .2578019 _cons | .050891 .0827027 0.62 0.548 -.1264886 .2282707 ------------------------------------------------------------------------------ Como cabía esperar, en este caso dicho mecanismo, aunque negativo, no es significativo. La relación a corto plazo tampoco es significativa y el ajuste general muy bajo. Sin embargo, si se estima la relación lineal, en cortes transversales, año a año, del modelo lnsocr = a + b · lneebr + ur donde lnsocr es la recaudación territorializada por el impuesto sobre sociedades de la CCAA r, lneebr es el excedente de explotación/renta bruta mixta, ur son los 20
  • 21. residuos normales y a y b parámetros a estimar. La R2 del modelo y la significación del ˆ parámetro b no dejan lugar a dudas de la relación entre ambas. Los resultados son: año Coef. P>t R2 1986 1.314 0.000 0.679 1987 1.328 0.000 0.717 1988 1.359 0.000 0.728 1989 1.325 0.000 0.643 1990 1.270 0.000 0.678 1991 1.259 0.000 0.724 1992 1.206 0.000 0.630 1993 1.285 0.000 0.685 1994 1.219 0.000 0.764 1995 1.210 0.000 0.756 1996 1.274 0.000 0.778 1997 1.336 0.000 0.743 1998 1.355 0.000 0.781 1999 1.272 0.000 0.790 2000 1.208 0.000 0.788 2001 1.218 0.000 0.706 2002 1.182 0.000 0.771 2003 1.234 0.000 0.806 La existencia de una relación no espuria entre ambas parece quedar fuera de toda duda por lo que una explicación plausible a los resultados de los test es la existencia de un cambio estructural en las series (previsiblemente de recaudación) que invalida los test. MODELO 3 1 Pruebas de estacionariedad . line lniva lncons_terr year . ac var 1.00 13 0.50 12 Autocorrelations of lniva 11 0.00 10 -0.50 9 -1.00 1985 1990 1995 2000 2005 year 0 2 4 6 8 Lag lniva lncons_terr Bartlett's formula for MA(q) 95% confidence bands 21
  • 22. 1.00 Autocorrelations of lncons_terr -0.50 0.00 -1.00 0.50 0 2 4 6 8 Lag Bartlett's formula for MA(q) 95% confidence bands Visualmente parece que hay evidencia que son no estacionarias. B) Pruebas Aumentadas de Dickey-Fuller (dfuller var_name, options lags()) Para determinar el número de retardos se utiliza la prueba DF-GLS test. . dfgls lniva DF-GLS for lniva Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -0.452 -3.770 -6.020 -4.383 6 -0.620 -3.770 -4.391 -3.191 5 -2.112 -3.770 -3.438 -2.535 4 -1.779 -3.770 -3.012 -2.292 3 -2.272 -3.770 -2.965 -2.340 2 -1.537 -3.770 -3.151 -2.558 1 -1.583 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -6.940659 at lag 1 with RMSE .024709 Min MAIC = -4.799559 at lag 1 with RMSE .024709 . dfgls lncons_terr DF-GLS for lncons_terr Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -0.357 -3.770 -6.020 -4.383 6 -0.183 -3.770 -4.391 -3.191 5 -0.154 -3.770 -3.438 -2.535 4 -0.542 -3.770 -3.012 -2.292 3 -0.401 -3.770 -2.965 -2.340 2 -0.282 -3.770 -3.151 -2.558 1 -0.254 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 1 with RMSE .0053626 Min SC = -9.996085 at lag 1 with RMSE .0053626 Min MAIC = -10.2093 at lag 1 with RMSE .0053626 Para lniva se recomiendan cero retardos, para lncons_terr se recomiendan 1 retardo . dfuller lniva, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- 22
  • 23. Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -1.645 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.4597 . dfuller lncons_terr, lags(1) Augmented Dickey-Fuller test for unit root Number of obs = 16 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -0.819 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.8134 . wntestb lniva Cumulative Periodogram White Noise Test 1.00 Cumulative periodogram for lniva 0.20 0.40 0.60 0.00 0.80 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.53 Prob > B = 0.0184 . wntestb lncons_terr Cumulative Periodogram White Noise Test 1.00 Cumulative periodogram for lncons_terr 0.20 0.40 0.60 0.00 0.80 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.64 Prob > B = 0.0090 . wntestq lniva Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 29.5251 Prob > chi2(7) = 0.0001 . wntestq lncons_terr Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 32.3507 Prob > chi2(7) = 0.0000 Cuadro resumen 23
  • 24. test variable DF retardos test Barlet diagnóstico Portmanteau -1.645 1.53 29.52 lniva 0 I(1) (0.460) (0.018) (0.000) -0.819 1.64 32.35 lncons_terr 1 I(1) (0.813) (0.009) (0.000) Todos los test coinciden. Ambas variables son no estacionarias I(1). PRUEBA DE COINTEGRACIÓN Estimación a largo plazo y estimación de los residuos u2 . regress lniva lncons_terr Source | SS df MS Number of obs = 18 -------------+------------------------------ F( 1, 16) = 1069.60 Model | 3.38880259 1 3.38880259 Prob > F = 0.0000 Residual | .050692461 16 .003168279 R-squared = 0.9853 -------------+------------------------------ Adj R-squared = 0.9843 Total | 3.43949505 17 .202323238 Root MSE = .05629 ------------------------------------------------------------------------------ lniva | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lncons_terr | 1.182991 .0361718 32.70 0.000 1.10631 1.259671 _cons | -4.840681 .4512371 -10.73 0.000 -5.797261 -3.884101 ------------------------------------------------------------------------------ . predict u3, residuals Se comprueba la estacionariedad de los residuos. Gráficamente parecen no estacionarios Por orden Gráfico de líneas, Correlograma y Periodograma) 1.00 .1 0.50 .05 Autocorrelations of u3 Residuals 0.00 0 -0.50 -.05 -1.00 -.1 0 2 4 6 8 1985 1990 1995 2000 2005 Lag year Bartlett's formula for MA(q) 95% confidence bands Cumulative Periodogram White Noise Test 1.00 0.80 Cumulative periodogram for u3 0.20 0.40 0.60 0.00 0.00 0.10 0.20 0.30 0.40 0.50 Frequency Bartlett's (B) statistic = 1.28 Prob > B = 0.0770 24
  • 25. Los test formales: . dfgls u3 DF-GLS for u3 Number of obs = 10 Maxlag = 7 chosen by Schwert criterion DF-GLS tau 1% Critical 5% Critical 10% Critical [lags] Test Statistic Value Value Value ------------------------------------------------------------------------------ 7 -0.567 -3.770 -6.020 -4.383 6 -1.151 -3.770 -4.391 -3.191 5 -2.816 -3.770 -3.438 -2.535 4 -1.898 -3.770 -3.012 -2.292 3 -2.388 -3.770 -2.965 -2.340 2 -1.661 -3.770 -3.151 -2.558 1 -1.783 -3.770 -3.421 -2.823 Opt Lag (Ng-Perron seq t) = 0 [use maxlag(0)] Min SC = -7.037693 at lag 6 with RMSE .0132368 Min MAIC = -5.982853 at lag 1 with RMSE .0243098 . dfuller u3, lags(0) Dickey-Fuller test for unit root Number of obs = 17 ---------- Interpolated Dickey-Fuller --------- Test 1% Critical 5% Critical 10% Critical Statistic Value Value Value ------------------------------------------------------------------------------ Z(t) -2.653 -3.750 -3.000 -2.630 ------------------------------------------------------------------------------ MacKinnon approximate p-value for Z(t) = 0.0825 . wntestq u3 Portmanteau test for white noise --------------------------------------- Portmanteau (Q) statistic = 20.6237 Prob > chi2(7) = 0.0044 test variable DF retardos test Barlet diagnóstico Portmanteau -2.653 1.28 20.62 u3 0 I(0) (0.083) (0.077) (0.004) Tras el análisis quedan algunas sombras acerca de la estacionariedad de los residuos. Para los test DF y B de Barlet la estacionariedad es casi alcanzada (también para el test pperron que se ha efectuado - Zρ=11,57 y Zτ=2.76; p-valor 0.06) sin embargo para el test Pormanteau está clara la no estacionariedad. MODELO DE CORRECCIÓN DE ERRORES También se pueden estimar las relaciones a corto plazo. Para ello usaremos la regresión auxiliar correspondiente. El resultado es: . regress dlniva dlncons_terr u3t1 Source | SS df MS Number of obs = 17 -------------+------------------------------ F( 2, 14) = 19.13 Model | .059820026 2 .029910013 Prob > F = 0.0001 25
  • 26. Residual | .021885854 14 .001563275 R-squared = 0.7321 -------------+------------------------------ Adj R-squared = 0.6939 Total | .08170588 16 .005106618 Root MSE = .03954 ------------------------------------------------------------------------------ dlniva | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- dlncons_terr | 2.784293 .5051581 5.51 0.000 1.700837 3.867749 u3t1 | -.6977856 .1804603 -3.87 0.002 -1.084835 -.3107367 _cons | -.1133794 .0384137 -2.95 0.011 -.1957685 -.0309902 ------------------------------------------------------------------------------ Las dos variables son significativas y, en el caso de los residuos, también el coeficiente estimado es negativo. Por su parte el ajuste general es bueno (R2=69.39%) ambos resultados pueden interpretarse como que, efectivamente ambas variables están cointegradas. Como puede observarse la elasticidad entre recaudación por IVA y consumo territorializado difiere un tanto a largo (1.2) y a corto plazo (2.8). Bibliografía Dickey, DA. Fuller, WA. (1979): “Distribution of the Estimators for Autoregressive Time Series with a Unit Root,” Journal of the American Statistical Association, 74, pp. 427–431. Engle, R. Granger, W. (1987): “Cointegration and error correction representation, estimation and testing”. Econometrica # 55. Págs 251-276. Granger ,C. Newbold, P. (1974): “Spurious regressions in econometrics”. Journal of econometrics # 2. Págs 111-120. Granger, C. Newbold. P.(1977): "Identification of two-way causal models," Frontiers of Quantitative Economics, Vol III. pp. 337-360 MacKinnon, JG. (1994): “Aproximate asympotic distribution functions for unit-root and cointegration test”. journal of Bussines and Economics Statistics. vol 12. pp. 167-176. Perron, P. (1990): "Testing for a Unit Root in a Time Series with a Changing Mean," Journal of Business & Economic Statistics, American Statistical Association, vol. 8(2), pp. 153-162. Said, E. Dickey, DA. (1984): "Testing for Unit Roots in Autoregressive Moving Average Models of Unknown Order", Biometrika, 71, pp. 599–607. Phillips PCB y Perron P (1988): “Testing for a unit root in times series regresion”. Biometrika, 75, 335-346. 26