Clasificaciones, modalidades y tendencias de investigación educativa.
Series de tiempo integradas
1. An´alisis de Series de Tiempo Univariadas y Metodolog´ıa
Box - Jenkins para predicci´on
Series de Tiempo No Estacionarias
Juan Carlos Campuzano S.
Escuela Superior Polit´ecnica del Litoral
Semestre I 2013
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 1 / 35
2. Contenido
Series de Tiempo NO Estacionarias
Procesos integrados ARIMA (p, d, q)
Test de Ra´ıces Unitarias
Dickey - Fuller (DF)
Dickey - Fuller Aumentado (ADF)
Phillip - Perron (PP)
Zivot - Andrews (ZA)
Kwiatkowski - Phillips - Schmidt - Shin (KPSS)
Ejemplos
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 2 / 35
3. Series de Tiempo no Estacionarias
1 La mayor´ıa de los procesos encontrados en econom´ıa son no
estacionarios
2 por ejemplo:
xt = xt−1 + εt no es estacionario
zt = xt − xt−1 = xt es estacionario porqu´e?
3 La serie anterior se dice que es integrada de orden 1 o I(1). Esto es,
necesita ser diferenciada una vez para ser estacionaria.
4 En ocasiones una serie debe ser diferenciada d veces antes de que
pueda ser estacionaria. Dicha serie se dice que es integrada de orden
d, denotada I(d).
5 Si diferenciando una serie d veces, esta se vuelve un proceso
ARMA(p, q) estacionario se dice que la serie es un proceso
autoregresivo integrado con media m´ovil, denotado ARIMA(p, d, q).
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 3 / 35
4. Ejemplo: Serie no estacionaria (IPC)
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 4 / 35
6. Sin embargo, la primera diferencia (D1) del logaritmo del
IPC es una serie estacionaria, esto es:
D1.logipc = logipc(t) − logipc(t − 1)
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 6 / 35
7. Ejemplo: Serie estacionaria (D.logIPC = inflaci´on)
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 7 / 35
8. Correlogramas de la inflaci´on
Correlaci´on Simple Correlaci´on Parcial
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 8 / 35
9. Procesos ARIMA (p, d, q)
Un proceso estoc´astico ARIMA (p, d, q) se puede expresar como:
Φ(L)(1 − L)d Xt = Θ(L)εt
donde Φ(L) es un polinomio de orden p, Θ(L) un polinomio de orden q y
Φ y Θ obedecen las condiciones de estacionariedad e invertibilidad
respectivamente. En esta expresi´on el lado derecho tiene una raiz unitaria
en el operador Φ(L)(1 − L)d .
Test estacionariedad
Testear estacionariedad es lo mismo que buscar, pero no encontrar, ra´ıces
unitarias en la representaci´on de las series.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 9 / 35
10. Tests de raices unitarias
Existen varios tests para probar si un proceso tiene raices unitarias, entre
los principales se tienen:
1 Dickey - Fuller (DF)
2 Dickey - Fuller Aumentado (ADF)
3 Phillip - Perron (PP)
4 Zivot - Andrews (ZA)
5 Kwiatkowski - Phillips - Schmidt - Shin (KPSS)
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 10 / 35
11. Test Dickey Fuller
Si el proceso xt tiene una ra´ız unitaria se estima la siguiente regresi´on:
xt = ρxt−1 + εt
Si existe una raiz unitaria se esperar´ıa un valor de ρ cercano a uno (1).
Alternativamente, si se estima la siguiente regresi´on:
xt = λxt−1 + εt
se podr´ıa esperar un valor de λ cercano a cero (0). Un estad´ıstico t
convencional no sirve para estos casos. Fuller (1976) formul´o una variante
de este test para probar lo siguiente:
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 11 / 35
12. se prueba H0 : λ = 0 (ra´ız unitaria)
contra H1 : λ < 0 (estacionariedad)
y se rechaza hip´otesis de raiz unitaria para valores suficientemente
pequenos del estad´ıstico t.
Test de Regresi´on
1 xt = λxt−1 + εt
2 xt = α1 + λxt−1 + εt
3 xt = α1 + λxt−1 + εt
4 xt = α0t + α1 + λxt−1 + εt
Modelo Verdadero
xt = εt
xt = εt
xt = α1 + εt
xt = α1 + εt
El estad´ıstico para λ = 0 en 1, 2 y 4 lleva al test estad´ıstico que Fuller
denomina τ, τµ y ττ respectivamente. Estos se refieren como sin
constante, sin tendencia y con tendencia estad´ıstica.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 12 / 35
13. Los valores cr´ıticos de Dickey Fuller no son afectados por la presencia de
heterocedasticidad en el t´ermino del error. Sin embargo, deben ser
modificados para permitir la autocorrelaci´on serial. La presencia de
autocorrelaci´on podr´ıa implicar que se est´a utilizando las hip´otesis nula y
alternativas ”equivocadas”. Suponga que se asume que las primeras
diferencias siguen un proceso AR(p). En estos casos, el test Dickey-Fuller
Aumentado (ADF) es apropiado. En el test ADF las regresiones llevan el
t´ermino Xt:
Test de Regresi´on
1 xt = λxt−1 +
p
j=1 φj Xt−j + εt
2 xt = α1 + λxt−1 +
p
j=1 φj Xt−j + εt
3 xt = α1 + λxt−1 +
p
j=1 φj Xt−j + εt
4 xt = α0t+α1+λxt−1+
p
j=1 φj Xt−j +εt
Modelo Verdadero
λ = 0
α1 = λ = 0
λ = 0
α1 = λ = 0
Nota: El test ADF asume que el orden p del proceso AR es conocido.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 13 / 35
14. Test Philips - Perron
Philips (1987) y Philips y Perron (1988) propusieron un m´etodo
alternativo para tratar con variables autocorrelacionadas. Su m´etodo es
algo m´as general. Calcularon las mismas regresiones como en el caso de
Dickey Fuller pero ajustaron es test estad´ıstico utilizando m´etodos no
param´etricos para tomar en consideraci´on procesos con autocorrelaci´on y
heterocedasticidad general.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 14 / 35
15. La regresi´on para el test PP es:
yt = β Dt + πyt−1 + ut
donde ut es I(0) y puede ser heteroced´astico. Los test estad´ısticos
modificados, denotados como Zt y Zπ est´an dados por:
Zt =
σ2
λ2
1/2
· tπ=0 −
1
2
λ2 − σ2
λ2
T · SE(π)
σ2
Zπ = Tπ −
1
2
T2 · SE(π)
σ2
λ2
− σ2
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 15 / 35
16. Los t´erminos σ2 y λ2 son estimadores consistentes de los par´ametros de
varianza
σ2
= lim
T→∞
T−1
T
t=1
E u2
t
λ2
= lim
T→∞
T
t=1
E T−1
S2
T
donde ST = T
t=1 ut. La varianza muestral de los residuales OLS de ut es
un estimador consistente de σ2, y la varianza Newey - West estimada de
ut usando ut es un estimador consistente de λ2.
Bajo la hip´otesis nula de que π = 0, los estad´ısticos Zt y Zπ de PP tienen
la misma distribuci´on asint´otica que el estad´ıstico t del test ADF.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 16 / 35
17. Tablas DF - PP
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 17 / 35
18. Aplicaci´on.- Test DF y PP a la serie IPC
Que sucede si realizamos el test DF a la serie IPC? raiz unitaria
Y si realizamos el test DF a la inflaci´on? proceso estacionario
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 18 / 35
19. Y que suceder´ıa ahora si realizamos el test PP a la serie IPC? raiz unitaria
Y si realizamos el test PP a la inflaci´on? proceso estacionario
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 19 / 35
20. Test de Estacionariedad - test KPSS
Los tests de ra´ıces unitarias ADF y PP prueban la hip´otesis de que la serie
de tiempo yt es I(1). Por otra parte, los test de estacionariedad tratan de
probar que yt es I(0). Uno de estos tests es el KPSS, debido a
Kwiatkowski, Phillips, Schmith y Shin (1992).
El test se deriva del siguiente modelo:
yt = β Dt + µt + ut
µt = µt−1 + εt
donde Dt contiene componentes determin´ısticos (constante, tendencia,
ambas), εt es ruido blanco con varianza σ2
ε y ut es I(0) y puede ser
heteroced´astico.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 20 / 35
21. La hip´otesis nula se plantea de la siguiente manera:
H0 : σ2
ε = 0
H1 : σ2
ε > 0
lo que significa que µt es una constante.
El test estad´ıstico KPSS es el multiplicador de Lagrange (LM) para probar
H0 est´a dado por:
KPSS = T−2
T
t=1
S2
t /λ2
donde S2
t = t
j=1 uj , uj es el residuo de la regresi´on de yt sobre Dt y λ2
es un estimador consistente de la varianza de largo plazo de ut.
Bajo la nula de que yt es I(0), los autores muestran que KPSS converge a
una funci´on est´andar Browniana que depende de la forma de los t´erminos
determ´ısticos Dt, pero no de los valores de los coeficientes β.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 21 / 35
22. Ventajas de los test de estacionariedad
Los contrastes de estacionariedad proporcionan mejores resultados que el
test ADF en series que presentan caracter´ısticas de medias m´ovil con
coeficientes positivos y elevados, resultando m´as robustos que los
contrastes de ra´ız unitaria en distribuciones cuyas perturbaciones no son
normales. (Lee y Schmidt (1996)).
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 22 / 35
23. La Metodolog´ıa Box-Jenkins
Indentificaci´on: Qu´e clases de modelos posiblemente producen yt?
Estimaci´on: Cu´ales son los par´ametros del modelo?
Diagn´ostico: Son los residuos, εt, del modelo estimado ruido blanco?
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 23 / 35
24. Selecci´on
La selecci´on se debe basar en criterios como el AIC (Akaike Information
Criterion), FPE (Forecast Prediction Error), HQ (Hannan Quinn
Criterion), SC (Schwarz Criterion) o similares. La forma de estos
estad´ısticos est´a dada por:
AIC = ln σ2
+
2
T
HQ = ln σ2
+
n ln(ln T)
T
SC = ln σ2
+
ln T
T
La elecci´on del modelo es aquel que minimiza el criterio relevante.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 24 / 35
25. Note que cada criterio consiste en dos partes. La varianza del modelo
podr´ıa decrecer mientras el n´umero de par´ametros se incrementa (modelos
anidados) mientras que el segundo t´ermino podr´ıa incrementar. Entonces,
cada criterio provee una forma de medir un tradeoff entre el mejoramiento
de la varianza y la penalidad debida a un sobre ajuste.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 25 / 35
26. Estimaci´on
La clase de modelos que se han considerado se pueden expresar como:
Φ(L) d
xt = α + Θ(L)εt
donde:
Φ(L) = 1 − φ1L − ... − φpLp
Θ(L) = 1 + θ1L + ... + θqLq
= 1 − L
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 26 / 35
27. Si ε1, ..., εt son normal e independientes, se puede escribir la funci´on de
densidad conjunta como:
f (ε1, ..., εn | α, φ1, ..., φp, θ1, ..., θq, σ2
) = (2πσ2
)−T
2 exp −
1
2σ2
T
i=1
ε2
i
De esta forma de densidad conjunta se puede derivar la funci´on de
verosimilitud. Si la optimizaci´on num´erica no converge lo m´as probable es
que el modelo que est´a siendo estimado no sea el modelo correcto.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 27 / 35
28. Diagn´ostico
Si el modelo est´a correctamente especificado los residuos estimados
deber´ıan tener un comporatamiento como ruido blanco (no estar
correlacionados). Si et t=1, ..., T son los residuos estimados, entonces
estimamos las autocorrelaciones muestrales
rτ (et) =
T
t=τ+1 etet−τ
T
t=τ+1 e2
t
Las autocorrelaciones deben estar cercanas a cero.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 28 / 35
29. Adicionalmente al test individual de correlaci´on se puede utilizar un test
conjunto (port-manteau) conocido como el estad´ıstico Q.
Q = n(n + 2)
M
τ=1
(n − τ)−1
r2
τ
M es arbitrario y generalmente se lo escoge entre 10 a 20. Algunos
programas producen un estad´ıstico Q basado en M =
√
T. El estad´ıstico
Q se distribuye como una χ2 con M - p - q grados de libertad.
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 29 / 35
30. Predicci´on
Sea Xt el siguiente proceso ARMA estacionario:
Xt = p
j=1 φj Xt−j + q
j=0 θj εt−j
En t sea fnh la predicci´on de Xn+h la cual tiene el menor error cuadrado
esperado entre el conjunto de todas las posibles predicciones que son
lineales en Xn−j .
Una relacci´on de recurrencia para las predicciones fnh se obtiene al
reemplazar cada elemento en la ecuaci´on de arriba por su predicci´on en el
tiempo n de acuerdo a lo siguiente:
1 Reemplace el valor desconocido Xn+k por su predicci´on fnh, con k > 0
2 ”predicciones” de Xn+k (k ≤ 0) son simplemente los valores
conocidos
3 Dado que los εt son ruido blanco, la predicci´on ´optima de εn+k es
simplemente cero
4 ”predicciones” de εn+k (k ≤ 0) son simplemente los valores conocidos
de los residuales
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 30 / 35
31. El principal prop´osito de estimar modelos ARIMA es proyectar las series
fuera del periodo muestral. En las proyecciones hay dos fuentes inevitables
de error:
Futuras innovaciones
Diferencia entre valores de los par´ametros verdaderos y estimados
Analicemos solamente la primera fuente de error:
Sea:
yT+s: valor desconocido de y en el periodo T + s
ˆyT+s: la predicci´on de yT+s hecha sobre la base de la informaci´on
disponible en T.
eT+s = yT+s − ˆyT+s: El error de predicci´on.
El error cuadr´atico medio (MSE) viene dado por:
MSE: E[e2
T+s] = E(yT+s − ˆyT+s)2
Se quiere encontrar una regla de predicci´on que minimice el MSE
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 31 / 35
32. El m´ınimo se alcanza cuando:
∂E(yT+s − ˆyT+s)2
∂ˆyT+s
= 0
Lo anterior se logra cuando:
ˆyT+s = E(yT+s|yT )
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 32 / 35
33. Ejemplo AR(1)
Sea el siguiente proceso AR(1) con constante:
yt = (1 − α)µ + αyt−1 + εt
Se supone que se tienen observaciones de y desde t=1 hasta t=T y se
predecir´ıa condicional a la informaci´on que se tiene hasta T. As´ı:
yT+1 = (1 − α)µ + αyT + εT+1
ˆyT+1 = E[yT+1|yT ] = (1 − α)µ + αyT
y el error de predicci´on est´a dado por:
eT+1 = yT+1 − ˆyT+1 = εT+1
mientras que el MSE (igual a la varianza) est´a dado por:
V (eT+1) = V (εT+1) = σ2
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 33 / 35
35. T+s
yT+s = (1 − αs
)µ + αs
yT + εT+s + αεT+s−1 + .. + αs−1
εT+1
ˆyT+s − µ = αs
(yT+s − µ)
V (eT+s) = (1 + α2
+ α4
+ ... + α2(s−1)
)σ2
V (eT+s) =
σ2
1 − α2
= σ2
y
La predicci´on tiende exponencialmente a la media incondicional, µ , y el
MSE de predicci´on, a la varianza incondicional del proceso,σ2
y .
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 35 / 35