Series de tiempo integradas

Análisis de Series de Tiempo Univariadas y Metodolog´ıa
Box - Jenkins para predicción
Series de Tiempo No Estacionarias
Juan Carlos Campuzano S.
Escuela Superior Politécnica del Litoral
Semestre I 2013
J. Campuzano (E.S.P.O.L) Series No Estacionarias Semestre I 2013 1 / 35

Contenido
Series de Tiempo NO Estacionarias
Procesos integrados ARIMA (p, d, q)
Test de Ra´ıces Unitarias
Dickey - Fuller (DF)
Dickey - Fuller Aumentado (ADF)
Phillip - Perron (PP)
Zivot - Andrews (ZA)
Kwiatkowski - Phillips - Schmidt - Shin (KPSS)
Ejemplos

Series de Tiempo no Estacionarias
1 La mayor´ıa de los procesos encontrados en econom´ıa son no
estacionarios
2 por ejemplo:
xt = xt−1 + εt no es estacionario
zt = xt − xt−1 = xt es estacionario porqu´e?
3 La serie anterior se dice que es integrada de orden 1 o I(1). Esto es,
necesita ser diferenciada una vez para ser estacionaria.
4 En ocasiones una serie debe ser diferenciada d veces antes de que
pueda ser estacionaria. Dicha serie se dice que es integrada de orden
d, denotada I(d).
5 Si diferenciando una serie d veces, esta se vuelve un proceso
ARMA(p, q) estacionario se dice que la serie es un proceso
autoregresivo integrado con media m´ovil, denotado ARIMA(p, d, q).

Ejemplo: Serie no estacionaria (IPC)

Correlogramas del IPC
Correlaci´on Simple Correlaci´on Parcial

Sin embargo, la primera diferencia (D1) del logaritmo del
IPC es una serie estacionaria, esto es:
D1.logipc = logipc(t) − logipc(t − 1)

Ejemplo: Serie estacionaria (D.logIPC = inﬂaci´on)

Correlogramas de la inflación
Correlación Simple Correlación Parcial

Procesos ARIMA (p, d, q)
Un proceso estocástico ARIMA (p, d, q) se puede expresar como:
Φ(L)(1 − L)d Xt = Θ(L)εt
donde Φ(L) es un polinomio de orden p, Θ(L) un polinomio de orden q y
Φ y Θ obedecen las condiciones de estacionariedad e invertibilidad
respectivamente. En esta expresión el lado derecho tiene una raiz unitaria
en el operador Φ(L)(1 − L)d .
Test estacionariedad
Testear estacionariedad es lo mismo que buscar, pero no encontrar, ra´ıces
unitarias en la representación de las series.

Tests de raices unitarias
Existen varios tests para probar si un proceso tiene raices unitarias, entre
los principales se tienen:
1 Dickey - Fuller (DF)
2 Dickey - Fuller Aumentado (ADF)
3 Phillip - Perron (PP)
4 Zivot - Andrews (ZA)
5 Kwiatkowski - Phillips - Schmidt - Shin (KPSS)

Test Dickey Fuller
Si el proceso xt tiene una ra´ız unitaria se estima la siguiente regresión:
xt = ρxt−1 + εt
Si existe una raiz unitaria se esperar´ıa un valor de ρ cercano a uno (1).
Alternativamente, si se estima la siguiente regresión:
xt = λxt−1 + εt
se podr´ıa esperar un valor de λ cercano a cero (0). Un estad´ıstico t
convencional no sirve para estos casos. Fuller (1976) formuló una variante
de este test para probar lo siguiente:

se prueba H0 : λ = 0 (ra´ız unitaria)
contra H1 : λ < 0 (estacionariedad)
y se rechaza hipótesis de raiz unitaria para valores suficientemente
pequenos del estad´ıstico t.
Test de Regresión
1 xt = λxt−1 + εt
2 xt = α1 + λxt−1 + εt
3 xt = α1 + λxt−1 + εt
4 xt = α0t + α1 + λxt−1 + εt
Modelo Verdadero
xt = εt
xt = εt
xt = α1 + εt
xt = α1 + εt
El estad´ıstico para λ = 0 en 1, 2 y 4 lleva al test estad´ıstico que Fuller
denomina τ, τµ y ττ respectivamente. Estos se refieren como sin
constante, sin tendencia y con tendencia estad´ıstica.

Los valores cr´ıticos de Dickey Fuller no son afectados por la presencia de
heterocedasticidad en el término del error. Sin embargo, deben ser
modificados para permitir la autocorrelación serial. La presencia de
autocorrelación podr´ıa implicar que se está utilizando las hipótesis nula y
alternativas ”equivocadas”. Suponga que se asume que las primeras
diferencias siguen un proceso AR(p). En estos casos, el test Dickey-Fuller
Aumentado (ADF) es apropiado. En el test ADF las regresiones llevan el
término Xt:
Test de Regresión
1 xt = λxt−1 +
p
j=1 φj Xt−j + εt
2 xt = α1 + λxt−1 +
p
3 xt = α1 + λxt−1 +
p
4 xt = α0t+α1+λxt−1+
p
j=1 φj Xt−j +εt
Modelo Verdadero
λ = 0
α1 = λ = 0
λ = 0
α1 = λ = 0
Nota: El test ADF asume que el orden p del proceso AR es conocido.

Test Philips - Perron
Philips (1987) y Philips y Perron (1988) propusieron un método
alternativo para tratar con variables autocorrelacionadas. Su método es
algo más general. Calcularon las mismas regresiones como en el caso de
Dickey Fuller pero ajustaron es test estad´ıstico utilizando métodos no
paramétricos para tomar en consideración procesos con autocorrelación y
heterocedasticidad general.

La regresión para el test PP es:
yt = β Dt + πyt−1 + ut
donde ut es I(0) y puede ser heterocedástico. Los test estad´ısticos
modificados, denotados como Zt y Zπ están dados por:
Zt =
σ2
λ2
1/2
· tπ=0 −
1
2
λ2 − σ2
λ2
T · SE(π)
σ2
Zπ = Tπ −
1
2
T2 · SE(π)
σ2
λ2
− σ2

Los términos σ2 y λ2 son estimadores consistentes de los parámetros de
varianza
σ2
= lim
T→∞
T−1
T
t=1
E u2
t
λ2
= lim
T→∞
T
t=1
E T−1
S2
T
donde ST = T
t=1 ut. La varianza muestral de los residuales OLS de ut es
un estimador consistente de σ2, y la varianza Newey - West estimada de
ut usando ut es un estimador consistente de λ2.
Bajo la hipótesis nula de que π = 0, los estad´ısticos Zt y Zπ de PP tienen
la misma distribución asintótica que el estad´ıstico t del test ADF.

Tablas DF - PP

Aplicación.- Test DF y PP a la serie IPC
Que sucede si realizamos el test DF a la serie IPC? raiz unitaria
Y si realizamos el test DF a la inflación? proceso estacionario

Y que suceder´ıa ahora si realizamos el test PP a la serie IPC? raiz unitaria
Y si realizamos el test PP a la inﬂaci´on? proceso estacionario

Test de Estacionariedad - test KPSS
Los tests de ra´ıces unitarias ADF y PP prueban la hip´otesis de que la serie
de tiempo yt es I(1). Por otra parte, los test de estacionariedad tratan de
probar que yt es I(0). Uno de estos tests es el KPSS, debido a
Kwiatkowski, Phillips, Schmith y Shin (1992).
El test se deriva del siguiente modelo:
yt = β Dt + µt + ut
µt = µt−1 + εt
donde Dt contiene componentes determin´ısticos (constante, tendencia,
ambas), εt es ruido blanco con varianza σ2
ε y ut es I(0) y puede ser
heteroced´astico.

La hipótesis nula se plantea de la siguiente manera:
H0 : σ2
ε = 0
H1 : σ2
ε > 0
lo que significa que µt es una constante.
El test estad´ıstico KPSS es el multiplicador de Lagrange (LM) para probar
H0 está dado por:
KPSS = T−2
T
t=1
S2
t /λ2
donde S2
t = t
j=1 uj , uj es el residuo de la regresión de yt sobre Dt y λ2
es un estimador consistente de la varianza de largo plazo de ut.
Bajo la nula de que yt es I(0), los autores muestran que KPSS converge a
una función estándar Browniana que depende de la forma de los términos
determ´ısticos Dt, pero no de los valores de los coeficientes β.

Ventajas de los test de estacionariedad
Los contrastes de estacionariedad proporcionan mejores resultados que el
test ADF en series que presentan caracter´ısticas de medias móvil con
coeficientes positivos y elevados, resultando más robustos que los
contrastes de ra´ız unitaria en distribuciones cuyas perturbaciones no son
normales. (Lee y Schmidt (1996)).

La Metodolog´ıa Box-Jenkins
Indentificación: Qué clases de modelos posiblemente producen yt?
Estimación: Cuáles son los parámetros del modelo?
Diagnóstico: Son los residuos, εt, del modelo estimado ruido blanco?

Selección
La selección se debe basar en criterios como el AIC (Akaike Information
Criterion), FPE (Forecast Prediction Error), HQ (Hannan Quinn
Criterion), SC (Schwarz Criterion) o similares. La forma de estos
estad´ısticos está dada por:
AIC = ln σ2
+
2
T
HQ = ln σ2
+
n ln(ln T)
T
SC = ln σ2
+
ln T
T
La elección del modelo es aquel que minimiza el criterio relevante.

Note que cada criterio consiste en dos partes. La varianza del modelo
podr´ıa decrecer mientras el número de parámetros se incrementa (modelos
anidados) mientras que el segundo término podr´ıa incrementar. Entonces,
cada criterio provee una forma de medir un tradeoff entre el mejoramiento
de la varianza y la penalidad debida a un sobre ajuste.

Estimaci´on
La clase de modelos que se han considerado se pueden expresar como:
Φ(L) d
xt = α + Θ(L)εt
donde:
Φ(L) = 1 − φ1L − ... − φpLp
Θ(L) = 1 + θ1L + ... + θqLq
= 1 − L

Si ε1, ..., εt son normal e independientes, se puede escribir la función de
densidad conjunta como:
f (ε1, ..., εn | α, φ1, ..., φp, θ1, ..., θq, σ2
) = (2πσ2
)−T
2 exp −
1
2σ2
T
i=1
ε2
i
De esta forma de densidad conjunta se puede derivar la función de
verosimilitud. Si la optimización numérica no converge lo más probable es
que el modelo que está siendo estimado no sea el modelo correcto.

Diagnóstico
Si el modelo está correctamente especificado los residuos estimados
deber´ıan tener un comporatamiento como ruido blanco (no estar
correlacionados). Si et t=1, ..., T son los residuos estimados, entonces
estimamos las autocorrelaciones muestrales
rτ (et) =
T
t=τ+1 etet−τ
T
t=τ+1 e2
t
Las autocorrelaciones deben estar cercanas a cero.

Adicionalmente al test individual de correlaci´on se puede utilizar un test
conjunto (port-manteau) conocido como el estad´ıstico Q.
Q = n(n + 2)
M
τ=1
(n − τ)−1
r2
τ
M es arbitrario y generalmente se lo escoge entre 10 a 20. Algunos
programas producen un estad´ıstico Q basado en M =
√
T. El estad´ıstico
Q se distribuye como una χ2 con M - p - q grados de libertad.

Predicción
Sea Xt el siguiente proceso ARMA estacionario:
Xt = p
j=1 φj Xt−j + q
j=0 θj εt−j
En t sea fnh la predicción de Xn+h la cual tiene el menor error cuadrado
esperado entre el conjunto de todas las posibles predicciones que son
lineales en Xn−j .
Una relacción de recurrencia para las predicciones fnh se obtiene al
reemplazar cada elemento en la ecuación de arriba por su predicción en el
tiempo n de acuerdo a lo siguiente:
1 Reemplace el valor desconocido Xn+k por su predicción fnh, con k > 0
2 ”predicciones” de Xn+k (k ≤ 0) son simplemente los valores
conocidos
3 Dado que los εt son ruido blanco, la predicción óptima de εn+k es
simplemente cero
4 ”predicciones” de εn+k (k ≤ 0) son simplemente los valores conocidos
de los residuales

El principal propósito de estimar modelos ARIMA es proyectar las series
fuera del periodo muestral. En las proyecciones hay dos fuentes inevitables
de error:
Futuras innovaciones
Diferencia entre valores de los parámetros verdaderos y estimados
Analicemos solamente la primera fuente de error:
Sea:
yT+s: valor desconocido de y en el periodo T + s
ˆyT+s: la predicción de yT+s hecha sobre la base de la información
disponible en T.
eT+s = yT+s − ˆyT+s: El error de predicción.
El error cuadrático medio (MSE) viene dado por:
MSE: E[e2
T+s] = E(yT+s − ˆyT+s)2
Se quiere encontrar una regla de predicción que minimice el MSE

El m´ınimo se alcanza cuando:
∂E(yT+s − ˆyT+s)2
∂ˆyT+s
= 0
Lo anterior se logra cuando:
ˆyT+s = E(yT+s|yT )

Ejemplo AR(1)
Sea el siguiente proceso AR(1) con constante:
yt = (1 − α)µ + αyt−1 + εt
Se supone que se tienen observaciones de y desde t=1 hasta t=T y se
predecir´ıa condicional a la información que se tiene hasta T. As´ı:
yT+1 = (1 − α)µ + αyT + εT+1
ˆyT+1 = E[yT+1|yT ] = (1 − α)µ + αyT
y el error de predicción está dado por:
eT+1 = yT+1 − ˆyT+1 = εT+1
mientras que el MSE (igual a la varianza) está dado por:
V (eT+1) = V (εT+1) = σ2

T+2
yT+2 = (1 − α)µ + αyT+1 + εT+2
yT+2 = (1 − α)µ + α[(1 − α)µ + αyT + εT+1] + εT+2
yT+2 = (1 − α2
)µ + α2
yT + αεT+1 + εT+2
E[yT+2|yT = ˆyT+2 = (1 − α2
)µ + α2
yT
V (eT+2) = σ2
(1 + α2
)

T+s
yT+s = (1 − αs
)µ + αs
yT + εT+s + αεT+s−1 + .. + αs−1
εT+1
ˆyT+s − µ = αs
(yT+s − µ)
V (eT+s) = (1 + α2
+ α4
+ ... + α2(s−1)
)σ2
V (eT+s) =
σ2
1 − α2
= σ2
y
La predicci´on tiende exponencialmente a la media incondicional, µ , y el
MSE de predicci´on, a la varianza incondicional del proceso,σ2
y .

Series de tiempo integradas

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (20)

Similar a Series de tiempo integradas

Similar a Series de tiempo integradas (6)

Más de Juan Carlos Campuzano

Más de Juan Carlos Campuzano (6)

Último

Último (20)

Series de tiempo integradas