1
Nancy Lacourly
MA5502 2010
2
Análisis descriptiva de una serie
 En el caso univariado permite detectar la importancia de
las diferentes componentes:
Tendencia
Ciclo
Estacionalidad
3
Detección de las tendencia y
estacionalidad
 Tablas
 Gráficos
 ANOVA
4
EJEMPLO: airpass
5
EJEMPLO: Airpass
ene feb mar abr may jun jul ago sep oct nov dic Media
Desv.
Estándar
1949 112 118 132 129 121 135 148 148 136 119 104 118 126.67 13.72
1950 115 126 141 135 125 149 170 170 158 133 114 140 139.67 19.07
1951 145 150 178 163 172 178 199 199 184 162 146 166 170.17 18.44
1952 171 180 193 181 183 218 230 242 209 191 172 194 197.00 22.97
1953 196 196 236 235 229 243 264 272 237 211 180 201 225.00 28.47
1954 204 188 235 227 234 264 302 293 259 229 203 229 238.92 34.92
1955 242 233 267 269 270 315 364 347 312 274 237 278 284.00 42.14
1956 284 277 317 313 318 374 413 405 355 306 271 306 328.25 47.86
1957 315 301 356 348 355 422 465 467 404 347 305 336 368.42 57.89
1958 340 318 362 348 363 435 491 505 404 359 310 337 381.00 64.53
1959 360 342 406 396 420 472 548 559 463 407 362 405 428.33 69.83
1960 417 391 419 461 472 535 622 606 508 461 390 432 476.17 77.74
6
Ejemplo: Airpass
1949 nov ene feb dic oct may abr mar jun sep jul ago
1950 nov ene may feb oct abr dic mar jun sep jul ago
1951 ene nov feb oct abr dic may mar jun sep jul ago
1952 ene nov feb abr may oct mar dic sep jun jul ago
1953 nov ene feb dic oct may abr mar sep jun jul ago
1954 feb nov ene abr oct dic may mar sep jun ago jul
1955 feb nov ene mar abr may oct dic sep jun ago jul
1956 nov feb ene oct dic abr mar may sep jun ago jul
1957 feb nov ene dic oct abr may mar sep jun jul ago
1958 nov feb dic ene abr oct mar may sep jun jul ago
1959 feb ene nov abr dic mar oct may sep jun jul ago
1960 nov feb ene mar dic abr oct may sep jun ago jul
7
Boxplot; Airpass
ene feb mar abr may jun jul ago sep oct nov dic
100
150
200
250
300
350
400
450
500
550
600
Values
1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960
100
150
200
250
300
350
400
450
500
550
600
Values
Column Number
Estacionalidad Tendencia
8
Ejemplo: estacionalidad
ANOVA a 2 factores
 Año: mide la tendencia
 Mes: mide la estacionalidad
9
Descomposición
de una serie
 Autocorrelaciones y autocorrelaciones parciales
10
Ejemplo simulado: N(0,1)
Serie N(0,1)
Time
ss
0 50 100 150 200
-2
-1
0
1
2
11
0 5 10 15 20
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
serie N(0,1)
Ejemplo simulado: N(0,1)
5 10 15 20
-0.10
-0.05
0.00
0.05
0.10
Lag
Partial
ACF
serie N(0,1)
12
Nivel anual Lago Huron
Serie lago Huron
Time
lago
1880 1900 1920 1940 1960
6
7
8
9
10
11
12
13
Ejemplo Lago Huron
0 10 20 30 40
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Serie lago Huron
0 10 20 30 40
-0.2
0.0
0.2
0.4
0.6
0.8
Lag
Partial
ACF
Serie lago Huron
14
Ejemplo Lago Huron
Serie lago Huron
Time
lago
1880 1900 1920 1940 1960
6
7
8
9
10
11
12
t
t
o
t e
t
e
t
a
a
x 




 0242
.
0
202
.
10
1
15
Ejemplo Lago Huron:
residuos ajuste recta
Residuos ajuste recta del lago Huron
Time
e
1880 1900 1920 1940 1960
43
44
45
46
47
48
16
Ejemplo Lago Huron:
residuos ajuste recta
0 10 20 30 40
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Residuos ajuste recta del lago Huron
0 10 20 30 40
-0.2
0.0
0.2
0.4
0.6
0.8
Lag
Partial
ACF
Residuos ajuste recta del lago Huron
17
Ejemplo Lago Huron:
Otro modelo: t
t
t
t
t r
x
r
bx
x 


 
 1
1 791
.
0
6 7 8 9 10 11 12
6
7
8
9
10
11
12
lago[2:98]
lago[1:97]
18
0 20 40 60 80 100
0
1
2
3
residuos
Index
z
0 10 20 30 40
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Series z
Ejemplo Lago Huron:
Otro modelo: t
t
t
t
t r
x
r
bx
x 


 
 1
1 791
.
0
19
Ejemplo simulado
cos(x)+2sen(x)
Time
a1
0 5 10 15 20 25 30
-2
-1
0
1
2
20
0 2 4 6 8
-0.5
0.0
0.5
1.0
Lag
ACF
autocorrelaciones cos(x)+2sen(x)
0 2 4 6 8
-0.5
0.0
0.5
1.0
Lag
Partial
ACF
autocorrelaciones parciales cos(x)+2sen(x)
21
cos(x)+2sen(x)+0.2x
Time
a1
0 5 10 15 20 25 30
-4
-2
0
2
4
22
0 2 4 6 8
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
cos(x)+2sen(x)+0.2x
0 2 4 6 8
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
Partial
ACF
cos(x)+2sen(x)+0.2x
23
cos(x)+2sen(x)+e
Time
a2
0 5 10 15 20 25 30
-6
-4
-2
0
2
4
6
cos(x)+2sen(x)+0.2x+e
24
0 2 4 6 8
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
cos(x)+2sen(x)+e
0 2 4 6 8
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
Partial
ACF
cos(x)+2sen(x)+e
cos(x)+2sen(x)+0.2x+e
25
Ventas mensuales de vino tinto en Australia
26
Ventas mensuales de vino tinto en Australia
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Series x
0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
Lag
Partial
ACF
Series x
27
Modelo de descomposición
Después de ver el gráfico de una serie:
 si no se observa cambios bruscos,
 si las autocorrelaciones decrecen linealmente, pasando por el cero, o
muestra un patrón cíclico pasando por cero varias veces, la serie no es
estacionaria.
Podemos aplicar una descomposición lineal:
t
t
t
t R
S
m
X 


28
Estimación de la tendencia
El método depende de si hay o no hay estacionalidad
Cuando no hay estacionalidad
0
)
(
supone
Se
ruido
el
es
y
tendencia
la
es
m
donde



t
t
t
t
t
t
R
E
R
R
m
X
29
Estimación y eliminación de la tendencia
en serie sin estacionalidad
Dos tipos de métodos:
1. Suavizamiento de la serie que permite estimar la
tendencia
2. Por diferenciación que permite eliminar la
tendencia
30
 Suavizamiento por filtro de medias o medianas móviles
 Suavizamiento exponencial
 Suavizamiento por LOESS o LOWESS
 Suavizamiento por SPLINE
 Suavizamiento mediante ajuste polinomial
 Eliminación de la tendencia DIFERENCIACIONES
Estimación y eliminación de la tendencia
en serie sin estacionalidad
31
Suavizamiento por medias o
medianas móviles
 El filtro de medias móviles:
 El filtro de medianas móviles:
en vez de tomar las medias de elementos vecinos, se toma
la mediana
1
suman
que
pesos
son
los
donde
1
j
q
j
q
j
j
t
j
t
w
q
n
t
q
X
w
m 



 




32
Suavizamiento exponencial
)
1
(
)
1
(
:
con
,...,
2
)
1
(
1
1
2
0
1
1
1
X
X
m
Note
X
m
n
t
m
X
m
t
j
t
j
t
j
t
t
t
t














 




33
Ajuste polinomial
p
p
o
t t
a
t
a
t
a
a
m 



 ...
2
2
1
Los coeficientes del polinomio se estiman minimizando:
2
1
)
( t
n
t
t m
X



34
LOESS y LOWESS
 Es un ajuste polinomial local como en las medias móviles
ponderadas.
 Ventajas: no requiere decidir que función tomar. Lo que hay que dar,
son el grado del polinomio (p=1 para LOWESS y p=2 para LOESS) y el
“ancho de ventana”, como en las medias móviles.
 Inconveniente: requiere series largas
 Se usa mínimos cuadrados al igual que una regressión lineal.
35
Por diferenciación
t
t
t
t
t
t
BX
X
X
B
X
X
X








1
1
sea
O
)
1
(
Se define los operadores de diferenciación:
2
1
2
2
2
2
sea
O
)
1
(
)
(

 









t
t
t
t
t
t
t
X
X
X
X
X
B
X
X
36
Simulación 2x+5
0 10 20 30 40 50 60 70 80 90 100
0
50
100
150
200
250
2x+5
0 10 20 30 40 50 60 70 80 90 100
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
diferencia de primer orden 2x+5
37
Diferencia 2x^2+5
0 10 20 30 40 50 60 70 80 90 100
0
0.5
1
1.5
2
2.5
x 10
4
0 10 20 30 40 50 60 70 80 90 100
0
20
40
60
80
100
120
140
160
180
200
Diferencia primer orden 2x2
+5
38
Diferencia 2x^2+5
0 10 20 30 40 50 60 70 80 90 100
0
0.5
1
1.5
2
2.5
x 10
4
0 10 20 30 40 50 60 70 80 90 100
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
2
diferencia segundo orden 2*x2
+5
39
Nivel anual del lago Huron
Serie lago Huron
Time
lago
1880 1900 1920 1940 1960
6
7
8
9
10
11
12
40
Medias móviles
1860 1880 1900 1920 1940 1960 1980
5
6
7
8
9
10
11
12
Pesos: 1 2 3 2 1
serie
q=2
1860 1880 1900 1920 1940 1960 1980
-1
-0.5
0
0.5
1
1.5
Residuos (q= 2)
1860 1880 1900 1920 1940 1960 1980
5
6
7
8
9
10
11
12
Pesos: 1 1 1 1 1 1 1
serie
q=3
1860 1880 1900 1920 1940 1960 1980
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
Residuos (q= 3)
41
LOESS y LOWESS
LOESS
Time
lago
1880 1900 1920 1940 1960
6
7
8
9
10
11
12
LOWESS
Time
lago
1880 1900 1920 1940 1960
6
7
8
9
10
11
12
42
Ejemplo
43
Medias móviles
44
Ajuste polinomial p=3
1950 1955 1960 1965 1970 1975 1980
3000
3500
4000
4500
5000
5500
6000
6500
Huelgas
data 1
cubic
5 10 15 20 25 30
-600
-400
-200
0
200
400
600
Residuos huelgas
Cubic: norm of residuals = 2164.0557 cubic
45
Suavizamiento exponencial
1950 1955 1960 1965 1970 1975 1980
-800
-600
-400
-200
0
200
400
Residuos (alfa= 0.6 )
serie
60
.
0


1950 1955 1960 1965 1970 1975 1980
3000
3500
4000
4500
5000
5500
6000
6500 serie
alfa 0.6
46
LOESS y LOWESS (v=5)
5 10 15 20 25 30
2000
2500
3000
3500
4000
4500
5000
5500
6000
6500
7000
LOESS
5 10 15 20 25 30
2000
2500
3000
3500
4000
4500
5000
5500
6000
6500
7000
LOWESS
47
Diferenciación
1950 1955 1960 1965 1970 1975 1980
-2000
-1500
-1000
-500
0
500
1000
Diferenciación orden 1
48
Diferenciación y residuos medias
móviles
49
VINOS AUTRALIANOS
50
Medias móviles
0 50 100 150
0
500
1000
1500
2000
2500
3000
Pesos: 1 2 3 2 1
serie
q=2
0 50 100 150
-800
-600
-400
-200
0
200
400
600
Residuos (q= 2)
51
Ajuste polinomial p = 1 y 3
0 50 100 150
0
500
1000
1500
2000
2500
3000
serie
linear
cubic
20 40 60 80 100 120 140
-1000
-800
-600
-400
-200
0
200
400
600
800
1000
residuos
linear
cubic
52
0 50 100 150
0
500
1000
1500
2000
2500
3000
serie
alfa 0.5
Suavizamiento exponencial
50
.
0


0 50 100 150
-800
-600
-400
-200
0
200
400
600
Residuos (alfa= 0.5 )
53
LOESS y LOWESS (v=8,12 y 24)
0 20 40 60 80 100 120 140
500
1000
1500
2000
2500
3000
LOWESS
wine
wine (smooth) (8)
wine (smooth) (12)
0 20 40 60 80 100 120 140
500
1000
1500
2000
2500
3000
LOESS
wine
wine (smooth)
wine (smooth) (2)
54
Diferenciación
0 50 100 150
-1500
-1000
-500
0
500
1000
1500
Una diferenciación
0 20 40 60 80 100 120 140
-2000
-1500
-1000
-500
0
500
1000
1500
2000
Dos diferenciaciones
55
Tests para ruido
 Las transformaciones anteriores buscan obtener una serie
estacionaria, eliminando tendencia y estacionalidad.
 Hay entonces que verificar que los residuos no tengan
dependencia entre si (i.i.d.).
 Dos tests: Test de Portmanteau (Box-Pierce) y test de
Ljung-Box
56
Tests para ruido
2
2
1
2
1
2
~
2
,
~
1
1
)
2
(
2
Box
-
Ljung
de
Test
serie
la
de
largo
el
es
das
selecciona
aciones
autocorrel
de
número
el
es
orden
de
ación
autocorrel
la
es
donde
1
Pierce)
-
(Box
u
Portmantea
de
Test
K
K
K
j
j
j
K
j
j
Q
Q
r
j
T
T
T
Q
T
k
j
r
r
T
Q










57
Descomposición
 Para cada componente se ve las autocorrelaciones
simples y parciales
58
Vinos autralianos
500
1500
2500
observed
1000
1400
1800
trend
-600
-200
0
200
seasonal
-400
0
200
600
1980 1982 1984 1986 1988 1990 1992
random
Time
Decomposition of additive time series
Time
x
1980 1982 1984 1986 1988 1990 1992
500
1000
1500
2000
2500
3000
59
Componente tendencia
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Series ma
0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
Partial
ACF
Series ma
60
Componente estacionalidad
0.0 0.5 1.0 1.5
-0.5
0.0
0.5
1.0
Lag
ACF
Series sa
0.5 1.0 1.5
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
Lag
Partial
ACF
Series sa
61
Componente residuos
0.0 0.5 1.0 1.5
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
Lag
ACF
Series ra
0.5 1.0 1.5
-0.2
-0.1
0.0
0.1
Lag
Partial
ACF
Series ra
62
Tests de aleatoriedad de los
residuos
Ambos tests Ljunj-Box y Box-Pierce dan p-valores
parecidos:
 Para K=1; p-valor= 0.87
 Para K=2; p-valor= 0.84
 Para K=3; p-valor= 0.30
63
Criterios
 Si ninguna de las autocorrelaciones es significativamente
diferente de cero, la serie es esencialmente ruido blanco.
 Si las autocorrelaciones decrecen linealmente, pasando
por el cero, o muestra un patrón cíclico, pasando por cero
varias veces, la serie no es estacionaria. Se tendrá que
diferenciarla una o más veces antes de modelarla.
64
Criterios
 Si las autocorrelaciones muestran estacionalidad, o se
tiene una alza cada periodo (cada 12 meses, por
ejemplo), la serie no es estacionaria y hay que
diferenciarla con un salto igual al periodo.
 Si las autocorrelaciones decrecen exponencialmente
hacia cero y las autocorrelaciones parciales son
significativamente no nulas sobre un pequeño número de
rezagos, se puede usar un modelo autoregresivo
AR(p).
65
Criterios
 Si las autocorrelaciones parciales decrecen
exponencialmente hacia cero y las autocorrelaciones son
significativamente no nulas sobre un pequeño número de
rezagos, se puede usar un modelo de medias móviles MA(q).
 Si las autocorrelaciones simples y parciales decrecen
lentamente hacia cero, pero sin alcanzar el cero, se puede
usar un modelo autoregresivo combinado con medias
móviles ARMA(p,q).

Series de tiempo

  • 1.
  • 2.
    2 Análisis descriptiva deuna serie  En el caso univariado permite detectar la importancia de las diferentes componentes: Tendencia Ciclo Estacionalidad
  • 3.
    3 Detección de lastendencia y estacionalidad  Tablas  Gráficos  ANOVA
  • 4.
  • 5.
    5 EJEMPLO: Airpass ene febmar abr may jun jul ago sep oct nov dic Media Desv. Estándar 1949 112 118 132 129 121 135 148 148 136 119 104 118 126.67 13.72 1950 115 126 141 135 125 149 170 170 158 133 114 140 139.67 19.07 1951 145 150 178 163 172 178 199 199 184 162 146 166 170.17 18.44 1952 171 180 193 181 183 218 230 242 209 191 172 194 197.00 22.97 1953 196 196 236 235 229 243 264 272 237 211 180 201 225.00 28.47 1954 204 188 235 227 234 264 302 293 259 229 203 229 238.92 34.92 1955 242 233 267 269 270 315 364 347 312 274 237 278 284.00 42.14 1956 284 277 317 313 318 374 413 405 355 306 271 306 328.25 47.86 1957 315 301 356 348 355 422 465 467 404 347 305 336 368.42 57.89 1958 340 318 362 348 363 435 491 505 404 359 310 337 381.00 64.53 1959 360 342 406 396 420 472 548 559 463 407 362 405 428.33 69.83 1960 417 391 419 461 472 535 622 606 508 461 390 432 476.17 77.74
  • 6.
    6 Ejemplo: Airpass 1949 novene feb dic oct may abr mar jun sep jul ago 1950 nov ene may feb oct abr dic mar jun sep jul ago 1951 ene nov feb oct abr dic may mar jun sep jul ago 1952 ene nov feb abr may oct mar dic sep jun jul ago 1953 nov ene feb dic oct may abr mar sep jun jul ago 1954 feb nov ene abr oct dic may mar sep jun ago jul 1955 feb nov ene mar abr may oct dic sep jun ago jul 1956 nov feb ene oct dic abr mar may sep jun ago jul 1957 feb nov ene dic oct abr may mar sep jun jul ago 1958 nov feb dic ene abr oct mar may sep jun jul ago 1959 feb ene nov abr dic mar oct may sep jun jul ago 1960 nov feb ene mar dic abr oct may sep jun ago jul
  • 7.
    7 Boxplot; Airpass ene febmar abr may jun jul ago sep oct nov dic 100 150 200 250 300 350 400 450 500 550 600 Values 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 100 150 200 250 300 350 400 450 500 550 600 Values Column Number Estacionalidad Tendencia
  • 8.
    8 Ejemplo: estacionalidad ANOVA a2 factores  Año: mide la tendencia  Mes: mide la estacionalidad
  • 9.
    9 Descomposición de una serie Autocorrelaciones y autocorrelaciones parciales
  • 10.
    10 Ejemplo simulado: N(0,1) SerieN(0,1) Time ss 0 50 100 150 200 -2 -1 0 1 2
  • 11.
    11 0 5 1015 20 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF serie N(0,1) Ejemplo simulado: N(0,1) 5 10 15 20 -0.10 -0.05 0.00 0.05 0.10 Lag Partial ACF serie N(0,1)
  • 12.
    12 Nivel anual LagoHuron Serie lago Huron Time lago 1880 1900 1920 1940 1960 6 7 8 9 10 11 12
  • 13.
    13 Ejemplo Lago Huron 010 20 30 40 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Serie lago Huron 0 10 20 30 40 -0.2 0.0 0.2 0.4 0.6 0.8 Lag Partial ACF Serie lago Huron
  • 14.
    14 Ejemplo Lago Huron Serielago Huron Time lago 1880 1900 1920 1940 1960 6 7 8 9 10 11 12 t t o t e t e t a a x       0242 . 0 202 . 10 1
  • 15.
    15 Ejemplo Lago Huron: residuosajuste recta Residuos ajuste recta del lago Huron Time e 1880 1900 1920 1940 1960 43 44 45 46 47 48
  • 16.
    16 Ejemplo Lago Huron: residuosajuste recta 0 10 20 30 40 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Residuos ajuste recta del lago Huron 0 10 20 30 40 -0.2 0.0 0.2 0.4 0.6 0.8 Lag Partial ACF Residuos ajuste recta del lago Huron
  • 17.
    17 Ejemplo Lago Huron: Otromodelo: t t t t t r x r bx x       1 1 791 . 0 6 7 8 9 10 11 12 6 7 8 9 10 11 12 lago[2:98] lago[1:97]
  • 18.
    18 0 20 4060 80 100 0 1 2 3 residuos Index z 0 10 20 30 40 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Series z Ejemplo Lago Huron: Otro modelo: t t t t t r x r bx x       1 1 791 . 0
  • 19.
  • 20.
    20 0 2 46 8 -0.5 0.0 0.5 1.0 Lag ACF autocorrelaciones cos(x)+2sen(x) 0 2 4 6 8 -0.5 0.0 0.5 1.0 Lag Partial ACF autocorrelaciones parciales cos(x)+2sen(x)
  • 21.
  • 22.
    22 0 2 46 8 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF cos(x)+2sen(x)+0.2x 0 2 4 6 8 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag Partial ACF cos(x)+2sen(x)+0.2x
  • 23.
    23 cos(x)+2sen(x)+e Time a2 0 5 1015 20 25 30 -6 -4 -2 0 2 4 6 cos(x)+2sen(x)+0.2x+e
  • 24.
    24 0 2 46 8 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF cos(x)+2sen(x)+e 0 2 4 6 8 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag Partial ACF cos(x)+2sen(x)+e cos(x)+2sen(x)+0.2x+e
  • 25.
    25 Ventas mensuales devino tinto en Australia
  • 26.
    26 Ventas mensuales devino tinto en Australia 0.0 0.5 1.0 1.5 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Series x 0.5 1.0 1.5 -0.2 0.0 0.2 0.4 0.6 Lag Partial ACF Series x
  • 27.
    27 Modelo de descomposición Despuésde ver el gráfico de una serie:  si no se observa cambios bruscos,  si las autocorrelaciones decrecen linealmente, pasando por el cero, o muestra un patrón cíclico pasando por cero varias veces, la serie no es estacionaria. Podemos aplicar una descomposición lineal: t t t t R S m X   
  • 28.
    28 Estimación de latendencia El método depende de si hay o no hay estacionalidad Cuando no hay estacionalidad 0 ) ( supone Se ruido el es y tendencia la es m donde    t t t t t t R E R R m X
  • 29.
    29 Estimación y eliminaciónde la tendencia en serie sin estacionalidad Dos tipos de métodos: 1. Suavizamiento de la serie que permite estimar la tendencia 2. Por diferenciación que permite eliminar la tendencia
  • 30.
    30  Suavizamiento porfiltro de medias o medianas móviles  Suavizamiento exponencial  Suavizamiento por LOESS o LOWESS  Suavizamiento por SPLINE  Suavizamiento mediante ajuste polinomial  Eliminación de la tendencia DIFERENCIACIONES Estimación y eliminación de la tendencia en serie sin estacionalidad
  • 31.
    31 Suavizamiento por mediaso medianas móviles  El filtro de medias móviles:  El filtro de medianas móviles: en vez de tomar las medias de elementos vecinos, se toma la mediana 1 suman que pesos son los donde 1 j q j q j j t j t w q n t q X w m          
  • 32.
  • 33.
    33 Ajuste polinomial p p o t t a t a t a a m     ... 2 2 1 Los coeficientes del polinomio se estiman minimizando: 2 1 ) ( t n t t m X   
  • 34.
    34 LOESS y LOWESS Es un ajuste polinomial local como en las medias móviles ponderadas.  Ventajas: no requiere decidir que función tomar. Lo que hay que dar, son el grado del polinomio (p=1 para LOWESS y p=2 para LOESS) y el “ancho de ventana”, como en las medias móviles.  Inconveniente: requiere series largas  Se usa mínimos cuadrados al igual que una regressión lineal.
  • 35.
    35 Por diferenciación t t t t t t BX X X B X X X         1 1 sea O ) 1 ( Se definelos operadores de diferenciación: 2 1 2 2 2 2 sea O ) 1 ( ) (             t t t t t t t X X X X X B X X
  • 36.
    36 Simulación 2x+5 0 1020 30 40 50 60 70 80 90 100 0 50 100 150 200 250 2x+5 0 10 20 30 40 50 60 70 80 90 100 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 diferencia de primer orden 2x+5
  • 37.
    37 Diferencia 2x^2+5 0 1020 30 40 50 60 70 80 90 100 0 0.5 1 1.5 2 2.5 x 10 4 0 10 20 30 40 50 60 70 80 90 100 0 20 40 60 80 100 120 140 160 180 200 Diferencia primer orden 2x2 +5
  • 38.
    38 Diferencia 2x^2+5 0 1020 30 40 50 60 70 80 90 100 0 0.5 1 1.5 2 2.5 x 10 4 0 10 20 30 40 50 60 70 80 90 100 0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2 diferencia segundo orden 2*x2 +5
  • 39.
    39 Nivel anual dellago Huron Serie lago Huron Time lago 1880 1900 1920 1940 1960 6 7 8 9 10 11 12
  • 40.
    40 Medias móviles 1860 18801900 1920 1940 1960 1980 5 6 7 8 9 10 11 12 Pesos: 1 2 3 2 1 serie q=2 1860 1880 1900 1920 1940 1960 1980 -1 -0.5 0 0.5 1 1.5 Residuos (q= 2) 1860 1880 1900 1920 1940 1960 1980 5 6 7 8 9 10 11 12 Pesos: 1 1 1 1 1 1 1 serie q=3 1860 1880 1900 1920 1940 1960 1980 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 Residuos (q= 3)
  • 41.
    41 LOESS y LOWESS LOESS Time lago 18801900 1920 1940 1960 6 7 8 9 10 11 12 LOWESS Time lago 1880 1900 1920 1940 1960 6 7 8 9 10 11 12
  • 42.
  • 43.
  • 44.
    44 Ajuste polinomial p=3 19501955 1960 1965 1970 1975 1980 3000 3500 4000 4500 5000 5500 6000 6500 Huelgas data 1 cubic 5 10 15 20 25 30 -600 -400 -200 0 200 400 600 Residuos huelgas Cubic: norm of residuals = 2164.0557 cubic
  • 45.
    45 Suavizamiento exponencial 1950 19551960 1965 1970 1975 1980 -800 -600 -400 -200 0 200 400 Residuos (alfa= 0.6 ) serie 60 . 0   1950 1955 1960 1965 1970 1975 1980 3000 3500 4000 4500 5000 5500 6000 6500 serie alfa 0.6
  • 46.
    46 LOESS y LOWESS(v=5) 5 10 15 20 25 30 2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 LOESS 5 10 15 20 25 30 2000 2500 3000 3500 4000 4500 5000 5500 6000 6500 7000 LOWESS
  • 47.
    47 Diferenciación 1950 1955 19601965 1970 1975 1980 -2000 -1500 -1000 -500 0 500 1000 Diferenciación orden 1
  • 48.
  • 49.
  • 50.
    50 Medias móviles 0 50100 150 0 500 1000 1500 2000 2500 3000 Pesos: 1 2 3 2 1 serie q=2 0 50 100 150 -800 -600 -400 -200 0 200 400 600 Residuos (q= 2)
  • 51.
    51 Ajuste polinomial p= 1 y 3 0 50 100 150 0 500 1000 1500 2000 2500 3000 serie linear cubic 20 40 60 80 100 120 140 -1000 -800 -600 -400 -200 0 200 400 600 800 1000 residuos linear cubic
  • 52.
    52 0 50 100150 0 500 1000 1500 2000 2500 3000 serie alfa 0.5 Suavizamiento exponencial 50 . 0   0 50 100 150 -800 -600 -400 -200 0 200 400 600 Residuos (alfa= 0.5 )
  • 53.
    53 LOESS y LOWESS(v=8,12 y 24) 0 20 40 60 80 100 120 140 500 1000 1500 2000 2500 3000 LOWESS wine wine (smooth) (8) wine (smooth) (12) 0 20 40 60 80 100 120 140 500 1000 1500 2000 2500 3000 LOESS wine wine (smooth) wine (smooth) (2)
  • 54.
    54 Diferenciación 0 50 100150 -1500 -1000 -500 0 500 1000 1500 Una diferenciación 0 20 40 60 80 100 120 140 -2000 -1500 -1000 -500 0 500 1000 1500 2000 Dos diferenciaciones
  • 55.
    55 Tests para ruido Las transformaciones anteriores buscan obtener una serie estacionaria, eliminando tendencia y estacionalidad.  Hay entonces que verificar que los residuos no tengan dependencia entre si (i.i.d.).  Dos tests: Test de Portmanteau (Box-Pierce) y test de Ljung-Box
  • 56.
  • 57.
    57 Descomposición  Para cadacomponente se ve las autocorrelaciones simples y parciales
  • 58.
    58 Vinos autralianos 500 1500 2500 observed 1000 1400 1800 trend -600 -200 0 200 seasonal -400 0 200 600 1980 19821984 1986 1988 1990 1992 random Time Decomposition of additive time series Time x 1980 1982 1984 1986 1988 1990 1992 500 1000 1500 2000 2500 3000
  • 59.
    59 Componente tendencia 0.0 0.51.0 1.5 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Series ma 0.5 1.0 1.5 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag Partial ACF Series ma
  • 60.
    60 Componente estacionalidad 0.0 0.51.0 1.5 -0.5 0.0 0.5 1.0 Lag ACF Series sa 0.5 1.0 1.5 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 Lag Partial ACF Series sa
  • 61.
    61 Componente residuos 0.0 0.51.0 1.5 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 Lag ACF Series ra 0.5 1.0 1.5 -0.2 -0.1 0.0 0.1 Lag Partial ACF Series ra
  • 62.
    62 Tests de aleatoriedadde los residuos Ambos tests Ljunj-Box y Box-Pierce dan p-valores parecidos:  Para K=1; p-valor= 0.87  Para K=2; p-valor= 0.84  Para K=3; p-valor= 0.30
  • 63.
    63 Criterios  Si ningunade las autocorrelaciones es significativamente diferente de cero, la serie es esencialmente ruido blanco.  Si las autocorrelaciones decrecen linealmente, pasando por el cero, o muestra un patrón cíclico, pasando por cero varias veces, la serie no es estacionaria. Se tendrá que diferenciarla una o más veces antes de modelarla.
  • 64.
    64 Criterios  Si lasautocorrelaciones muestran estacionalidad, o se tiene una alza cada periodo (cada 12 meses, por ejemplo), la serie no es estacionaria y hay que diferenciarla con un salto igual al periodo.  Si las autocorrelaciones decrecen exponencialmente hacia cero y las autocorrelaciones parciales son significativamente no nulas sobre un pequeño número de rezagos, se puede usar un modelo autoregresivo AR(p).
  • 65.
    65 Criterios  Si lasautocorrelaciones parciales decrecen exponencialmente hacia cero y las autocorrelaciones son significativamente no nulas sobre un pequeño número de rezagos, se puede usar un modelo de medias móviles MA(q).  Si las autocorrelaciones simples y parciales decrecen lentamente hacia cero, pero sin alcanzar el cero, se puede usar un modelo autoregresivo combinado con medias móviles ARMA(p,q).