Cuáles son las características biológicas que están marcadas en tu individual...
Informe de series_de_tiempo
1. Instituto de Estad´ıstica - Marzo, 2019
Seminario
SERIES DE TIEMPO DE LARGA MEMORIA
Autores:
Karen C´aceres, Fernando Cuevas
Juan Jos´e Prieto
Profesores Gu´ıas:
Natalia Bahamondes
Jonathan Acosta
3. 1 Introducci´on
Existen ciertas series que no se pueden modelar con un modelo de series AR, MA o ARMA, por lo
que se necesitan otros modelos para trabajar con dichas series. En este informe se presentar´an tres
fen´omenos, los cuales no son posibles trabajar con los modelos ya mencionados.
2
4. 2 Fen´omenos de ´Interes
Las series de tiempo de larga memoria tienen aplicaciones en ´areas como econom´ıa, finanzas, as-
tronom´ıa, agricultura, qu´ımica, meteorolog´ıa, medio ambiente, biolog´ıa, telecomunicaciones y geolog´ıa.
En este informe se consideran tres fen´omenos de inter´es: anillos de ´arboles, caudales de r´ıos y con-
taminaci´on ambiental
2.1 Anillos de ´Arboles
La dendrocronolog´ıa es la rama de la biolog´ıa especializada en el estudio de la ecolog´ıa de los ´arboles
a trav´es del an´alisis de los anillos de crecimiento.
Los ´arboles de comportan como verdaderos ”archivos ambientales”, en su interior almacenan infor-
maci´on sobre c´omo ha evolucionado el planeta durante cientos y tambi´en miles de a˜nos. Los anillos de
los ´arboles indican el ciclo de crecimiento del ´arbol, cada anillo marca un periodo de aproximadamente
un a˜no. Muchos factores ambientales que afectan su crecimiento se manifiestan en esos anillos, por
ejemplo, los cambios en las precipitaciones, las sequ´ıas prolongadas, los incendios forestales, la acci´on
de los volcanes y tambi´en las variaciones en los niveles de contaminaci´on.
Figure 1: Anillos de un ´arbol
2.1.1 Dendroclimatolog´ıa
Dentro de la dendrocronolog´ıa existe una rama denominada la dendroclimatolog´ıa, el objetivo de
esta disciplina es estudiar y reconstruir el clima del pasado y del presente, a partir de secuencias de
anillos de ´arboles. Harold C. Fritts, realiz´o grandes aportes al estudio de la dendrocronolog´ıa aplicada
a reconstrucciones clim´aticas. Mientras que Edward Cook fue el primero en desarrollar modelos
estad´ısticos basados en series temporales de anillos de ´arboles.
3
5. 2.1.2 Alerce
Alerce, es la especie arb´orea de mayor tama˜no en Am´erica del Sur, con altura entre 50 y 60 metros,
di´ametro del tronco de hasta cinco metros, puede alcanzar edades de entre 3.000 y 4.000 a˜nos.
El Alerce es un ´arbol originario del bosque h´umedo templado valdiviano del sur de Chile y Argentina.
En la figrua 2 se puede ver al ”El gran abuelo alerce”, es el ´arbol m´as antiguo de Chile y Sudam´erica
con m´as de 3500 a˜nos de antig¨uedad y est´a ubicado en el Parque Nacional Alerce Costero de la regi´on
de Los R´ıos.
Figure 2: El gran abuelo alerce
2.1.3 Serie de Tiempo Alerce
La serie elegida para ejemplificar el uso de serie de tiempo de larga memoria en los anillos de ´arboles,
fue obtenida desde la plataforma Time Series Data Library y corresponde al ´ındice de anchura de
anillos perteneciente a ´arboles de alerces en la Isla de Chilo´e entre los a˜nos 1386 y 1987.
Algunos estad´ısticos relevantes de los datos obtenidos son:
• Rango 2.781 mm (Min=0.067mm, Max= 2.848mm)
• Mean=0.999 mm ; Var=0.164
4
6. En la figura 3, se puede observar la serie de tiempo de los´ındices de anchura de los anillos pertenecientes
a ´arboles de alerce. En el gr´afico se puede observar que la serie no presenta tendencia pero presenta
variaciones durante los primeros 100 de registro.
Figure 3: Serie de tiempo de anillos de alerces
5
7. En la figura 4, se puede observar el ACF de la serie de tiempo de anillos de alerce. El ACF muestra
una ca´ıda m´as lenta que la exponencial, las correlaciones muestran persistencia a lo largo del tiempo.
Figure 4: ACF de anillos de alerces
6
8. 2.2 Caudales de r´ıos
La hidrolog´ıa es una rama de las ciencias de la Tierra que estudia el agua, su ocurrencia, distribuci´on,
circulaci´on, y propiedades f´ısicas, qu´ımicas y mec´anicas en los oc´eanos, atm´osfera y superficie terrestre.
Esto incluye las precipitaciones, la escorrent´ıa, la humedad del suelo, la evaporaci´on y el equilibrio de
las masas glaciares.
Los dominios de la hidrolog´ıa incluyen la hidrometeorolog´ıa, la hidrolog´ıa superficial, la hidrogeolog´ıa,
la administraci´on del drenaje y la calidad del agua. La oceanograf´ıa y la meteorolog´ıa no est´an
incluidas porque en ellas el agua es s´olo uno de muchos aspectos importantes.
La investigaci´on hidrol´ogica es ´util en cuanto que nos permite entender mejor el mundo en el que
vivimos, y tambi´en proporciona conocimientos para la ingenier´ıa ambiental, pol´ıtica y planificaci´on.
2.2.1 Rio Nilo
El Nilo es un importante r´ıo que fluye hacia el norte en el noreste de ´Africa, y es el r´ıo m´as largo del
mundo. El Nilo, que tiene aproximadamente 6,650 km, es un r´ıo internacional ya que su cuenca de
drenaje cubre once pa´ıses. En particular, el Nilo es la principal fuente de agua de Egipto y Sud´an.
2.2.2 Serie de Tiempo R´ıo Nilo
La serie elegida para ejemplificar el uso de serie de tiempo de larga memoria en la hidrolog´ıa, fue
obtenida desde la plataforma Time Series Data Library y corresponde al promedio del caudal anual
del r´ıo Nilo entre los a˜nos 1870 y 1945.
Algunos estad´ısticos relevantes de los datos obtenidos son:
• Mean 2.916,18 (m3/s) , Var 293.196.
• Rango 2.603(m3/s) (Min= 1.649, Max=4.252).
7
9. En la figura 5, se puede ver el gr´afico de la serie de tiempo caudal del r´ıo Nilo. Se puede ver que
corresponde a una serie no estacionaria y no presenta una tendencia.
Figure 5: Serie de tiempo r´ıo Nilo
En la figura 6 y 7, se puede ver la funci´on de autocorrelaci´on con un lag m´aximo de 20 y de 100
respectivamente. En ambos casos el ACF de los datos cae de una manera m´as lenta que la exponencial
y que la dependencia de los datos persiste con el paso del tiempo.
Figure 6: ACF Nilo
8
11. 2.3 Contaminaci´on ambiental
Uno de los principales focos de preocupaci´on a nivel mundial es la contaminac´ıon, la cual se encuentra
presente a trav´es muchas formas, por lo que es urgente el estudio de todas las formas que hay.
En este caso se har´a ´enfasis en la contaminaci´on del aire, la cual no es esquiva en Chile.
Figure 8: Santiago, Chile
2.3.1 SINCA
Para la recolecci´on de los datos, la base ser´a el SINCA (Sistema de Informaci´on Nacional de Calidad
del Aire).
Figure 9: Logo del ”Sistema de informaci´on nacional de calidad del aire”.
´Este es un portal del Ministerio del Medio Ambiente de acceso p´ublico que muestra la informaci´on
de la calidad del aire (gases y materiales particulados), puntos de lectura del aire en cada comuna y
condiciones climatol´ogicas de la regi´on.
10
12. La regi´on de Valpara´ıso cuenta con puntos de lectura de calidad del aire en distintos lugares de la
costa.
Cada uno de estos puntos generan lecturas a los siguientes elementos: MP 2.5, MP 10 , SO2, NO2,
NOX, NO, CO, O3, CH44, HCNM y HCT, junto con distintos indicadores ambientales como son:
radiaci´on, direcci´on del viento, presi´on, humedad relativa, velocidad del viento y temperatura ambi-
ente.En ´este caso se trabajar´a una serie de tiempo con los datos de Valpara´ıso.
2.3.2 MP 2.5
Existen muchas clasificaciones en las mediciones del SINCA, para la serie se considerar´an los datos de
material particulado de 2.5 (MP 2.5), el material particulado es una mezcla de part´ıculas l´ıquidas y
s´olidas de sustancias tanto org´anicas como inorg´anicas, las cuales se encuetran flotando en el aire.
Figure 10: Comparativa del ”MP 2.5” y el ”MP 10”.
11
13. 2.3.3 Serie de tiempo MP 2.5
Figure 11: Registro diario de MP 2.5 en Valpara´ıso.
Con respecto a esta serie, se cuenta con datos diarios desde el 8 de noviembre del a˜no 2013 hasta el
17 de marzo del 2019, esta serie no presenta una tendencia marcada ni se˜nalles de ser estacionaria,
adem´as se puede ver la gran cantidad de datos recopilados (1.967 datos).
Adem´as en la figura 12, se puede apreciar claramente la persistencia existente en el acf, donde con la
presencia de ”100 lag” la ca´ıda exponencial es demasiado lenta.
12
14. Figure 12: Acf de MP 2.5 en Valpara´ıso..
3 Procesos de Larga Memoria
Un proceso {Yt}t∈ Z es dicho ser de larga memoria si su funci´on de autocorrelaci´on cae hiperb´olicamente
y no es absolutamente sumable, es decir:
∞
=−∞
|ρY ( )| converge.
Existen sin embargo definiciones alternativas:
En la definici´on anterior, ρ( ) puede ser reemplazado por:
• Las covarianzas del proceso γY ( ),
13
15. • La funci´on de densidad espectral del proceso fY (λ),
• Los coeficientes de la representaci´on de Wold del proceso ψj
La propiedad de larga memoria suele relacionarse con la persistencia que muestran las autocorrela-
ciones muestrales de ciertas series de tiempo estacionarias, que decrecen a un ritmo muy lento pero
finalmente convergen hacia cero.
La funci´on de autocorrelaci´on de series de tiempo de larga memoria no decrece r´apidamente a cero,
no tienen tasa decrecimiento exponencial. La tasa de decrecimiento es dicha hiperb´olica;
Este comportamiento no es compatible ni con los modelos estacionarios AR, MA ni ARMA, que
imponen un decrecimiento exponencial en las autocorrelaciones, ni con el grado extremo de persistencia
de los modelos integrados no estacionarios (ARIMA). La soluci´on se encuenta en los modelos ARFIMA.
Seg´un Granger Joyeux (1980), al diferenciar una serie de tiempo aparentemente no estacionaria hasta
conseguir estacionariedad, puede tener consecuencias negativas en la correcta modelaci´on de series
de tiempo a largo plazo. Para modelar este tipo de series, la diferenciaci´on entera es “excesiva”
(sobrediferenciaci´on) pero la no diferenciaci´on tampoco es adecuada (subdiferenciaci´on).
Los modelos ARFIMA(p,d,q) tienen una gran capacidad para demostrar dependencias significativas
entre periodos de tiempo distantes. El par´ametro de diferenciaci´on fraccional d utilizado en estos
modelos varia en el intervalo (−0.5, 0.5)
14
16. 4 Conclusi´on
Los modelos ARIMA no son aplicables a series de tiempo de larga memoria, por lo cual se necesita
una nueva familia de series de tiempo que sea capaz de explicar estos fen´omenos. La soluci´on est´a en
los modelos ARFIMA(p,d,q) con d ∈ Q, ya que estos son capaces de modelar y trabajar con series
cuyas funciones de autocorelaci´on poseen un decaimiento m´as lento que el exponencial, debido a que
sus correlaciones persisten a trav´es del tiempo.
15
17. 5 Bibliograf´ıa
• Granger, C. W. J. Joyeux, R. (1980), ‘An introduction to long-memory time series models and
fractional differencing’, Journal of Time Series Analysis 1, 15–39.
• Time Series Data Library (citing: Villalba, R. (1989))
• Time series: theory and methods, second edition. Brockwell, P. J. y Davis, R. A. (1991).
• Introduction to time series and forecasting. Brockwell, Peter J. and Davis, Richard A. (2002).
• Long Memory Processes: Probabilistics and Statistical Methods, J. Began, Y. Feng, S. Ghosh
and R. Kulik (2013).
• Sistema de Informaci´on Nacional de Calidad del Aire. (SINCA)
16