Modelos de Regresión para
          Series de Tiempo

Presentación preparada por:
Norlan Rodríguez
Héctor L. Rodríguez
Para la clase: MATH 6400 Estadística Matemática Avanzada
31 de marzo de 2011




                                                           1
¿Qué son las Series de Tiempo ?
• Una serie de tiempo es una secuencia de puntos
  de data, medidos típicamente a intervalos
  sucesivos y separados uniformemente en el
  tiempo.




                                              2
¿Dónde se usan las Series de Tiempo ?

• Las series de tiempo surgen en muchas
  aplicaciones de las estadísticas y se usan para
  predecir el valor futuro de una variable medida:
• en estadísticas de estudios sociológicos sobre
  desempleo, crimen,
• en estadísticas económicas sobre producción, tasas
  de interes,
• en estadísticas meteorológicas sobre temperaturas,
  cantidad de lluvia, presión barométrica,
• y otras aplicaciones…..
                                                       3
Componentes de una Serie de Tiempo
• Trend (Tendencia)
  - un patrón persistente hacia arriba o hacia abajo en la serie de
    tiempo


                      Trend



                                       Random
                                       movement

                           Time




                                                                  4
Componentes de una Serie de Tiempo
• Seasonal (Temporada)
  - La variación depende del tiempo en el año.
  - Cada año muestra el mismo patrón de temporada.

                 Seasonal
                 pattern




                      Time




                                                     5
Componentes de una Serie de Tiempo
• Cyclical (Cíclico)
   -Un movimiento que sube y baja y se repite a lo largo de un
    período de tiempo.


                   Cycle




                           Time



                                                                 6
Componentes de una Serie de Tiempo
• Noise o random fluctuations (Outliers) - irregular
   - No siguen un patrón éspecífico.
   - Tienen corta duración no repetitivo.




                                                       7
Métodos de análisis para Series de Tiempo

• Las series de tiempo se analizan usando dos métodos
  principales:
   • Arima (AutoRegressive Integrated Moving Average)
   • Regresión (Autoregresión)

• Esta presentación se concentra en el método de:
  regresión o modelo de tendencia lineal.



                                                    8
¿Qué es Regresión?
• El análisis de regresión es una técnica que permite
  estudiar y medir la relación que existe entre dos o
  más variables.
• La meta es hacer un estimado del valor de una
  variable en función de una o más variables.
• La variable estimada es la variable dependiente y
  comúnmente se designa por Y.
• Las variables que explican las variaciones deY son
  las variables independientes y se designan con X.
• El análisis de regresión busca también establecer la
   confiabilidad de los estimados y las predicciones
   obtenidas.
                                                         9
¿Cómo Funciona la Regresión?
• En el análisis de regresión lineal (por ejemplo) se
  entran los datos al archivo de una computadora. Se
  corre un programa que calcula la pendiente y el
  intercepto de una
  linea que pasa por
  el centro de los
  datos y se usa esta
  linea y su ecuación
  para predecir el
  valor de la variable
  dependiente.

                                                        10
¿Cómo Funciona la Regresión?
• Autoregresión = Es una situación en la cual una data
  de una serie de tiempo de un período, exhibe una
  relación de causa y efecto con la data del período
  anterior.

• La regresión o Autoregresión en este caso se usa en las
  series de tiempo mayormente cuando la data muestra
  una tendencia consistente y se puede obtener una
  ecuación que modele la data. No funciona para
  tendencias estacionarias.


                                                       11
Regresión en Series de Tiempo
• No toma en cuenta los cambios por temporadas
  (seasons).
• Un modelo con tendencia lineal obedece a la
  siguiente ecuación:
                            Yt = a + bt
  donde:
      t es el índice de tiempo para cada período,
      t = 1, 2, 3,…
.



                                                    12
Regresión en Series de Tiempo
• Las temporadas (seasons), en las series de tiempo se
  deben ajustar para poder realizar los pronósticos.

     Data Actual                     Data Ajustada


                   Ajustar Seasons



                                                     Pronostico




                     Reestablecer


                                                            13
Regresión en Series de Tiempo
• Para ajustar las temporadas de la data, esta se divide
  por un índice de temporada:

      Data Ajustada = Data Actual / SI

• Para reestablecer la data a su forma original, esta se
  multiplica por el índice de temporada:

      Data Reestablecida = Data Ajustada * SI



                                                           14
Regresión en Series de Tiempo
• ¿Qué es el “Seasonal Index”?
   SI = (Seasonal Index) Es una proporción entre la
         demanda actual y la demanda promedio. Es un
         índice que se puede usar para comparar una
         observación actual con relación a lo que sería
         si no hubiera variación de temporada.

• ¿Cómo se calcula?
   - Existen muchos métodos para calcular los
     “seasonal indices”
   - Para nuestro ejemplo usaremos el método de
     porciento del promedio.
                                                      15
Regresión en Series de Tiempo
• Para nuestro ejemplo consideremos una serie de tiempo
  que tiene una data trimestral para 6 años, resumida en la
  siguiente tabla:

         Year    1st Trim.   2nd Trim.   3rd Trim.   4th Trim.

         1       19.65       16.35       21.30       14.90
         2       28.15       25.00       29.85       23.40
         3       36.75       33.60       38.55       32.10
         4        45.30      42.25       47.00       40.65
         5       54.15       51.00       55.75       49.50
         6       62.80       59.55       64.40       58.05



                                                                 16
Regresión en Series de Tiempo
• Primero calculamos el promedio aritmético para los
  6 años.

             Year          Sum          Mean
              1            72.2         18.05
              2           106.4          26.6
              3           141.0         35.25
              4           175.2          43.8
              5           210.4          52.6
              6           244.8          61.2




                                                       17
Regresión en Series de Tiempo
• Luego dividimos las lineas de la tabla inicial por el
  promedio trimestral del año correspondiente y
  multiplicamos por 100.
• Luego          Year      1st Trim.   2nd Trim.   3rd Trim.   4th Trim.
calculamos el    1         108.86      90.58       118.01      82.55
promedio         2         105.83      93.98       112.22      87.97
                 3         104.26      95.32       109.36      91.06
aritmético
                 4         103.42      96.46       107.31      92.81
para obtener
                 5         102.95      96.96       105.99      94.11
los índices de   6         102.61      97.30       105.23      94.85
temporada.       Indices   104.66      95.10       109.69      90.56



                                                                       18
Regresión en Series de Tiempo
• Para transformar la serie de tiempo a una sin temporadas
  se divide cada punto de la serie por sus respectivos
  valores de SI:
                   y ’ = y / SI

• El resultado es una data transformada (serie tiempo
  nueva) con los efectos de temporada removidos.

• Pronosticar
  Por último se calculan los parámetros del modelo de
  tendencia lineal con los datos de la nueva serie y se
  pronostica para el valor deseado de la variable
  independiente

                                                          19
Bibliografía
• Robert H. Shumway and David S. Stoffer (2011) . Time Series
  Analysis and Its Applications With R Examples. Third edition.
  New York: Springer.

• Dr. Subhashish (Sub) Samaddar. Georgia State University.
  www.gsu.edu/~dscsss/teaching/mgs3100

• Yadolah Dodge (2008). The Concise Encyclopedia of Statistics.
  New York: Springer

• Richard B. Darlington
  http://www.psych.cornell.edu/darlington/series/series0.htm

• http://en.wikipedia.org/wiki/Seasonal_Variation
• http://en.wikipedia.org/wiki/Time-series_regression

Time series

  • 1.
    Modelos de Regresiónpara Series de Tiempo Presentación preparada por: Norlan Rodríguez Héctor L. Rodríguez Para la clase: MATH 6400 Estadística Matemática Avanzada 31 de marzo de 2011 1
  • 2.
    ¿Qué son lasSeries de Tiempo ? • Una serie de tiempo es una secuencia de puntos de data, medidos típicamente a intervalos sucesivos y separados uniformemente en el tiempo. 2
  • 3.
    ¿Dónde se usanlas Series de Tiempo ? • Las series de tiempo surgen en muchas aplicaciones de las estadísticas y se usan para predecir el valor futuro de una variable medida: • en estadísticas de estudios sociológicos sobre desempleo, crimen, • en estadísticas económicas sobre producción, tasas de interes, • en estadísticas meteorológicas sobre temperaturas, cantidad de lluvia, presión barométrica, • y otras aplicaciones….. 3
  • 4.
    Componentes de unaSerie de Tiempo • Trend (Tendencia) - un patrón persistente hacia arriba o hacia abajo en la serie de tiempo Trend Random movement Time 4
  • 5.
    Componentes de unaSerie de Tiempo • Seasonal (Temporada) - La variación depende del tiempo en el año. - Cada año muestra el mismo patrón de temporada. Seasonal pattern Time 5
  • 6.
    Componentes de unaSerie de Tiempo • Cyclical (Cíclico) -Un movimiento que sube y baja y se repite a lo largo de un período de tiempo. Cycle Time 6
  • 7.
    Componentes de unaSerie de Tiempo • Noise o random fluctuations (Outliers) - irregular - No siguen un patrón éspecífico. - Tienen corta duración no repetitivo. 7
  • 8.
    Métodos de análisispara Series de Tiempo • Las series de tiempo se analizan usando dos métodos principales: • Arima (AutoRegressive Integrated Moving Average) • Regresión (Autoregresión) • Esta presentación se concentra en el método de: regresión o modelo de tendencia lineal. 8
  • 9.
    ¿Qué es Regresión? •El análisis de regresión es una técnica que permite estudiar y medir la relación que existe entre dos o más variables. • La meta es hacer un estimado del valor de una variable en función de una o más variables. • La variable estimada es la variable dependiente y comúnmente se designa por Y. • Las variables que explican las variaciones deY son las variables independientes y se designan con X. • El análisis de regresión busca también establecer la confiabilidad de los estimados y las predicciones obtenidas. 9
  • 10.
    ¿Cómo Funciona laRegresión? • En el análisis de regresión lineal (por ejemplo) se entran los datos al archivo de una computadora. Se corre un programa que calcula la pendiente y el intercepto de una linea que pasa por el centro de los datos y se usa esta linea y su ecuación para predecir el valor de la variable dependiente. 10
  • 11.
    ¿Cómo Funciona laRegresión? • Autoregresión = Es una situación en la cual una data de una serie de tiempo de un período, exhibe una relación de causa y efecto con la data del período anterior. • La regresión o Autoregresión en este caso se usa en las series de tiempo mayormente cuando la data muestra una tendencia consistente y se puede obtener una ecuación que modele la data. No funciona para tendencias estacionarias. 11
  • 12.
    Regresión en Seriesde Tiempo • No toma en cuenta los cambios por temporadas (seasons). • Un modelo con tendencia lineal obedece a la siguiente ecuación: Yt = a + bt donde: t es el índice de tiempo para cada período, t = 1, 2, 3,… . 12
  • 13.
    Regresión en Seriesde Tiempo • Las temporadas (seasons), en las series de tiempo se deben ajustar para poder realizar los pronósticos. Data Actual Data Ajustada Ajustar Seasons Pronostico Reestablecer 13
  • 14.
    Regresión en Seriesde Tiempo • Para ajustar las temporadas de la data, esta se divide por un índice de temporada: Data Ajustada = Data Actual / SI • Para reestablecer la data a su forma original, esta se multiplica por el índice de temporada: Data Reestablecida = Data Ajustada * SI 14
  • 15.
    Regresión en Seriesde Tiempo • ¿Qué es el “Seasonal Index”? SI = (Seasonal Index) Es una proporción entre la demanda actual y la demanda promedio. Es un índice que se puede usar para comparar una observación actual con relación a lo que sería si no hubiera variación de temporada. • ¿Cómo se calcula? - Existen muchos métodos para calcular los “seasonal indices” - Para nuestro ejemplo usaremos el método de porciento del promedio. 15
  • 16.
    Regresión en Seriesde Tiempo • Para nuestro ejemplo consideremos una serie de tiempo que tiene una data trimestral para 6 años, resumida en la siguiente tabla: Year 1st Trim. 2nd Trim. 3rd Trim. 4th Trim. 1 19.65 16.35 21.30 14.90 2 28.15 25.00 29.85 23.40 3 36.75 33.60 38.55 32.10 4 45.30 42.25 47.00 40.65 5 54.15 51.00 55.75 49.50 6 62.80 59.55 64.40 58.05 16
  • 17.
    Regresión en Seriesde Tiempo • Primero calculamos el promedio aritmético para los 6 años. Year Sum Mean 1 72.2 18.05 2 106.4 26.6 3 141.0 35.25 4 175.2 43.8 5 210.4 52.6 6 244.8 61.2 17
  • 18.
    Regresión en Seriesde Tiempo • Luego dividimos las lineas de la tabla inicial por el promedio trimestral del año correspondiente y multiplicamos por 100. • Luego Year 1st Trim. 2nd Trim. 3rd Trim. 4th Trim. calculamos el 1 108.86 90.58 118.01 82.55 promedio 2 105.83 93.98 112.22 87.97 3 104.26 95.32 109.36 91.06 aritmético 4 103.42 96.46 107.31 92.81 para obtener 5 102.95 96.96 105.99 94.11 los índices de 6 102.61 97.30 105.23 94.85 temporada. Indices 104.66 95.10 109.69 90.56 18
  • 19.
    Regresión en Seriesde Tiempo • Para transformar la serie de tiempo a una sin temporadas se divide cada punto de la serie por sus respectivos valores de SI: y ’ = y / SI • El resultado es una data transformada (serie tiempo nueva) con los efectos de temporada removidos. • Pronosticar Por último se calculan los parámetros del modelo de tendencia lineal con los datos de la nueva serie y se pronostica para el valor deseado de la variable independiente 19
  • 20.
    Bibliografía • Robert H.Shumway and David S. Stoffer (2011) . Time Series Analysis and Its Applications With R Examples. Third edition. New York: Springer. • Dr. Subhashish (Sub) Samaddar. Georgia State University. www.gsu.edu/~dscsss/teaching/mgs3100 • Yadolah Dodge (2008). The Concise Encyclopedia of Statistics. New York: Springer • Richard B. Darlington http://www.psych.cornell.edu/darlington/series/series0.htm • http://en.wikipedia.org/wiki/Seasonal_Variation • http://en.wikipedia.org/wiki/Time-series_regression