BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
Unidad-3-analisis-de-series-de-tiempo
1. 3 Análisis de serie de tiempo.
3.1 Componentes de una serie de tiempo.
Tendencia, es la componente de largo plazo que constituye la base del
crecimiento o declinación de una serie histórica, como se presenta en la figura 1.1.
Los fuerzas básicas que producen o afectan la tendencia de una serie son:
cambios en la población, inflación, cambio tecnológico e incremento en la
productividad.
Figura 1.1 Gráfica de una serie de datos con tendencia
Ciclicidad, es un conjunto de fluctuaciones en forma de onda o ciclos, de más de
un año de duración, producidos por cambios en las condiciones económicas,
como se presenta en la figura 1.2.
Representan la diferencia entre los valores esperados de una variable (tendencia)
y los valores reales (la variación residual que fluctúa alrededor de la tendencia).
Figura 1.2 Gráfica de una serie de datos con ciclicidad
2. Estacionalidad, las fluctuaciones estacionales se encuentran típicamente en los
datos clasificados por trimestres, mes o semana. La variación estacional se refiere
a un patrón de cambio, regularmente recurrente a través del tiempo. El movimiento
se completa dentro de la duración de un año y se repite a sí mismo año tras año,
como se presenta en la figura 1.3.
Figura 1.3 Gráfica de una serie de datos con estacionalidad.
Aleatoriedad, este comportamiento irregular está compuesto por fluctuaciones
causadas por sucesos impredecibles o no periódicos, como el clima poco usual,
huelgas, guerras, rumores, elecciones y cambio de leyes, como se presenta en la
figura 1.4.
Figura 1. 4 Gráfica de una serie de datos con aleatoriedad
3. Estacionaria, es aquella serie de datos cuyas propiedades estadísticas básica,
como media y la varianza, permanecen constantes en el tiempo, se dice que una
serie que no presenta crecimiento o declinación es estacionaria, como se presenta
en la figura 1.5.
Figura 1. 5 Gráfica de una serie de datos estacionaria
4. 3.2 Método de mínimos cuadrados.
Mínimos cuadrados es una técnica de optimización matemática que, dada una
serie de mediciones, intenta encontrar una función que se aproxime a los datos
(un "mejor ajuste"). Intenta minimizar la suma de cuadrados de las diferencias
ordenadas (llamadas residuos) entre los puntos generados por la función y los
correspondientes en los datos. Específicamente, se llama mínimos cuadrados
promedio (LMS) cuando el número de datos medidos es 1 y se usa el método de
descenso por gradiente para minimizar el residuo cuadrado. Se sabe que LMS
minimiza el residuo cuadrado esperado, con el mínimo de operaciones (por
iteración). Pero requiere un gran número de iteraciones para converger.
Un requisito implícito para que funcione el método de mínimos cuadrados es que
los errores de cada medida estén distribuidos de forma aleatoria. El teorema de
Gauss-Markov prueba que los estimadores mínimos cuadráticos carecen de sesgo
y que el muestreo de datos no tiene que ajustarse, por ejemplo, a una distribución
normal. También es importante que los datos recogidos estén bien escogidos,
para que permitan visibilidad en las variables que han de ser resueltas (para dar
más peso a un dato en particular, véase mínimos cuadrados ponderados).
La técnica de mínimos cuadrados se usa comúnmente en el ajuste de curvas.
Muchos otros problemas de optimización pueden expresarse también en forma de
mínimos cuadrados, minimizando la energía o maximizando la entropía
Dada una serie de datos la recta de mejor ajuste a esos datos está
dada por y = mx =b, donde la pendiente es
y la ordenada en el origen es
En el caso frecuente en el que la recta deba pasar por el origen, su ecuación será
y la pendiente es
La bondad del ajuste por mínimos cuadrados se puede estimar calculando el
coeficiente de correlación
5. Un coeficiente de correlación próximo a la unidad indica un buen ajuste.
Debe tenerse en cuenta que los datos experimentales estarán afectados por sus
incertidumbres y por tanto los valores de m y b tendrán también incertidumbre.
Para determinarla de forma sencilla, se supone que los datos en x no tienen
incertidumbre y que los datos en y tienen todos la misma uy. Entonces la
incertidumbre en la pendiente está dada por
donde U es el valor mayor entre uy y oe.
La incertidumbre en la ordenada en el origen es:
donde U es el valor mayor entre uy y oe.
En el caso de una recta que pasa por el origen, la incertidumbre en la pendiente
es
donde U es el valor mayor entre uy y oe.
6. 3.3 Métodos de promedios móviles.
La utilización de esta técnica supone que la serie de tiempo es estable, esto es,
que los datos que la componen se generan sin variaciones importantes entre un
dato y otro (error aleatorio=0)2, esto es, que el comportamiento de los datos
aunque muestren un crecimiento o un decrecimiento lo hagan con una tendencia
constante.
Cuando se usa el método de promedios móviles se está suponiendo que todas las
observaciones de la serie de tiempo son igualmente importantes para la
estimación del parámetro a pronosticar (en este caso los ingresos). De esta
manera, se utiliza como pronóstico para el siguiente periodo el promedio de los n
valores de los datos más recientes de la serie de tiempo.
Utilizando una expresión matemática, tenemos:
El término móvil indica que conforme se tienen una nueva observación de la serie
de tiempo, se reemplaza la observación más antigua de la ecuación y se calcula
un nuevo promedio.
El resultado es que el promedio se moverá, esto es, conforme se tengan nuevos
datos y se vayan sustituyendo en la fórmula, el valor del promedio irá
modificándose.
No existe una regla específica que nos indique cómo seleccionar la base del
promedio móvil n. Si la variable que se va a pronosticar no presenta variaciones
considerables, esto es, si su comportamiento es relativamente estable en el
tiempo, se recomienda que el valor de n sea grande. Por el contrario, es
aconsejable un valor de n pequeño si la variable muestra patrones cambiantes. En
la práctica, los valores de n oscilan entre 2 y 10.
El método de promedios móviles es muy útil cuando se tiene información no
desagregada y cuando no se conoce otro método más sofisticado y que permita
predecir con mayor confianza.
7. 3.4 Métodos de suavización exponencial.
Otro método para realizar un pronóstcico es el método de suavización
exponencial. A diferencia de los promedios móviles, este método pronostica
otorgando una ponderación a los datos dependiendo del peso que tengan dentro
del cálculo del pronóstico. Esta ponderación se lleva a cabo a través de otorgarle
un valor a la constante de suavización, α, que puede ser mayor que cero y menor
que uno. Para nuestro ejemplo, utilizamos un valor de α = 0.8, por ser éste el que
mejor ajusta al pronóstico a los datos reales.
El método de suavización exponencial supone que el proceso es constante, al
igual que el método de promedios móviles. Esta técnica está diseñada para
atenuar una desventaja del método de promedios móviles, en donde los datos
para calcular el promedio tienen la misma ponderación. De manera particular, esta
técnica considera que las observaciones recientes tienen más valor, por lo que le
otorga mayor peso dentro del promedio.
La suavización exponencial utiliza un promedio móvil ponderado de los datos
históricos de la serie de tiempo como pronóstico; es un caso especial de promedio
móvil en donde se selecciona un solo valor de ponderación 3. El modelo básico de
suavización exponencial se presenta a continuación:
Ft+1 = αYt + (1 - α)Ft (2)
Donde:
Ft+1 = Pronóstico de la serie de tiempo para el periodo de t + 1.
Yt = Valor real del periodo anterior al año a pronosticar.
Ft = Valor real del periodo anteanterior al año a pronosticar.
α = Constante de suavización (0 ≤ α ≤ 1).
La utilización de esta ecuación implica algunas especificaciones. El cálculo de
Ft+1 está ligado con los 2 periodos anteriores. En otras palabras, el pronóstico de
suavización exponencial en determinado periodo es (Ft+1) = al valor real de la
serie de tiempo en el periodo anterior (Yt) X la constante de suavización (α), + 1 -
la constante de suavización (α) X el periodo anteanterior (Ft).
Ft+1 = αααYt + (1 - ααα)Ft (2)
A pesar de que la suavización exponencial nos da un pronóstico que es un
promedio ponderado de todas las operaciones pasadas, no es necesario guardar
todos los datos del pasado a fin de calcular el pronóstico para el periodo siguiente.
De hecho, una vez seleccionada la constante de suavización α, sólo se requiere
de dos elementos de información para calcular el pronóstico. La ecuación (2)
muestra que con un α dado, podemos calcular el pronóstico para el periodo t + 1
simplemente conociendo los valores reales y pronosticados de la serie de tiempo
el periodo t, es decir, Yt y Ft.
La elección de la constante de suavización α es crucial en la estimación de
pronósticos futuros. Si la serie de tiempo contiene una variabilidad aleatoria
sustancial, se preferirá un valor pequeño como constante de suavización. La razón
8. de esta aseveración es que gran parte del error del pronóstico es provocado por la
variabilidad aleatoria, por lo que un valor pequeño de α permite un pronóstico
mejor. Por el contrario, para una serie de tiempo con una variabilidad aleatoria
relativamente pequeña, valores más elevados de la constante de suavización
tienen la ventaja de ajustar con rapidez los pronósticos cuando ocurren errores de
pronóstico y permitiendo, por lo tanto, que el pronóstico reaccione con mayor
rapidez a las condiciones cambiantes. En la práctica, el valor de α está entre .01 y
.90.
Utilizando la ecuación 2, sustituimos los valores correpondientes para hacer el
pronóstico para el año 1992. Sutituyendo valores nos quedaría:
Fingresos 1992 = 0.8 (201986) + (1 – 0.8)(163305)
Fegresos 1992 = 0.8 (189498) + (1 – 0.8)(162370)
El mismo procedimiento se realiza para el resto de los años y obtenemos los
resultados que aparecen en el cuadro 2. Una vez que se calculan los Diplomado
en Gestión Estratégica de las Finanzas Públicas
D.R. Instituto Tecnológico y de Estudios Superiores de Monterrey, México, 2006
pronósticos de ingresos y egresos, la diferencia entre éstos nos da el ahorro, que
aparece en la última columna del mismo cuadro.
Podemos observar que el pronóstico se ajusta más a los datos reales que en el
caso de los promedios móviles. Este método nos permite realizar un pronóstico
más confiable que el caso anterior. Claramente se observa que el pronóstico tiene
mejor ajuste y la diferencia entre los valores reales y los pronosticados es mínima.
9. 3.5 Tendencias no lineales.
En el caso de tendencias no lineales, los dos tipos de curvas de tendencia de uso
mas frecuente son la curva de tendencia exponencial y la curva de tendencia
parabólica. Una curva de tendencia exponencial común refleja una tasa constante
de crecimiento durante un periodo de años. La curva exponencial debe su nombre
al hecho de que la variable independiente X es el exponente de b1 en la ecuación
general: Formula nº3 b = valor de Y en el año 0 b1= tasa de crecimiento.
De la obtención del logaritmo de ambos lados resulta la ecuación de tendencia
lineal logarítmica: Formula nº4La ventaja de la transformación a logaritmos es que
la ecuación lineal para el análisis de tendencias puede aplicarse a los logaritmos
de los valores cuando la serie de tiempo sigue una curva exponencial. Los valores
logarítmicos pronosticados de Y pueden reconvertirse después a las unidades de
medida originales mediante la obtención del antilogaritmo de los valores.
Una línea de tendencia logarítmica es una línea curva que se ajusta perfectamente
y que es muy útil cuando el índice de cambios de los datos aumenta o disminuye
rápidamente y después se estabiliza. Esta línea de tendencia logarítmica puede
utilizar valores positivos o negativos.
En el siguiente ejemplo se utiliza una línea de tendencia logarítmica para mostrar
el crecimiento previsto de la población animal en un área determinada, donde la
población se estabilizó al reducirse el espacio para los animales. Observe que el
valor R cuadrado es 0,9407, que es un ajuste relativamente bueno de la línea
respecto a los datos.
10. 3.6 Variación estacional.
El análisis de las variaciones estacionales tiene por objeto determinar oscilaciones
de período corto, inferior o igual al año por lo general, que son de máximo interés
para el economista o empresario, para la mejor organización de sus actividades
operativas. En una segunda fase se trata de eliminar tales variaciones de los datos
observados que permitan apreciar de cierto modo la influencia de causas
importantes de variación en las series cronológicas.
La dificultad principal del análisis de la componente estacional radica en el hecho
de que en la práctica tal variación no es idéntica en el transcurso de los años, bien
sea porque se desplaza de un mes a otro, o porque varía de intensidad. Muchos y
variados son los métodos preconizados por la estadística para determinar la
variación estacional, basados unos en la hipótesis aditiva y otros en la
multiplicativa. Todos ellos tratan de aislar la variación estacional eliminando las
otros componentes, por resta algebraica o por cociente, según sea la hipótesis
inicial de combinación.
Deben, pues, ser eliminada la tendencia secular y las variaciones accidentales.
Cuando el período de estudio es corto, la variación cíclica puede suponerse
incluida en la tendencia, por lo cual, al eliminarse ésta, queda también eliminada
aquella.
De todos los métodos usuales se expondrá sólo uno, basado en la hipótesis
aditiva, denominado "Método de las medias mensuales".
El problema que nos proponemos resolver, es el de encontrar una curva tal que en
el eje de las abcisas, estén representados los meses del año, por ejemplo ( t= 1, 2,
3, ....12) y en las ordenadas, la variación promedio correspondiente a cada uno de
los meses del año, prescindiendo por cierto de otro tipo de variaciones, ya sean
tendenciales, cíclicas (no anuales) o accidentales (aleatorias).
Determinada la tendencia, bien sea mediante un ajuste analítico, bien mediante el
método de promedios móviles, la variación estacional puede determinarse a través
de los siguientes pasos:
1) Se determinan las desviaciones de los datos de la serie respecto a la tendencia
o sea, la diferencia entre los datos y el valor correspondiente a la tendencia. De
esta manera se elimina la tendencia.
y T E C Ii i
2) Se calculan las medias aritméticas de las desviaciones correspondientes a
todos los eneros, todos los febreros, etc. Este paso tiende a eliminar la
componente cíclica e irregular quedando únicamente la componente estacional.
3) Se redondean estas medias y los resultados son la estimación de la variación
estacional para cada mes.
El método de cálculo se desarrolla mediante el proceso que se expone a
continuación reflejados en la tabla 4, en la que se ha prescindido del año inicial
1977, por no disponer de datos para la tendencia de sus primeros - seis meses y
11. del último año 1982 por ocurrir lo mismo para el último semestre de dicho año. Se
puede usar suma cuando los eneros tienen valores muy grandes.
Tabla 4 - Cálculo de las variaciones estacionales.
E Y Ti i
Medias Variación
Mes 1978 1979 1980 1981 Totales mensuales Estacional
Enero 2.52 3.42 4.27 4.46 14.67 3.668 3.615
Febrero 1 0.77 -2.64 0.36 -0.51 -0.128 -0.180
Marzo 1.52 -1.81 2.47 -0.79 1.39 0.348 0.295
Abril 3 1.11 0.56 2.04 6.71 1.678 1.625
Mayo -0.12 -1.02 -1.1 -1.71 -3.95 -0.988 -1.040
Junio -2.17 -4.21 -2.77 -3.02 -12.17 -3.043 -3.095
Julio -2.81 -1.92 -2.62 -2.79 -10.14 -2.535 -2.588
Agosto -5.31 -3.89 -3.67 -3.39 -16.26 -4.065 -4.118
Septiembre -4.14 -4 -4.08 -3.42 -15.64 -3.910 -3.963
Octubre -0.92 -0.21 -1.46 -0.94 -3.53 -0.883 -0.935
Noviembre 5.21 5.79 1.52 4.13 16.65 4.163 4.110
Diciembre 4.33 7.25 5.52 8.21 25.31 6.328 6.275
0.632 0.000
Las cuatro primeras columnas han sido obtenidas restando de los datos iniciales
(Tabla 1) los valores de la tendencia (tabla 3) diferencias que resultan positivas y
negativas.
Así para Enero de 1977 tenemos 17 - 14,48 = 2,52
Febrero de 1977 tenemos 15,5 - 14,5 = 1,00
La columna de totales es la suma algebraica de todos los eneros de todos los
febreros, etc.
La columna de medias mensuales se obtiene dividiendo los valores de los totales
por 4, que es el número de años utilizado.
Por último, la columna " variación estacional" es la misma que la de medias
después de someter los valores de ésta a un redondeo que hace que las sumas
de las variaciones estacionales sea cero, que se efectúa de la forma siguiente:
Se suma la columna de medias y se divide esta suma por 12.
Si el resultado es positivo se resta de cada una de las medias mensuales y si es
negativo se suma.
En nuestro caso el total de medias vale 0,1150 y por lo tanto
0,1150/12 = 0,0095.
Este valor se resta algebraicamente a la columna de medias y el resultado se
redondea a dos cifras decimales, que es la aproximación con que venían dados
los datos iniciales, conservando la segunda cifra decimal o forzándola en una
unidad, según que las dos últimas formen un número menor o mayor que 50
respectivamente.
12. Así pues: 3,6675 - 0,0095 = 3,6580 = 3,66
- 0,1275 - 0,0095 = 0,1370 = -0,14
6,7025 - 0,0095 = 6,6930 = 6,69
Se puede representar ahora la variación estacional en un gráfico, en el que como
abscisa se toman los distintos meses y en ordenadas los valores obtenidos.
Resulta así la figura 4.
Componente Estacional
E F M A M J J A S O N D