SlideShare una empresa de Scribd logo
1 de 31
Descargar para leer sin conexión
Análisis de series temporalesAnálisis de series temporales
© Fernando Berzal,© Fernando Berzal, berzal@acm.orgberzal@acm.org
Análisis de series temporalesAnálisis de series temporales
Características de las series temporalesCaracterísticas de las series temporales
Visualización de series temporalesVisualización de series temporales
Filtrado de series temporalesFiltrado de series temporales
Medias móvilesMedias móviles
Suavizado exponencialSuavizado exponencialSuavizado exponencialSuavizado exponencial
Técnicas de regresiónTécnicas de regresión
Regresión linealRegresión lineal
Coeficiente de correlación deCoeficiente de correlación de PearsonPearson
Función deFunción de autocorrelaciónautocorrelación
Caso práctico: Una sesión de análisisCaso práctico: Una sesión de análisis
11
CaracterísticasCaracterísticas
TendenciasTendencias
Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos)
RuidoRuido
Otros, p.ej. cambios bruscos de comportamientoOtros, p.ej. cambios bruscos de comportamiento
22
EjemplosEjemplos
Tendencia y estacionalidadTendencia y estacionalidad
Concentración de COConcentración de CO22
medida en el observatorio demedida en el observatorio de MaunaMauna Loa,Loa, HawaiiHawaii.. 33
EjemplosEjemplos
Variación “suave” pero sin tendencia a largo plazoVariación “suave” pero sin tendencia a largo plazo
Concentración de gas a la salida de una calderaConcentración de gas a la salida de una caldera
44
EjemplosEjemplos
Tendencia no linealTendencia no lineal
Coste de llamadas telefónicas de larga distancia (USA)Coste de llamadas telefónicas de larga distancia (USA)
55
EjemplosEjemplos
Cambios “bruscos” de comportamientoCambios “bruscos” de comportamiento
ÍndiceÍndice NikkeiNikkei (Bolsa de(Bolsa de TokyoTokyo))
66
EjemplosEjemplos
Conjuntos de datos reales…Conjuntos de datos reales…
Estacionalidad a corto y largo plazo,Estacionalidad a corto y largo plazo,
posibles cambios de comportamientoposibles cambios de comportamiento
y ruidoy ruido
Llamadas diariasLlamadas diarias
a una un callcall--centercenter
77
VisualizaciónVisualización
Número anual de manchas solares durante 300 añosNúmero anual de manchas solares durante 300 años
Una relación de aspecto incorrectaUna relación de aspecto incorrecta
hace difícil reconocer los detalles de cada ciclo.hace difícil reconocer los detalles de cada ciclo. 88
VisualizaciónVisualización
BankingBanking [[BankingBanking toto 4545 degreesdegrees]]
Los cambios casi verticales de la figura anterior nosLos cambios casi verticales de la figura anterior nos
cuesta trabajo apreciarlos. Sin embargo, reconocemoscuesta trabajo apreciarlos. Sin embargo, reconocemos
mejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan con
un ángulo de 45º:un ángulo de 45º:
Ahora podemos apreciar que las “subidas” son másAhora podemos apreciar que las “subidas” son más
rápidas que las bajadas, aunque la figura es tanrápidas que las bajadas, aunque la figura es tan
pequeña que apenas se pueden analizar detalles…pequeña que apenas se pueden analizar detalles…
99
VisualizaciónVisualización
StackingStacking
Dividiendo el eje temporal en 3 fragmentos,Dividiendo el eje temporal en 3 fragmentos,
mantenemos el “mantenemos el “bankingbanking” y generar un gráfico con” y generar un gráfico con
unas dimensiones más razonables (p.ej. 4:3).unas dimensiones más razonables (p.ej. 4:3). 1010
Filtrado de series temporalesFiltrado de series temporales
Medias móvilesMedias móviles [[movingmoving averagesaverages]]
IIDEADEA:: Reemplazar el punto central de una serie de unReemplazar el punto central de una serie de un
número impar de números consecutivos por su medianúmero impar de números consecutivos por su media
aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”).
1111
∑−=
+
+
=
k
kj
jii x
k
s
12
1
Filtrado de series temporalesFiltrado de series temporales
Medias móvilesMedias móviles [[movingmoving averagesaverages]]
PPROBLEMAROBLEMA:: La presencia de un pico en la ventana [iLa presencia de un pico en la ventana [i--k,k,
i+ki+k] distorsiona la media móvil.] distorsiona la media móvil.
PPOSIBLEOSIBLE SOLUCIÓNSOLUCIÓN:: Utilización de pesos (menores en losUtilización de pesos (menores en los
extremos de la ventana).extremos de la ventana).
Ejemplos:Ejemplos: GaussianaGaussiana, ventana de, ventana de HammingHamming……
http://en.wikipedia.org/wiki/Window_function#Hann_windowhttp://en.wikipedia.org/wiki/Window_function#Hann_window
1212
∑ ∑−= −=
+ ==
k
kj
k
kj
jjiji wdondexws 1
Filtrado de series temporalesFiltrado de series temporales
Medias móvilesMedias móviles [[movingmoving averagesaverages]]
k=5k=5
1313
Filtrado de series temporalesFiltrado de series temporales
Medias móvilesMedias móviles [[movingmoving averagesaverages]]
Limitaciones de las medias móviles:Limitaciones de las medias móviles:
“Costosas” de calcular: Cuando se utilizan pesos, el“Costosas” de calcular: Cuando se utilizan pesos, el
cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor.
Problemáticas en los extremos de las series de datosProblemáticas en los extremos de las series de datos
(dada la anchura de la ventana, no se pueden(dada la anchura de la ventana, no se pueden
extender hasta el final de la serie, que suele ser loextender hasta el final de la serie, que suele ser lo
más interesante).más interesante).
No se pueden definir fuera de la serie temporal, por loNo se pueden definir fuera de la serie temporal, por lo
que no se pueden utilizar para realizar predicciones.que no se pueden utilizar para realizar predicciones.
1414
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial [[exponentialexponential smoothingsmoothing]]
Proporciona un filtrado fácil de calcular,Proporciona un filtrado fácil de calcular,
además evita los problemas de las medias móviles:además evita los problemas de las medias móviles:
Suavizado exponencial simpleSuavizado exponencial simple
(para series sin tendencia ni estacionalidad).(para series sin tendencia ni estacionalidad).
Suavizado exponencial dobleSuavizado exponencial doble
(para series con tendencia pero no estacionalidad).(para series con tendencia pero no estacionalidad).
Suavizado exponencial tripleSuavizado exponencial triple
(para series con tendencia y estacionalidad).(para series con tendencia y estacionalidad).
1515
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial simplesimple
1)1( −−+= iii sxs αα
Los distintos métodos de suavizado exponencialLos distintos métodos de suavizado exponencial
actualizan el resultado del anterior valor con el últimoactualizan el resultado del anterior valor con el último
dato de la serie original (combinando la informacióndato de la serie original (combinando la información
ya disponible con la aportada por el nuevo datoya disponible con la aportada por el nuevo dato
mediante un parámetro, 0<mediante un parámetro, 0<αα<1<1).).
1616
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial simplesimple
¿Por qué se llama suavizado exponencial?¿Por qué se llama suavizado exponencial?
Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos:
Todas las observaciones previas contribuyen al valorTodas las observaciones previas contribuyen al valor
suavizado, pero su contribución se suprime por elsuavizado, pero su contribución se suprime por el
exponente creciente del parámetroexponente creciente del parámetro αα..
1717
ji
i
j
j
i xs −
=
∑ −=
0
)1( αα
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial simplesimple
“Uso” en predicción: Si extendemos el suavizado más“Uso” en predicción: Si extendemos el suavizado más
allá del final de los datos disponibles, la predicción esallá del final de los datos disponibles, la predicción es
extremadamente simple :extremadamente simple :--((
sx =
extremadamente simple :extremadamente simple :--((
Ante la presencia de tendencias, la señal suavizadaAnte la presencia de tendencias, la señal suavizada
tiene ir retrasada con respecto a los datos originalestiene ir retrasada con respecto a los datos originales
salvo que utilicemos un valor desalvo que utilicemos un valor de αα cercano a 1.cercano a 1.
1818
ihi sx =+
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial dobledoble
11
11
)1()(
))(1(
−−
−−
−+−=
+−+=
iiii
iiii
tsst
tsxs
ββ
αα
El suavizado exponencial doble retiene informaciónEl suavizado exponencial doble retiene información
acerca de la tendencia: la señal suavizada sacerca de la tendencia: la señal suavizada sii y lay la
tendencia suavizada ttendencia suavizada tii..
El parámetroEl parámetro ββ se utiliza para realizar un suavizadose utiliza para realizar un suavizado
exponencial sobre la tendencia.exponencial sobre la tendencia. 1919
11 −− iiii
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial dobledoble
“Uso” en predicción:“Uso” en predicción:
Si extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de los
datos disponibles, la predicción es la siguiente:datos disponibles, la predicción es la siguiente:
2020
iihi htsx +=+
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencial tripleSuavizado exponencial triple
((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters))
Una tercera cantidad se utiliza para describir laUna tercera cantidad se utiliza para describir la
estacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativa
según nos interese.según nos interese.
NNOTAOTA::
ppii modela el componente periódico de la señal,modela el componente periódico de la señal,
donde k es el período observado.donde k es el período observado.
2121
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencial tripleSuavizado exponencial triple
((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters))
EESTACIONALIDADSTACIONALIDAD AADITIVADITIVA
tspxs +−+−= ))(1()( αα
2222
hkiiihi
kiiii
iiii
iikiii
phtsx
psxp
tsst
tspxs
+−+
−
−−
−−−
++=
−+−=
−+−=
+−+−=
)1()(
)1()(
))(1()(
11
11
γγ
ββ
αα
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencial tripleSuavizado exponencial triple
((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters))
EESTACIONALIDADSTACIONALIDAD MMULTIPLICATIVAULTIPLICATIVA
ii
i
i ts
p
x
s −− +−+= ))(1( 11αα
2323hkiiihi
ki
i
i
i
iiii
ii
ki
i
phtsx
p
s
x
p
tsst
ts
p
s
+−+
−
−−
−−
−
+=
−+=
−+−=
+−+=
)(
)1(
)1()(
))(1(
11
11
γγ
ββ
αα
Filtrado de series temporalesFiltrado de series temporales
Suavizado exponencialSuavizado exponencial [[exponentialexponential smoothingsmoothing]]
Número mensual de pasajeros (en miles).Número mensual de pasajeros (en miles).
2424
Técnicas de regresiónTécnicas de regresión
La predicción (numérica) es…La predicción (numérica) es…
Similar a la clasificación:Similar a la clasificación:
Se construye un modelo a partir de un conjunto deSe construye un modelo a partir de un conjunto de
entrenamiento.entrenamiento.
Se utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de una
variable (continua u ordenada).variable (continua u ordenada).
Diferente a la clasificación:Diferente a la clasificación:
El modelo define una función continua.El modelo define una función continua.
Método más empleado:Método más empleado: RegresiónRegresión
2525
Técnicas de regresiónTécnicas de regresión
Las técnicas de regresión modelan la relación entreLas técnicas de regresión modelan la relación entre
una o más variables independiente (una o más variables independiente (predictorespredictores))
y una variable dependiente (variable de respuesta).y una variable dependiente (variable de respuesta).
Métodos de regresiónMétodos de regresión
Regresión linealRegresión lineal
Regresión no linealRegresión no lineal
Árboles de regresión (p.ej. CART)Árboles de regresión (p.ej. CART)
……
2626
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
Una única variable independiente:Una única variable independiente:
y =y = ww00 + w+ w11 xx
dondedonde ww ((desplazamientodesplazamiento) y w) y w ((pendientependiente))dondedonde ww00 ((desplazamientodesplazamiento) y w) y w11 ((pendientependiente))
son losson los coeficientescoeficientes dede regresiónregresión..
MétodoMétodo de losde los mínimosmínimos cuadradoscuadrados
((estimaestima lala línealínea rectarecta queque mejormejor sese ajustaajusta a losa los datosdatos):):
2727∑
∑
=
=
−
−−
= ||
1
2
||
1
)(
))((
1 D
i
i
D
i
ii
xx
yyxx
wxwyw
10
−=
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
2828
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
El método de los mínimos cuadrados minimiza la suma
de los cuadrados de los residuos εi (las diferencias
entre las predicciones y los valores observados).
2929
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
¡OJO! Al utilizar regresión lineal, la recta y=f(x) que se
obtiene es distinta a la que obtenemos si x=f(y). 3030
Técnicas de regresiónTécnicas de regresión
Regresión lineal múltipleRegresión lineal múltiple
Varias variables independientes:Varias variables independientes:
y =y = ww00 + w+ w11 xx11+ w+ w22 xx22 + …+ …
ResolubleResoluble porpor métodosmétodos numéricosnuméricos dede optimizaciónoptimización..ResolubleResoluble porpor métodosmétodos numéricosnuméricos dede optimizaciónoptimización..
MuchasMuchas funcionesfunciones nono linealeslineales puedenpueden transformarsetransformarse enen
unauna expresiónexpresión lineal.lineal.
p.ejp.ej.. UnUn modelomodelo dede regresiónregresión polinomialpolinomial
y =y = ww00 + w+ w11 x + wx + w22 xx22 + w+ w33 xx33
puede transformarse en un modelo linealpuede transformarse en un modelo lineal
definiendo las variablesdefiniendo las variables xx22 = x= x22, x, x33= x= x33::
y =y = ww00 + w+ w11 x + wx + w22 xx22 + w+ w33 xx33
3131
Técnicas de regresiónTécnicas de regresión
Regresión linealRegresión lineal
Condiciones necesarias para aplicar regresión lineal:Condiciones necesarias para aplicar regresión lineal:
Obviamente, la muestra ha de ser aleatoria.Obviamente, la muestra ha de ser aleatoria.
El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal.
Fijado un valor de la(s) variable(s) independiente(s),Fijado un valor de la(s) variable(s) independiente(s),
la variable dependiente se distribuye según unala variable dependiente se distribuye según una
distribución normal.distribución normal.
Los errores han de tener la misma varianzaLos errores han de tener la misma varianza
(nube de puntos homogénea).(nube de puntos homogénea).
3232
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
1.1. Mediante un diagrama de dispersión, comprobamosMediante un diagrama de dispersión, comprobamos
visualmente si existe una relación lineal entre lasvisualmente si existe una relación lineal entre las
variables X (variables X (predictorpredictor) e Y (respuesta):) e Y (respuesta):variables X (variables X (predictorpredictor) e Y (respuesta):) e Y (respuesta):
3333
Técnicas de regresiónTécnicas de regresión
Regresión lineal simpleRegresión lineal simple
2.2. Cuantificamos la relación construyendo la recta queCuantificamos la relación construyendo la recta que
resume la dependencia y damos una medida de cómoresume la dependencia y damos una medida de cómo
se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación):
3434
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
r=+1r=+1 Dependencia lineal total en sentido positivoDependencia lineal total en sentido positivo
(cuanto mayor es X, mayor es Y).(cuanto mayor es X, mayor es Y).
r=r=--11 Dependencia lineal total en sentido negativoDependencia lineal total en sentido negativo
(cuanto mayor es X, menor es Y ).(cuanto mayor es X, menor es Y ).
3535
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
r > 0r > 0 Existe una dependencia positiva.Existe una dependencia positiva.
Cuanto más se acerque a 1, mayor es ésta.Cuanto más se acerque a 1, mayor es ésta.
r < 0r < 0 Existe una dependencia negativa.Existe una dependencia negativa.
Cuanto más se acerque aCuanto más se acerque a --1, mayor será.1, mayor será.
r = 0r = 0 No podemos afirmar nada.No podemos afirmar nada.
3636
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
3737
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
3838
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
El cuarteto deEl cuarteto de AnscombeAnscombe
(4 conjuntos de datos con el mismo coeficiente de correlación)(4 conjuntos de datos con el mismo coeficiente de correlación) 3939
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
Ventaja de rVentaja de r
No depende de las unidades usadas en la medición.No depende de las unidades usadas en la medición.
Limitaciones de rLimitaciones de r
Sólo mide dependencia lineal entre las variables.Sólo mide dependencia lineal entre las variables.
¡OJO! La correlación no implica causalidad…¡OJO! La correlación no implica causalidad…
4040
Técnicas de regresiónTécnicas de regresión
Coeficiente de correlaciónCoeficiente de correlación
"Correlation is not causation but it sure is a hint.""Correlation is not causation but it sure is a hint."
---- EdwardEdward TufteTufte 4141
Función deFunción de autocorrelaciónautocorrelación
∑
∑
−
=
+
=
−−
=
k
i
kii
xcon
xx
kc 1 1
))((
)( µ
µµ
4242
∑
∑
∑
=
=
=
=
−
=
i
i
i
i
i
xcon
x
kc
1
1
2
1 1
)(
)( µ
µ
Función deFunción de autocorrelaciónautocorrelación
AutocorrelaciónAutocorrelación para la salida de gas de una calderapara la salida de gas de una caldera
4343
Función deFunción de autocorrelaciónautocorrelación
AutocorrelaciónAutocorrelación en las llamadas a unen las llamadas a un callcall--centercenter
4444
Caso prácticoCaso práctico
Conjunto de datosConjunto de datos
Mediciones de COMediciones de CO22 enen MaunaMauna Loa (Loa (HawaiiHawaii))
Adaptado deAdaptado de PhilippPhilipp K.K. JannertJannert::
“Intermezzo: A Data“Intermezzo: A Data AnalysisAnalysis SessionSession”” [capítulo 6][capítulo 6] 4545
Caso prácticoCaso práctico
A partir de las mediciones mensuales (1959A partir de las mediciones mensuales (1959--1991),1991),
eliminamos las fechas del eje Xeliminamos las fechas del eje X
y hacemos que la serie empiece de cero:y hacemos que la serie empiece de cero:
4646
Caso prácticoCaso práctico
TendenciaTendencia: Apreciamos una tendencia no lineal:: Apreciamos una tendencia no lineal:
Intentamos ajustarla con una función de la formaIntentamos ajustarla con una función de la forma xxkk
Nota: Todas las curvas de ese tipo pasan por (0,0) y (1,1)Nota: Todas las curvas de ese tipo pasan por (0,0) y (1,1)
Con k=2, tenemos 35*(x/350)^2, pero parece queCon k=2, tenemos 35*(x/350)^2, pero parece que
nos hemos pasado…nos hemos pasado… 4747
Caso prácticoCaso práctico
Afinamos un poco más y usamos un valor menor:Afinamos un poco más y usamos un valor menor:
OK!OK!
k=1.35k=1.35
Ajuste de la función f(x) = 35*(x/350)^1.35Ajuste de la función f(x) = 35*(x/350)^1.35 4848
Caso prácticoCaso práctico
Para comprobar que no vamos mal,Para comprobar que no vamos mal,
calculamos los residuos (valor originalcalculamos los residuos (valor original –– aproximación):aproximación):
Residuos del ajuste f(x) = 35*(x/350)^1.35Residuos del ajuste f(x) = 35*(x/350)^1.35
4949
Caso prácticoCaso práctico
Si nuestro ajuste de la tendencia es correcto, losSi nuestro ajuste de la tendencia es correcto, los
residuos no deben exhibir tendencia algunaresiduos no deben exhibir tendencia alguna
(deberían aparecer balanceados en torno a y=0):(deberían aparecer balanceados en torno a y=0):
Suavizamos los residuos para comprobar si aún existeSuavizamos los residuos para comprobar si aún existe
algún tipo de tendencia en los residuos…algún tipo de tendencia en los residuos… 5050
Caso prácticoCaso práctico
EstacionalidadEstacionalidad::
Apreciamos una periodicidad anual (cada 12 valores)Apreciamos una periodicidad anual (cada 12 valores)
Ajustamos con una funciónAjustamos con una función senoidadsenoidad 3*sin(2*pi*x/12)3*sin(2*pi*x/12)
5151
Caso prácticoCaso práctico
Calculamos los residuos tras nuestras aproximacionesCalculamos los residuos tras nuestras aproximaciones
(valor original(valor original –– tendenciatendencia –– estacionalidad)estacionalidad)
5252
Caso prácticoCaso práctico
En la figura anterior no se ve mucho… hacemos zoom:En la figura anterior no se ve mucho… hacemos zoom:
Se sigue apreciando cierta periodicidad, por lo queSe sigue apreciando cierta periodicidad, por lo que
usamos un segundo armónicousamos un segundo armónico --0.75*sin(2*pi*x/6)0.75*sin(2*pi*x/6)
5353
Caso prácticoCaso práctico
Residuos tras eliminar la tendencia y los dos primerosResiduos tras eliminar la tendencia y los dos primeros
armónicos correspondientes a la estacionalidad:armónicos correspondientes a la estacionalidad:
5454
Caso prácticoCaso práctico
Añadimos líneas que nos ayuden a ver si los residuosAñadimos líneas que nos ayuden a ver si los residuos
están sesgados:están sesgados:
Parece sesgado hacia arriba,Parece sesgado hacia arriba,
por lo que añadimos un desplazamiento de +0.1por lo que añadimos un desplazamiento de +0.1 5555
Caso prácticoCaso práctico
Los residuos de nuestra aproximación final:Los residuos de nuestra aproximación final:
f(x) = 315 + 35*(x/350)**1.35f(x) = 315 + 35*(x/350)**1.35
+ 3*sin(2*pi*x/12)+ 3*sin(2*pi*x/12) –– 0.75*sin(2*pi*x/6)0.75*sin(2*pi*x/6)
+ 0.1+ 0.1 5656
Caso prácticoCaso práctico
El ajuste que hemos realizado (1959El ajuste que hemos realizado (1959--1990):1990):
5757
Caso prácticoCaso práctico
Nuestra predicción del futuro (1991Nuestra predicción del futuro (1991--2010)2010)
5858
Más técnicas de análisisMás técnicas de análisis
ForecastingForecasting
http://en.wikipedia.org/wiki/Forecastinghttp://en.wikipedia.org/wiki/Forecasting
5959
JiaweiJiawei HanHan
&& MichelineMicheline KamberKamber::
DataData MiningMining::
ConceptsConcepts andand TechniquesTechniques [8.2][8.2]
MorganMorgan KaufmannKaufmann, 2006., 2006.
BibliografíaBibliografía
MorganMorgan KaufmannKaufmann, 2006., 2006.
ISBN 1558609016ISBN 1558609016
PhilippPhilipp K.K. JanertJanert::
DataData AnalysisAnalysis
withwith OpenOpen SourceSource ToolsTools [[PartPart I]I]
O’ReillyO’Reilly, 2010., 2010.
ISBN 0596802358ISBN 0596802358 6060

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

MODELO ARIMA - UPT - ECONOMETRIA - HUMBERTO ESPADA SANCHEZ
MODELO ARIMA - UPT - ECONOMETRIA - HUMBERTO ESPADA SANCHEZMODELO ARIMA - UPT - ECONOMETRIA - HUMBERTO ESPADA SANCHEZ
MODELO ARIMA - UPT - ECONOMETRIA - HUMBERTO ESPADA SANCHEZ
 
Series temporales 1
Series temporales 1Series temporales 1
Series temporales 1
 
Control i-introducción-1
Control i-introducción-1Control i-introducción-1
Control i-introducción-1
 
dinamica
 dinamica dinamica
dinamica
 
Liites y continuidad
Liites y continuidadLiites y continuidad
Liites y continuidad
 
Método grafico4
Método grafico4Método grafico4
Método grafico4
 
2 derivadas max y min
2   derivadas max y min2   derivadas max y min
2 derivadas max y min
 
Capítulo v cointegración
Capítulo v cointegraciónCapítulo v cointegración
Capítulo v cointegración
 
Capítulo iv econometría var
Capítulo iv econometría varCapítulo iv econometría var
Capítulo iv econometría var
 
3 eso funciones-y_graficas
3 eso funciones-y_graficas3 eso funciones-y_graficas
3 eso funciones-y_graficas
 
Metodo grafico
Metodo graficoMetodo grafico
Metodo grafico
 
Modelado y Estudio de un Sistema Dinámico de Primer Orden
Modelado y Estudio de un Sistema Dinámico de Primer OrdenModelado y Estudio de un Sistema Dinámico de Primer Orden
Modelado y Estudio de un Sistema Dinámico de Primer Orden
 
modelo matematico
modelo matematicomodelo matematico
modelo matematico
 
Series detiempo
Series detiempoSeries detiempo
Series detiempo
 
MATEMATICAS IV- CALCULO DIFERENCIAL, UNIDAD 3
MATEMATICAS IV- CALCULO DIFERENCIAL, UNIDAD 3MATEMATICAS IV- CALCULO DIFERENCIAL, UNIDAD 3
MATEMATICAS IV- CALCULO DIFERENCIAL, UNIDAD 3
 
Tema i aplicaciones de la derivada matematica i uney
Tema i aplicaciones de la derivada matematica i uneyTema i aplicaciones de la derivada matematica i uney
Tema i aplicaciones de la derivada matematica i uney
 
Tema i las derivadas matematica i uney
Tema i las derivadas matematica i uneyTema i las derivadas matematica i uney
Tema i las derivadas matematica i uney
 
Modelos de sistemas
Modelos de sistemasModelos de sistemas
Modelos de sistemas
 
control automatico
control automaticocontrol automatico
control automatico
 
Nyquist
NyquistNyquist
Nyquist
 

Similar a Analisis de series temporales

Keepler | Series temporales en analítica de datos
Keepler | Series temporales en analítica de datosKeepler | Series temporales en analítica de datos
Keepler | Series temporales en analítica de datosKeepler Data Tech
 
Graficos de control
Graficos de controlGraficos de control
Graficos de controlbaalamponce
 
Serie Cronológica y Modelos de Pronósticos
Serie Cronológica y Modelos de PronósticosSerie Cronológica y Modelos de Pronósticos
Serie Cronológica y Modelos de PronósticosAlexis José González
 
PresentaciónSemanaIIIesentaciónSemanaIII
PresentaciónSemanaIIIesentaciónSemanaIIIPresentaciónSemanaIIIesentaciónSemanaIII
PresentaciónSemanaIIIesentaciónSemanaIIIandres1108ruiz
 
Revista Futuro en el Presente.
Revista Futuro en el Presente.Revista Futuro en el Presente.
Revista Futuro en el Presente.AnasDazCortez
 
Analisis de Sencibilidad
Analisis de SencibilidadAnalisis de Sencibilidad
Analisis de Sencibilidadmichaz
 
Control estadístico de procesos
Control estadístico de procesosControl estadístico de procesos
Control estadístico de procesosDaniel Remondegui
 
Gráficas de las funciones polinomiales y mas
Gráficas de las funciones polinomiales y masGráficas de las funciones polinomiales y mas
Gráficas de las funciones polinomiales y mashsmorillor
 
Estadística y probabilidades cap i y ii
Estadística y probabilidades cap i y iiEstadística y probabilidades cap i y ii
Estadística y probabilidades cap i y iiFernanda Huaman Sobrado
 
Programacion Dinamica Intro
Programacion Dinamica IntroProgramacion Dinamica Intro
Programacion Dinamica Introfolken22
 
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD L...
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD  L...REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD  L...
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD L...Fundación Universitaria Konrad Lorenz
 

Similar a Analisis de series temporales (20)

D.Actividad
D.ActividadD.Actividad
D.Actividad
 
Keepler | Series temporales en analítica de datos
Keepler | Series temporales en analítica de datosKeepler | Series temporales en analítica de datos
Keepler | Series temporales en analítica de datos
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Graficos de control
Graficos de controlGraficos de control
Graficos de control
 
Econometria
EconometriaEconometria
Econometria
 
Serie Cronológica y Modelos de Pronósticos
Serie Cronológica y Modelos de PronósticosSerie Cronológica y Modelos de Pronósticos
Serie Cronológica y Modelos de Pronósticos
 
PresentaciónSemanaIIIesentaciónSemanaIII
PresentaciónSemanaIIIesentaciónSemanaIIIPresentaciónSemanaIIIesentaciónSemanaIII
PresentaciónSemanaIIIesentaciónSemanaIII
 
Revista Futuro en el Presente.
Revista Futuro en el Presente.Revista Futuro en el Presente.
Revista Futuro en el Presente.
 
Analisis de Sencibilidad
Analisis de SencibilidadAnalisis de Sencibilidad
Analisis de Sencibilidad
 
Control estadístico de procesos
Control estadístico de procesosControl estadístico de procesos
Control estadístico de procesos
 
Cap7
Cap7Cap7
Cap7
 
Gráficas de las funciones polinomiales y mas
Gráficas de las funciones polinomiales y masGráficas de las funciones polinomiales y mas
Gráficas de las funciones polinomiales y mas
 
Cinematica
CinematicaCinematica
Cinematica
 
UNIDAD TEMÁTICA 5.pdf
UNIDAD TEMÁTICA 5.pdfUNIDAD TEMÁTICA 5.pdf
UNIDAD TEMÁTICA 5.pdf
 
Estadística y probabilidades cap i y ii
Estadística y probabilidades cap i y iiEstadística y probabilidades cap i y ii
Estadística y probabilidades cap i y ii
 
Programacion Dinamica Intro
Programacion Dinamica IntroProgramacion Dinamica Intro
Programacion Dinamica Intro
 
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD L...
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD  L...REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD  L...
REGRESION SIMBOLICA Y PROGRAMACIÓN GENETICA FUNDACIÓN UNIVERSITARIA KONRAD L...
 
Control no lineal
Control no linealControl no lineal
Control no lineal
 
As3 unidad 7 arrelos y ciclos
As3 unidad 7 arrelos y ciclosAs3 unidad 7 arrelos y ciclos
As3 unidad 7 arrelos y ciclos
 
Frecuencia
FrecuenciaFrecuencia
Frecuencia
 

Más de Romulo Sevilla

Induccion primeros auxilios
Induccion primeros auxilios Induccion primeros auxilios
Induccion primeros auxilios Romulo Sevilla
 
Tipos de-invESTIGACION
Tipos de-invESTIGACIONTipos de-invESTIGACION
Tipos de-invESTIGACIONRomulo Sevilla
 
Comprimido economia cuba_
Comprimido economia cuba_Comprimido economia cuba_
Comprimido economia cuba_Romulo Sevilla
 

Más de Romulo Sevilla (6)

1er parcial funciones
1er parcial funciones1er parcial funciones
1er parcial funciones
 
Induccion primeros auxilios
Induccion primeros auxilios Induccion primeros auxilios
Induccion primeros auxilios
 
Tipos de-invESTIGACION
Tipos de-invESTIGACIONTipos de-invESTIGACION
Tipos de-invESTIGACION
 
limites continuidad
limites continuidadlimites continuidad
limites continuidad
 
Respuestas.ejercicios
Respuestas.ejerciciosRespuestas.ejercicios
Respuestas.ejercicios
 
Comprimido economia cuba_
Comprimido economia cuba_Comprimido economia cuba_
Comprimido economia cuba_
 

Último

Moda colonial de 1810 donde podemos ver las distintas prendas
Moda colonial de 1810 donde podemos ver las distintas prendasModa colonial de 1810 donde podemos ver las distintas prendas
Moda colonial de 1810 donde podemos ver las distintas prendasMorenaVictorero1
 
Matemáticas Aplicadas usando Python
Matemáticas Aplicadas   usando    PythonMatemáticas Aplicadas   usando    Python
Matemáticas Aplicadas usando PythonErnesto Crespo
 
el amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptxel amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptxhectoralvarado79
 
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdfHobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdffrank0071
 
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docxPRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docxAlexandraNeryHuamanM2
 
Pelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibrasPelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibrasPaola Rodríguez
 
IAAS- EPIDEMIOLOGIA. antisepcsia, desinfección, epp
IAAS-  EPIDEMIOLOGIA. antisepcsia, desinfección, eppIAAS-  EPIDEMIOLOGIA. antisepcsia, desinfección, epp
IAAS- EPIDEMIOLOGIA. antisepcsia, desinfección, eppCatalinaSezCrdenas
 
2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animales2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animalesAndreaVillamar8
 
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...Champs Elysee Roldan
 
CASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptxCASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptx4bsbmpg98x
 
La señal de los higos buenos y los higos malos
La señal de los higos buenos y los higos malosLa señal de los higos buenos y los higos malos
La señal de los higos buenos y los higos malosDomingoAlbertoCorpor1
 
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...frank0071
 
La Célula, unidad fundamental de la vida
La Célula, unidad fundamental de la vidaLa Célula, unidad fundamental de la vida
La Célula, unidad fundamental de la vidaMaraJosQuiroz2
 
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdfSEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdfPC0121
 
Glaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdfGlaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdffrank0071
 
Mapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdfMapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdfoliverjverde
 
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...frank0071
 
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)s.calleja
 
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPerfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPieroalex1
 

Último (20)

Moda colonial de 1810 donde podemos ver las distintas prendas
Moda colonial de 1810 donde podemos ver las distintas prendasModa colonial de 1810 donde podemos ver las distintas prendas
Moda colonial de 1810 donde podemos ver las distintas prendas
 
Matemáticas Aplicadas usando Python
Matemáticas Aplicadas   usando    PythonMatemáticas Aplicadas   usando    Python
Matemáticas Aplicadas usando Python
 
el amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptxel amor en los tiempos del colera (resumen).pptx
el amor en los tiempos del colera (resumen).pptx
 
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdfHobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
Hobson, John A. - Estudio del imperialismo [ocr] [1902] [1981].pdf
 
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docxPRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
 
Pelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibrasPelos y fibras. Criminalistica pelos y fibras
Pelos y fibras. Criminalistica pelos y fibras
 
IAAS- EPIDEMIOLOGIA. antisepcsia, desinfección, epp
IAAS-  EPIDEMIOLOGIA. antisepcsia, desinfección, eppIAAS-  EPIDEMIOLOGIA. antisepcsia, desinfección, epp
IAAS- EPIDEMIOLOGIA. antisepcsia, desinfección, epp
 
2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animales2. Hormonas y Ciclo estral de los animales
2. Hormonas y Ciclo estral de los animales
 
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
1890 –7 de junio - Henry Marmaduke Harris obtuvo una patente británica (Nº 88...
 
CASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptxCASO CLÍNICO INFECCIONES Y TUMORES.pptx
CASO CLÍNICO INFECCIONES Y TUMORES.pptx
 
La señal de los higos buenos y los higos malos
La señal de los higos buenos y los higos malosLa señal de los higos buenos y los higos malos
La señal de los higos buenos y los higos malos
 
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...
Schuster, Nicole. - La metrópolis y la arquitectura del poder ayer hoy y mana...
 
La biodiversidad de Guanajuato (resumen)
La biodiversidad de Guanajuato (resumen)La biodiversidad de Guanajuato (resumen)
La biodiversidad de Guanajuato (resumen)
 
La Célula, unidad fundamental de la vida
La Célula, unidad fundamental de la vidaLa Célula, unidad fundamental de la vida
La Célula, unidad fundamental de la vida
 
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdfSEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
SEGUNDAS VANGUARDIAS ARTÍSTICAS DEL SIGLO XX.pdf
 
Glaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdfGlaeser, E. - El triunfo de las ciudades [2011].pdf
Glaeser, E. - El triunfo de las ciudades [2011].pdf
 
Mapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdfMapa Conceptual Modelos de Comunicación .pdf
Mapa Conceptual Modelos de Comunicación .pdf
 
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
Flores Galindo, A. - La ciudad sumergida. Aristocracia y plebe en Lima, 1760-...
 
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
Ensayo ENRICH (sesión clínica, Servicio de Neurología HUCA)
 
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdfPerfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
Perfiles NEUROPSI Atención y Memoria 6 a 85 Años (AyM).pdf
 

Analisis de series temporales

  • 1. Análisis de series temporalesAnálisis de series temporales © Fernando Berzal,© Fernando Berzal, berzal@acm.orgberzal@acm.org Análisis de series temporalesAnálisis de series temporales Características de las series temporalesCaracterísticas de las series temporales Visualización de series temporalesVisualización de series temporales Filtrado de series temporalesFiltrado de series temporales Medias móvilesMedias móviles Suavizado exponencialSuavizado exponencialSuavizado exponencialSuavizado exponencial Técnicas de regresiónTécnicas de regresión Regresión linealRegresión lineal Coeficiente de correlación deCoeficiente de correlación de PearsonPearson Función deFunción de autocorrelaciónautocorrelación Caso práctico: Una sesión de análisisCaso práctico: Una sesión de análisis 11
  • 2. CaracterísticasCaracterísticas TendenciasTendencias Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos)Estacionalidad (comportamientos periódicos) RuidoRuido Otros, p.ej. cambios bruscos de comportamientoOtros, p.ej. cambios bruscos de comportamiento 22 EjemplosEjemplos Tendencia y estacionalidadTendencia y estacionalidad Concentración de COConcentración de CO22 medida en el observatorio demedida en el observatorio de MaunaMauna Loa,Loa, HawaiiHawaii.. 33
  • 3. EjemplosEjemplos Variación “suave” pero sin tendencia a largo plazoVariación “suave” pero sin tendencia a largo plazo Concentración de gas a la salida de una calderaConcentración de gas a la salida de una caldera 44 EjemplosEjemplos Tendencia no linealTendencia no lineal Coste de llamadas telefónicas de larga distancia (USA)Coste de llamadas telefónicas de larga distancia (USA) 55
  • 4. EjemplosEjemplos Cambios “bruscos” de comportamientoCambios “bruscos” de comportamiento ÍndiceÍndice NikkeiNikkei (Bolsa de(Bolsa de TokyoTokyo)) 66 EjemplosEjemplos Conjuntos de datos reales…Conjuntos de datos reales… Estacionalidad a corto y largo plazo,Estacionalidad a corto y largo plazo, posibles cambios de comportamientoposibles cambios de comportamiento y ruidoy ruido Llamadas diariasLlamadas diarias a una un callcall--centercenter 77
  • 5. VisualizaciónVisualización Número anual de manchas solares durante 300 añosNúmero anual de manchas solares durante 300 años Una relación de aspecto incorrectaUna relación de aspecto incorrecta hace difícil reconocer los detalles de cada ciclo.hace difícil reconocer los detalles de cada ciclo. 88 VisualizaciónVisualización BankingBanking [[BankingBanking toto 4545 degreesdegrees]] Los cambios casi verticales de la figura anterior nosLos cambios casi verticales de la figura anterior nos cuesta trabajo apreciarlos. Sin embargo, reconocemoscuesta trabajo apreciarlos. Sin embargo, reconocemos mejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan conmejor los cambios en una serie cuando se dibujan con un ángulo de 45º:un ángulo de 45º: Ahora podemos apreciar que las “subidas” son másAhora podemos apreciar que las “subidas” son más rápidas que las bajadas, aunque la figura es tanrápidas que las bajadas, aunque la figura es tan pequeña que apenas se pueden analizar detalles…pequeña que apenas se pueden analizar detalles… 99
  • 6. VisualizaciónVisualización StackingStacking Dividiendo el eje temporal en 3 fragmentos,Dividiendo el eje temporal en 3 fragmentos, mantenemos el “mantenemos el “bankingbanking” y generar un gráfico con” y generar un gráfico con unas dimensiones más razonables (p.ej. 4:3).unas dimensiones más razonables (p.ej. 4:3). 1010 Filtrado de series temporalesFiltrado de series temporales Medias móvilesMedias móviles [[movingmoving averagesaverages]] IIDEADEA:: Reemplazar el punto central de una serie de unReemplazar el punto central de una serie de un número impar de números consecutivos por su medianúmero impar de números consecutivos por su media aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”).aritmética (filtro “paso bajo”). 1111 ∑−= + + = k kj jii x k s 12 1
  • 7. Filtrado de series temporalesFiltrado de series temporales Medias móvilesMedias móviles [[movingmoving averagesaverages]] PPROBLEMAROBLEMA:: La presencia de un pico en la ventana [iLa presencia de un pico en la ventana [i--k,k, i+ki+k] distorsiona la media móvil.] distorsiona la media móvil. PPOSIBLEOSIBLE SOLUCIÓNSOLUCIÓN:: Utilización de pesos (menores en losUtilización de pesos (menores en los extremos de la ventana).extremos de la ventana). Ejemplos:Ejemplos: GaussianaGaussiana, ventana de, ventana de HammingHamming…… http://en.wikipedia.org/wiki/Window_function#Hann_windowhttp://en.wikipedia.org/wiki/Window_function#Hann_window 1212 ∑ ∑−= −= + == k kj k kj jjiji wdondexws 1 Filtrado de series temporalesFiltrado de series temporales Medias móvilesMedias móviles [[movingmoving averagesaverages]] k=5k=5 1313
  • 8. Filtrado de series temporalesFiltrado de series temporales Medias móvilesMedias móviles [[movingmoving averagesaverages]] Limitaciones de las medias móviles:Limitaciones de las medias móviles: “Costosas” de calcular: Cuando se utilizan pesos, el“Costosas” de calcular: Cuando se utilizan pesos, el cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor.cálculo hay que hacerlo desde cero para cada valor. Problemáticas en los extremos de las series de datosProblemáticas en los extremos de las series de datos (dada la anchura de la ventana, no se pueden(dada la anchura de la ventana, no se pueden extender hasta el final de la serie, que suele ser loextender hasta el final de la serie, que suele ser lo más interesante).más interesante). No se pueden definir fuera de la serie temporal, por loNo se pueden definir fuera de la serie temporal, por lo que no se pueden utilizar para realizar predicciones.que no se pueden utilizar para realizar predicciones. 1414 Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial [[exponentialexponential smoothingsmoothing]] Proporciona un filtrado fácil de calcular,Proporciona un filtrado fácil de calcular, además evita los problemas de las medias móviles:además evita los problemas de las medias móviles: Suavizado exponencial simpleSuavizado exponencial simple (para series sin tendencia ni estacionalidad).(para series sin tendencia ni estacionalidad). Suavizado exponencial dobleSuavizado exponencial doble (para series con tendencia pero no estacionalidad).(para series con tendencia pero no estacionalidad). Suavizado exponencial tripleSuavizado exponencial triple (para series con tendencia y estacionalidad).(para series con tendencia y estacionalidad). 1515
  • 9. Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial simplesimple 1)1( −−+= iii sxs αα Los distintos métodos de suavizado exponencialLos distintos métodos de suavizado exponencial actualizan el resultado del anterior valor con el últimoactualizan el resultado del anterior valor con el último dato de la serie original (combinando la informacióndato de la serie original (combinando la información ya disponible con la aportada por el nuevo datoya disponible con la aportada por el nuevo dato mediante un parámetro, 0<mediante un parámetro, 0<αα<1<1).). 1616 Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial simplesimple ¿Por qué se llama suavizado exponencial?¿Por qué se llama suavizado exponencial? Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos:Si expandimos la recurrencia, obtenemos: Todas las observaciones previas contribuyen al valorTodas las observaciones previas contribuyen al valor suavizado, pero su contribución se suprime por elsuavizado, pero su contribución se suprime por el exponente creciente del parámetroexponente creciente del parámetro αα.. 1717 ji i j j i xs − = ∑ −= 0 )1( αα
  • 10. Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial simplesimple “Uso” en predicción: Si extendemos el suavizado más“Uso” en predicción: Si extendemos el suavizado más allá del final de los datos disponibles, la predicción esallá del final de los datos disponibles, la predicción es extremadamente simple :extremadamente simple :--(( sx = extremadamente simple :extremadamente simple :--(( Ante la presencia de tendencias, la señal suavizadaAnte la presencia de tendencias, la señal suavizada tiene ir retrasada con respecto a los datos originalestiene ir retrasada con respecto a los datos originales salvo que utilicemos un valor desalvo que utilicemos un valor de αα cercano a 1.cercano a 1. 1818 ihi sx =+ Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial dobledoble 11 11 )1()( ))(1( −− −− −+−= +−+= iiii iiii tsst tsxs ββ αα El suavizado exponencial doble retiene informaciónEl suavizado exponencial doble retiene información acerca de la tendencia: la señal suavizada sacerca de la tendencia: la señal suavizada sii y lay la tendencia suavizada ttendencia suavizada tii.. El parámetroEl parámetro ββ se utiliza para realizar un suavizadose utiliza para realizar un suavizado exponencial sobre la tendencia.exponencial sobre la tendencia. 1919 11 −− iiii
  • 11. Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial dobledoble “Uso” en predicción:“Uso” en predicción: Si extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de losSi extendemos el suavizado más allá del final de los datos disponibles, la predicción es la siguiente:datos disponibles, la predicción es la siguiente: 2020 iihi htsx +=+ Filtrado de series temporalesFiltrado de series temporales Suavizado exponencial tripleSuavizado exponencial triple ((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters)) Una tercera cantidad se utiliza para describir laUna tercera cantidad se utiliza para describir la estacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativaestacionalidad, que puede ser aditiva o multiplicativa según nos interese.según nos interese. NNOTAOTA:: ppii modela el componente periódico de la señal,modela el componente periódico de la señal, donde k es el período observado.donde k es el período observado. 2121
  • 12. Filtrado de series temporalesFiltrado de series temporales Suavizado exponencial tripleSuavizado exponencial triple ((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters)) EESTACIONALIDADSTACIONALIDAD AADITIVADITIVA tspxs +−+−= ))(1()( αα 2222 hkiiihi kiiii iiii iikiii phtsx psxp tsst tspxs +−+ − −− −−− ++= −+−= −+−= +−+−= )1()( )1()( ))(1()( 11 11 γγ ββ αα Filtrado de series temporalesFiltrado de series temporales Suavizado exponencial tripleSuavizado exponencial triple ((a.k.a.a.k.a. método demétodo de HoltHolt--WintersWinters)) EESTACIONALIDADSTACIONALIDAD MMULTIPLICATIVAULTIPLICATIVA ii i i ts p x s −− +−+= ))(1( 11αα 2323hkiiihi ki i i i iiii ii ki i phtsx p s x p tsst ts p s +−+ − −− −− − += −+= −+−= +−+= )( )1( )1()( ))(1( 11 11 γγ ββ αα
  • 13. Filtrado de series temporalesFiltrado de series temporales Suavizado exponencialSuavizado exponencial [[exponentialexponential smoothingsmoothing]] Número mensual de pasajeros (en miles).Número mensual de pasajeros (en miles). 2424 Técnicas de regresiónTécnicas de regresión La predicción (numérica) es…La predicción (numérica) es… Similar a la clasificación:Similar a la clasificación: Se construye un modelo a partir de un conjunto deSe construye un modelo a partir de un conjunto de entrenamiento.entrenamiento. Se utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de unaSe utiliza el modelo para predecir el valor de una variable (continua u ordenada).variable (continua u ordenada). Diferente a la clasificación:Diferente a la clasificación: El modelo define una función continua.El modelo define una función continua. Método más empleado:Método más empleado: RegresiónRegresión 2525
  • 14. Técnicas de regresiónTécnicas de regresión Las técnicas de regresión modelan la relación entreLas técnicas de regresión modelan la relación entre una o más variables independiente (una o más variables independiente (predictorespredictores)) y una variable dependiente (variable de respuesta).y una variable dependiente (variable de respuesta). Métodos de regresiónMétodos de regresión Regresión linealRegresión lineal Regresión no linealRegresión no lineal Árboles de regresión (p.ej. CART)Árboles de regresión (p.ej. CART) …… 2626 Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple Una única variable independiente:Una única variable independiente: y =y = ww00 + w+ w11 xx dondedonde ww ((desplazamientodesplazamiento) y w) y w ((pendientependiente))dondedonde ww00 ((desplazamientodesplazamiento) y w) y w11 ((pendientependiente)) son losson los coeficientescoeficientes dede regresiónregresión.. MétodoMétodo de losde los mínimosmínimos cuadradoscuadrados ((estimaestima lala línealínea rectarecta queque mejormejor sese ajustaajusta a losa los datosdatos):): 2727∑ ∑ = = − −− = || 1 2 || 1 )( ))(( 1 D i i D i ii xx yyxx wxwyw 10 −=
  • 15. Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple 2828 Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple El método de los mínimos cuadrados minimiza la suma de los cuadrados de los residuos εi (las diferencias entre las predicciones y los valores observados). 2929
  • 16. Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple ¡OJO! Al utilizar regresión lineal, la recta y=f(x) que se obtiene es distinta a la que obtenemos si x=f(y). 3030 Técnicas de regresiónTécnicas de regresión Regresión lineal múltipleRegresión lineal múltiple Varias variables independientes:Varias variables independientes: y =y = ww00 + w+ w11 xx11+ w+ w22 xx22 + …+ … ResolubleResoluble porpor métodosmétodos numéricosnuméricos dede optimizaciónoptimización..ResolubleResoluble porpor métodosmétodos numéricosnuméricos dede optimizaciónoptimización.. MuchasMuchas funcionesfunciones nono linealeslineales puedenpueden transformarsetransformarse enen unauna expresiónexpresión lineal.lineal. p.ejp.ej.. UnUn modelomodelo dede regresiónregresión polinomialpolinomial y =y = ww00 + w+ w11 x + wx + w22 xx22 + w+ w33 xx33 puede transformarse en un modelo linealpuede transformarse en un modelo lineal definiendo las variablesdefiniendo las variables xx22 = x= x22, x, x33= x= x33:: y =y = ww00 + w+ w11 x + wx + w22 xx22 + w+ w33 xx33 3131
  • 17. Técnicas de regresiónTécnicas de regresión Regresión linealRegresión lineal Condiciones necesarias para aplicar regresión lineal:Condiciones necesarias para aplicar regresión lineal: Obviamente, la muestra ha de ser aleatoria.Obviamente, la muestra ha de ser aleatoria. El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal.El tipo de dependencia descrita ha de ser lineal. Fijado un valor de la(s) variable(s) independiente(s),Fijado un valor de la(s) variable(s) independiente(s), la variable dependiente se distribuye según unala variable dependiente se distribuye según una distribución normal.distribución normal. Los errores han de tener la misma varianzaLos errores han de tener la misma varianza (nube de puntos homogénea).(nube de puntos homogénea). 3232 Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple 1.1. Mediante un diagrama de dispersión, comprobamosMediante un diagrama de dispersión, comprobamos visualmente si existe una relación lineal entre lasvisualmente si existe una relación lineal entre las variables X (variables X (predictorpredictor) e Y (respuesta):) e Y (respuesta):variables X (variables X (predictorpredictor) e Y (respuesta):) e Y (respuesta): 3333
  • 18. Técnicas de regresiónTécnicas de regresión Regresión lineal simpleRegresión lineal simple 2.2. Cuantificamos la relación construyendo la recta queCuantificamos la relación construyendo la recta que resume la dependencia y damos una medida de cómoresume la dependencia y damos una medida de cómo se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación):se ajusta la recta a los datos (correlación): 3434 Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación r=+1r=+1 Dependencia lineal total en sentido positivoDependencia lineal total en sentido positivo (cuanto mayor es X, mayor es Y).(cuanto mayor es X, mayor es Y). r=r=--11 Dependencia lineal total en sentido negativoDependencia lineal total en sentido negativo (cuanto mayor es X, menor es Y ).(cuanto mayor es X, menor es Y ). 3535
  • 19. Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación r > 0r > 0 Existe una dependencia positiva.Existe una dependencia positiva. Cuanto más se acerque a 1, mayor es ésta.Cuanto más se acerque a 1, mayor es ésta. r < 0r < 0 Existe una dependencia negativa.Existe una dependencia negativa. Cuanto más se acerque aCuanto más se acerque a --1, mayor será.1, mayor será. r = 0r = 0 No podemos afirmar nada.No podemos afirmar nada. 3636 Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación 3737
  • 20. Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación 3838 Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación El cuarteto deEl cuarteto de AnscombeAnscombe (4 conjuntos de datos con el mismo coeficiente de correlación)(4 conjuntos de datos con el mismo coeficiente de correlación) 3939
  • 21. Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación Ventaja de rVentaja de r No depende de las unidades usadas en la medición.No depende de las unidades usadas en la medición. Limitaciones de rLimitaciones de r Sólo mide dependencia lineal entre las variables.Sólo mide dependencia lineal entre las variables. ¡OJO! La correlación no implica causalidad…¡OJO! La correlación no implica causalidad… 4040 Técnicas de regresiónTécnicas de regresión Coeficiente de correlaciónCoeficiente de correlación "Correlation is not causation but it sure is a hint.""Correlation is not causation but it sure is a hint." ---- EdwardEdward TufteTufte 4141
  • 22. Función deFunción de autocorrelaciónautocorrelación ∑ ∑ − = + = −− = k i kii xcon xx kc 1 1 ))(( )( µ µµ 4242 ∑ ∑ ∑ = = = = − = i i i i i xcon x kc 1 1 2 1 1 )( )( µ µ Función deFunción de autocorrelaciónautocorrelación AutocorrelaciónAutocorrelación para la salida de gas de una calderapara la salida de gas de una caldera 4343
  • 23. Función deFunción de autocorrelaciónautocorrelación AutocorrelaciónAutocorrelación en las llamadas a unen las llamadas a un callcall--centercenter 4444 Caso prácticoCaso práctico Conjunto de datosConjunto de datos Mediciones de COMediciones de CO22 enen MaunaMauna Loa (Loa (HawaiiHawaii)) Adaptado deAdaptado de PhilippPhilipp K.K. JannertJannert:: “Intermezzo: A Data“Intermezzo: A Data AnalysisAnalysis SessionSession”” [capítulo 6][capítulo 6] 4545
  • 24. Caso prácticoCaso práctico A partir de las mediciones mensuales (1959A partir de las mediciones mensuales (1959--1991),1991), eliminamos las fechas del eje Xeliminamos las fechas del eje X y hacemos que la serie empiece de cero:y hacemos que la serie empiece de cero: 4646 Caso prácticoCaso práctico TendenciaTendencia: Apreciamos una tendencia no lineal:: Apreciamos una tendencia no lineal: Intentamos ajustarla con una función de la formaIntentamos ajustarla con una función de la forma xxkk Nota: Todas las curvas de ese tipo pasan por (0,0) y (1,1)Nota: Todas las curvas de ese tipo pasan por (0,0) y (1,1) Con k=2, tenemos 35*(x/350)^2, pero parece queCon k=2, tenemos 35*(x/350)^2, pero parece que nos hemos pasado…nos hemos pasado… 4747
  • 25. Caso prácticoCaso práctico Afinamos un poco más y usamos un valor menor:Afinamos un poco más y usamos un valor menor: OK!OK! k=1.35k=1.35 Ajuste de la función f(x) = 35*(x/350)^1.35Ajuste de la función f(x) = 35*(x/350)^1.35 4848 Caso prácticoCaso práctico Para comprobar que no vamos mal,Para comprobar que no vamos mal, calculamos los residuos (valor originalcalculamos los residuos (valor original –– aproximación):aproximación): Residuos del ajuste f(x) = 35*(x/350)^1.35Residuos del ajuste f(x) = 35*(x/350)^1.35 4949
  • 26. Caso prácticoCaso práctico Si nuestro ajuste de la tendencia es correcto, losSi nuestro ajuste de la tendencia es correcto, los residuos no deben exhibir tendencia algunaresiduos no deben exhibir tendencia alguna (deberían aparecer balanceados en torno a y=0):(deberían aparecer balanceados en torno a y=0): Suavizamos los residuos para comprobar si aún existeSuavizamos los residuos para comprobar si aún existe algún tipo de tendencia en los residuos…algún tipo de tendencia en los residuos… 5050 Caso prácticoCaso práctico EstacionalidadEstacionalidad:: Apreciamos una periodicidad anual (cada 12 valores)Apreciamos una periodicidad anual (cada 12 valores) Ajustamos con una funciónAjustamos con una función senoidadsenoidad 3*sin(2*pi*x/12)3*sin(2*pi*x/12) 5151
  • 27. Caso prácticoCaso práctico Calculamos los residuos tras nuestras aproximacionesCalculamos los residuos tras nuestras aproximaciones (valor original(valor original –– tendenciatendencia –– estacionalidad)estacionalidad) 5252 Caso prácticoCaso práctico En la figura anterior no se ve mucho… hacemos zoom:En la figura anterior no se ve mucho… hacemos zoom: Se sigue apreciando cierta periodicidad, por lo queSe sigue apreciando cierta periodicidad, por lo que usamos un segundo armónicousamos un segundo armónico --0.75*sin(2*pi*x/6)0.75*sin(2*pi*x/6) 5353
  • 28. Caso prácticoCaso práctico Residuos tras eliminar la tendencia y los dos primerosResiduos tras eliminar la tendencia y los dos primeros armónicos correspondientes a la estacionalidad:armónicos correspondientes a la estacionalidad: 5454 Caso prácticoCaso práctico Añadimos líneas que nos ayuden a ver si los residuosAñadimos líneas que nos ayuden a ver si los residuos están sesgados:están sesgados: Parece sesgado hacia arriba,Parece sesgado hacia arriba, por lo que añadimos un desplazamiento de +0.1por lo que añadimos un desplazamiento de +0.1 5555
  • 29. Caso prácticoCaso práctico Los residuos de nuestra aproximación final:Los residuos de nuestra aproximación final: f(x) = 315 + 35*(x/350)**1.35f(x) = 315 + 35*(x/350)**1.35 + 3*sin(2*pi*x/12)+ 3*sin(2*pi*x/12) –– 0.75*sin(2*pi*x/6)0.75*sin(2*pi*x/6) + 0.1+ 0.1 5656 Caso prácticoCaso práctico El ajuste que hemos realizado (1959El ajuste que hemos realizado (1959--1990):1990): 5757
  • 30. Caso prácticoCaso práctico Nuestra predicción del futuro (1991Nuestra predicción del futuro (1991--2010)2010) 5858 Más técnicas de análisisMás técnicas de análisis ForecastingForecasting http://en.wikipedia.org/wiki/Forecastinghttp://en.wikipedia.org/wiki/Forecasting 5959
  • 31. JiaweiJiawei HanHan && MichelineMicheline KamberKamber:: DataData MiningMining:: ConceptsConcepts andand TechniquesTechniques [8.2][8.2] MorganMorgan KaufmannKaufmann, 2006., 2006. BibliografíaBibliografía MorganMorgan KaufmannKaufmann, 2006., 2006. ISBN 1558609016ISBN 1558609016 PhilippPhilipp K.K. JanertJanert:: DataData AnalysisAnalysis withwith OpenOpen SourceSource ToolsTools [[PartPart I]I] O’ReillyO’Reilly, 2010., 2010. ISBN 0596802358ISBN 0596802358 6060