Predicciones web a través de
Google Analytics
Un resumen metodológico mediante modelos
ARIMA a través de Gretl
Álvaro Fierro: alvaro.fierro@urbegi.com
Jon Osés: jon.oses@bidenet.com
Objeto del Análisis
• Contrastar una metodología que permita
identificar un modelo que permita predecir
cuántas visitas va a tener una determinada
página web, cuyo nombre omitimos en este
estudio.
• Así, este trabajo excluimos los gráficos de
series temporales, gráfico media- rango,
correlogramas, etc.
Definición del Análisis
-Para tal fin, se utilizan como series históricas los datos que permite
descargar Google Analytics en tres ámbitos objeto de predicciones:
• Sesiones: Es el número total de sesiones que se han realizado en el
periodo. Una sesión es el periodo durante el cual un usuario
interactúa con su sitio web, aplicación, etc. Todos los datos de uso
(visitas a una pantalla, eventos, comercio electrónico, etc.) están
asociados a una sesión.
• Usuarios: Usuarios que han interactuado con la aplicación, incluidos
tanto los usuarios nuevos como los recurrentes
• Número de páginas vistas : Número total de páginas vistas; las
visitas repetidas a una misma página también se contabilizan
(fuente: Google Analytics)
Esquema de Datos
• Se toma la siguiente horquilla temporal:
17/02/2014 – 02/06/2014
• Los datos son de carácter diario
• Se trabajan con 106 observaciones
• La predicción se realiza a una semana vista
Metodología (II)
Etapas del proceso de predicción:
• Análisis de estacionariedad
– Gráfico Serie Temporal
– Gráfico Media-Rango
– FAC y FACP
– Contrastes de raíz unitaria: ADF, Phillips-Perron,
KPSS
• Identificación
– Modelo propuesto
ANÁLISIS DE ESTACIONARIEDAD: Primeros Resultados
• No se tiene muy claro si la serie es estacionaria
en la parte regular, por lo que realizaremos los
diferentes contrastes de existencia de raíz
unitaria.
• En función de los resultados, tomaremos
primeras diferencias regulares o no.
• En cambio, sí se ve claramente una fuerte
estacionalidad. Hay retardos estacionales
claramente significativos y decrecen lentamente;
parece claro que tenemos que tomar diferencias
estacionales.
ANÁLISIS DE ESTACIONARIEDAD: Primeros Resultados
• Para conseguir que la serie se estacionaria en varianza
tomamos logaritmos de la serie original; normalmente esta
transformación estabiliza la varianza e induce
homocedasticidad. Una vez realizado el gráfico media-
rango, se concluye que serie ya es estacionaria en varianza.
• En cuanto a la estacionariedad en media, es necesario
tomar primeras diferencias regulares. Además en contraste
ADF nos indica que no se rechaza la hipótesis nula de
existencia de raíz unitaria.
• La estacionalidad permanece y se ve claramente los
correlogramas de la serie de primeras diferencias de los
logaritmos. Para ello, tomamos diferencias estacionales.
ANÁLISIS DE ESTACIONARIEDAD: Resultados
• Finalmente, la serie de logaritmos con
diferencias regulares y estacionales, es decir:
integrada de orden uno en ambas partes,
regular y estacional I(1,1).
• Esta será, por tanto, la serie a la cual se le va a
identificar un modelo ARMA.
IDENTIFICACIÓN
• Solamente un retardo estacional es
significativo.
• Probaremos diferentes modelos; a priori
comenzaríamos con un AR(1) para la parte
estacional y no ajustaríamos nada para la
parte regular ARIMA(0, 1, 0)x(1,1,0)
• En posteriores análisis se validará el modelo
Predicciones web a través de google analytics

Predicciones web a través de google analytics

  • 1.
    Predicciones web através de Google Analytics Un resumen metodológico mediante modelos ARIMA a través de Gretl Álvaro Fierro: alvaro.fierro@urbegi.com Jon Osés: jon.oses@bidenet.com
  • 2.
    Objeto del Análisis •Contrastar una metodología que permita identificar un modelo que permita predecir cuántas visitas va a tener una determinada página web, cuyo nombre omitimos en este estudio. • Así, este trabajo excluimos los gráficos de series temporales, gráfico media- rango, correlogramas, etc.
  • 3.
    Definición del Análisis -Paratal fin, se utilizan como series históricas los datos que permite descargar Google Analytics en tres ámbitos objeto de predicciones: • Sesiones: Es el número total de sesiones que se han realizado en el periodo. Una sesión es el periodo durante el cual un usuario interactúa con su sitio web, aplicación, etc. Todos los datos de uso (visitas a una pantalla, eventos, comercio electrónico, etc.) están asociados a una sesión. • Usuarios: Usuarios que han interactuado con la aplicación, incluidos tanto los usuarios nuevos como los recurrentes • Número de páginas vistas : Número total de páginas vistas; las visitas repetidas a una misma página también se contabilizan (fuente: Google Analytics)
  • 4.
    Esquema de Datos •Se toma la siguiente horquilla temporal: 17/02/2014 – 02/06/2014 • Los datos son de carácter diario • Se trabajan con 106 observaciones • La predicción se realiza a una semana vista
  • 5.
    Metodología (II) Etapas delproceso de predicción: • Análisis de estacionariedad – Gráfico Serie Temporal – Gráfico Media-Rango – FAC y FACP – Contrastes de raíz unitaria: ADF, Phillips-Perron, KPSS • Identificación – Modelo propuesto
  • 6.
    ANÁLISIS DE ESTACIONARIEDAD:Primeros Resultados • No se tiene muy claro si la serie es estacionaria en la parte regular, por lo que realizaremos los diferentes contrastes de existencia de raíz unitaria. • En función de los resultados, tomaremos primeras diferencias regulares o no. • En cambio, sí se ve claramente una fuerte estacionalidad. Hay retardos estacionales claramente significativos y decrecen lentamente; parece claro que tenemos que tomar diferencias estacionales.
  • 7.
    ANÁLISIS DE ESTACIONARIEDAD:Primeros Resultados • Para conseguir que la serie se estacionaria en varianza tomamos logaritmos de la serie original; normalmente esta transformación estabiliza la varianza e induce homocedasticidad. Una vez realizado el gráfico media- rango, se concluye que serie ya es estacionaria en varianza. • En cuanto a la estacionariedad en media, es necesario tomar primeras diferencias regulares. Además en contraste ADF nos indica que no se rechaza la hipótesis nula de existencia de raíz unitaria. • La estacionalidad permanece y se ve claramente los correlogramas de la serie de primeras diferencias de los logaritmos. Para ello, tomamos diferencias estacionales.
  • 8.
    ANÁLISIS DE ESTACIONARIEDAD:Resultados • Finalmente, la serie de logaritmos con diferencias regulares y estacionales, es decir: integrada de orden uno en ambas partes, regular y estacional I(1,1). • Esta será, por tanto, la serie a la cual se le va a identificar un modelo ARMA.
  • 9.
    IDENTIFICACIÓN • Solamente unretardo estacional es significativo. • Probaremos diferentes modelos; a priori comenzaríamos con un AR(1) para la parte estacional y no ajustaríamos nada para la parte regular ARIMA(0, 1, 0)x(1,1,0) • En posteriores análisis se validará el modelo