Metodología e implementaciones Data Science y Visualización de datos aplicadas al SEO. Estudio científico y estadístico de acciones en motores de búsqueda.
Unidad V. Disoluciones quimica de las disoluciones
Data Science y Data Visualization aplicados al SEO
1. Data Science & Data Visualization
aplicados al SEO
JOSEBA RUIZ @RUIZMKT
18 de junio de 2019
2. KWRS
CLUSTERING
Agrupación y ordenación de consultas clave
según distancia semántica.
Ver rápidamente la estructura de las
búsquedas realizadas.
Un análisis exhaustivo y que englobe
centenares de términos es realmente difícil de
representar gráficamente.
7
4. KWRS CLUSTERING
Otra forma útil de clusterizar keywords es gracias a la librería kwClusterR de Remibacha
https://github.com/remibacha/kwClustersR, la cual utiliza el algoritmo de distancia léxica Jaro Winkler.
5. KWRS
CONTENT SHOT
Asociación de las consultas de SC con las
métricas y dimensiones de GA.
Mucha más información más allá de las 4
métricas de SC y una visión más
completa del comportamiento del tráfico
Organic Search.
Matching probabilístico y no lineal o
exacto.
4
8. BIG DATA
Almacenamiento y procesamiento masivo
de datos procedentes de SC y GA.
Evitar los límites temporales de SC y
ofrecer una alternativa al sampling de GA.
Proceso automatizado poco escalable y a
veces demasiado dinámico.
9
11. WPO
MULTIPÁGINA
Generación automatizada de auditorías
para la mejora de la velocidad de carga de
las páginas de un sitio web.
Realizar el seguimiento de decenas de
páginas al mismo tiempo sin tener que
basarnos en patrones de página.
Identificar páginas relevantes y el
consumo de recursos.
9
13. CONTENIDO
DUPLICADO
Comparar el contenido de las páginas de un
sitio web y detallar si es diferente, similar o
duplicado.
Control de páginas detallado y sin
limitación. No depende de una API, sino
de un crawler propio.
Información esencial y sin características de
valor añadidas como en otras herramientas. Lo
óptimo es utilizar ambas herramientas a la vez.
4
14. CONTENIDO DUPLICADO
Screaming Frog busca
duplicados entre etiquetas como
Title o Meta-Descriptions.
Siteliner en su versión gratuita solo rastrea las
250 páginas más relevantes en cuanto a
jerarquía se refiere. Cada página a partir de esa
cifra cuesta $0.01 con un máximo de hasta
50.000 páginas.
16. CRAWLING &
SCRAPING
Rastreo y extracción de información
programática.
Recopilación directa y personalizada de
datos. Creación de gráficos y aplicación
de metodología Data Science.
Existen en el mercado herramientas que
ofrecen este tipo de información, como
Screaming Frog.
5
18. DATA
VISUALIZATION
Representación de datos de manera
concisa y útil. Representación de datos de
manera concisa y útil.
Compresión momentánea de la tendencia
y estacionalidad del tráfico recogido.
Muchas veces la información mostrada es
demasiado superficial y generalista sin
permitir profundizar en ella.
8