SlideShare una empresa de Scribd logo
1 de 30
Descargar para leer sin conexión
SEO, Logs y Big Data
24/06/2016 → By Lino Uruñuela
¿Qué son los logs?
Información que guarda nuestro servidor de cualquier
interacción que se realiza en él.
¿Dónde y cómo se guardan?
● Se guardan en ficheros .tar.gz
● Se suelen borrar cada X días
● Pregúntale a tu proveedor de hosting cómo obtenerlos
● Pideselo a tus técnicos
¿Qué información nos ofrecen?
CLF → Formato común de registro
● Ip del cliente
● “-” Id cliente máquina
● Id del usuario
● Fecha → fecha y hora de cuando el servidor recibió esa petición
● Método, url, protocolo -> “Get url HTTP/1.0”
● Código de estado → 200 (correcto), 40x (error del cliente), 30x
(redirección), 50x (error del servidor)
● Tamaño
Formato de registro combinado
● Referer → url de referencia
● User Agent → Navegador, sistema operativo, Googlebot, Bingbot
Ejemplo de log
¿Por qué son importantes?
● Cuándo →
○ Sin tener en cuenta las fechas los datos pierden valor
● ¿Dónde? →
○ La url de nuestro site, o un grupo de urls (mediante regex)
● ¿Desde? →
○ Puede ser un buscador, como este ejemplo.
○ Puede ser otro dominio, enlace desde otro site (referencia)
○ Puede ir en blanco, normalmente bots
¿Por qué son importantes?
● ¿Quién? →
○ Nos interesan solamente tres:
■ contienen “GoogleBot” o el bot que quieras
■ Usuarios normales
● No lo llevan vacío
● No contiene “bot” (muchas posibilidades)
Y además, tiene referer no vació
¿Por qué son importantes?
● Estado →
○ Es uno de los campos por los que “pivotaremos” todos nuestros logs
○ Nos dice que URLs son
● Errores
● Redirecciones
● Correctas
Filtrando datos para darle valor
Urls 200 ok
● ¿Quién? → Googlebot
● ¿Cuándo? → 1 mes
● ¿Dónde? → grupo Urls
● ¿Status? -> 200
Urls con 200 rastreadas por
Google, también Hits
Urls error 410
● ¿Quién? → Googlebot
● ¿Cuándo? → 1 mes
● ¿Dónde? → grupo Urls
● ¿Status? -> 410
Páginas con error “para siempre”
rastreadas por Google
Si segmentamos los datos por grupo de urls podemos analizar todo lo
anterior por tipo de plantilla/página, por ejemplo sobre:
● Filtro o sección del site (filtro por tipo de producto,etc)
● Paginaciones
● Parámetros
Segmentando datos por URL
Segmentando errores 410
¿Segmento que genera errores 410?
Segmentando urls con 200
Filtrando datos para darle valor
Urls redirección 301
● ¿Quién? → Googlebot
● ¿Cuándo? → 1 mes
● ¿Dónde? → grupo Urls
● ¿Status? -> 301
URLs con redirección que rastrea
Google
Urls error 404
● ¿Quién? → Googlebot
● ¿Cuándo? → 1 mes
● ¿Dónde? → grupo Urls
● ¿Status? -> 404
Urls que da error
URLs 301
Urls y Segmentando datos
● Las gráficas nos muestran una “foto” o línea del tiempo de ese momento
Nos sirven para ver la evolución.
● Hay información muy útil que no te lo muestra una gráfica
○ Urls con redirección a urls 404 → hay que saber las urls ,no una gráfica
○ Urls que hacen dobles, triples, n redirecciones
● Para profundizar en las causas es indispensable poder analizar qué urls
exactamente forman cada grupo del gráfico.
● Estas urls hay que ordenarlas de alguna manera para asignar prioridad a
cada url
Urls y Segmentando datos
El cómo ordenemos estos datos es vital para su análisis
● Podemos ordenar por accesos del bot o usuarios.
● Podemos cruzarlos con datos de analytics!
Cruzando datos con Analytics
Al ordenar los datos en base a tráfico orgánico
● Obtenemos una rápida priorización mediante el dato estrella en SEO
● Filtrando campos y cruzando datos podemos obtener datos de gran
relevancia
Cruzando datos con Analytics
Por ejemplo urls que dan 404 por Googlebot y recibían tráfico orgánico
● Podemos ver las urls que dan 404 y ordenarlas por visitas que recibían
● Podemos obtener la última vez que dio un status correcto (200) y visitas
○ Han existido anteriormente si hay fecha
○ No existieron nunca => posible error técnico o de enlazado
Redirecciones 301 con visitas
Superponiendo tráfico y Logs
Superponiendo tráfico y Logs
Backlinks
●¿Cuándo? → Vamos a obtener la última fecha de acceso
●¿Desde? → ¿quién nos enlaza?
○ Red social → Si el referer contien Facebook, Twitter, etc
○ Buscador → Si contiene Google, Bing, etc
○ Otra página web → si no es red social ni buscador => Enlace externo
● Status → ¿Que tipo de urls queremos ver?
○ 200 → (enlaces correctos)
○ 302 → (enlaces con redirección que no valorará Google)
○ 40x → Enlaces a urls de error, conviene arreglarlas!
Backlinks a urls con 404
●¿Cuándo? → Último mes
●¿Desde? → ¿quién nos enlaza?
○ Red social → Si el referer contien Facebook, Twitter, etc
○ Buscador → Si contiene Google, Bing, etc
○ Otra página web → si no es red social ni buscador => Enlace externo
● Status → ¿Que tipo de urls queremos ver?
○ 200 → (enlaces correctos)
○ 302 → (enlaces con redirección que no valorará Google)
○ 404→ Enlaces a urls de error, conviene arreglarlas!
Backlinks a urls con 404
● ¿Cuándo? → 1 mes
● ¿Desde? → Otra página web
● ¿Status? -> 404
Ordenándolo por el número de accesos que recibe de usuarios
También podríamos ordenarlo por número de veces que GoogleBot accede a esa url, de esta
manera nos priorizará mejor las urls que reciben enlaces y dan 404
Similitudes y diferencias con GSC
● Cuenta todos
(200, 404,410,30x)
● Solo 200
Similitudes y diferencias con GSC
● Algunos ejemplos de usos que no te da GSC
○ Status 200
■ Cuántas y que urls rastrea todos los días → Importancia de Google
■ Cuántas y qué urls que dan 200 pero nunca han tenido tráfico orgánico
○ Redirecciones 30x
■ Redirecciones 302 antes con visitas→ ¿Son correctas o error?
■ Redirecciones a urls con error 404 o 410
■ URls con redirección 301 rastreadas → muy bueno para migraciones
○ Errores 4xx (las urls podrías sacarlas de GSC y luego darle la lógica)
■ URLs que dan error a Google
■ URls que dan error y antes daban 200
■ Urls que dan error y antes tenían visitas → muy útil en megawebs
Similitudes y diferencias con GSC
● Backlinks
○ Status 200 → enlaces entrantes correctos
■ Enlaces que además nos aportan tráfico
■ Importancia para Google de ese link → cuántos más accesos del
bot a esa url más importante es la url de origen
○ Redirecciones 30x
■ Backlinks a urls con 302 → desperdiciamos page Rank
■ Backlinks a urls con Dobles, triples, redirecciones
○ Errores 4xx
■ Backlinks a urls que dan error a Google
■ Backlinks a urls que dan error y antes tenían visitas
Similitudes y diferencias con GSC
● Infinidad de cosas
○ Comparaciones
■ tráfico orgánico Vs Nº urls rastreadas (ratio eficiencia)
■ Comparar cada día con la media para alertas automáticas
○ Redirecciones 30x
■ Nuevas redirecciones encontradas
■ Redirecciones creadas por bots
○ Errores 4xx
■ Cuando comenzó una url a dar error o cuando dejó de darlo
■ URLs con errores ya corregidas (tienen fecha último 200 posterior a
último 404)
Similitudes y diferencias con GSC
Cruzando datos con Analytics
Gracias!!
Seo, Logs y Big Data
24/06/2016 → By Lino Uruñuela (Seonthebeach 2016)

Más contenido relacionado

La actualidad más candente

Diagnóstico SEO Técnico con Herramientas #TheInbounder
Diagnóstico SEO Técnico con Herramientas #TheInbounderDiagnóstico SEO Técnico con Herramientas #TheInbounder
Diagnóstico SEO Técnico con Herramientas #TheInbounderMJ Cachón Yáñez
 
Clinic SEO: migraciones y cambios de marca
Clinic SEO: migraciones y cambios de marcaClinic SEO: migraciones y cambios de marca
Clinic SEO: migraciones y cambios de marcaAlfonso Moure Ortega
 
Taller SEO con Screaming Frog #seoconlarana
Taller SEO con Screaming Frog  #seoconlaranaTaller SEO con Screaming Frog  #seoconlarana
Taller SEO con Screaming Frog #seoconlaranaMJ Cachón Yáñez
 
"Todo Sobre Mi Madre" #EnsaladaSeo 2017
"Todo Sobre Mi Madre" #EnsaladaSeo 2017 "Todo Sobre Mi Madre" #EnsaladaSeo 2017
"Todo Sobre Mi Madre" #EnsaladaSeo 2017 MJ Cachón Yáñez
 
Usos de Screaming Frog para SEO #DSM2018 #DSM18
Usos de Screaming Frog para SEO   #DSM2018 #DSM18Usos de Screaming Frog para SEO   #DSM2018 #DSM18
Usos de Screaming Frog para SEO #DSM2018 #DSM18MJ Cachón Yáñez
 
SEO para E-COMMERCE por Natzir y Dani Pinillos
SEO para E-COMMERCE por Natzir y Dani PinillosSEO para E-COMMERCE por Natzir y Dani Pinillos
SEO para E-COMMERCE por Natzir y Dani PinillosNatzir Turrado
 
Análisis de Logs para SEO
Análisis de Logs para SEOAnálisis de Logs para SEO
Análisis de Logs para SEONatzir Turrado
 
SEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaSEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaNatzir Turrado
 
Análisis de GoogleBot con Google Analytics por Lino Uruñuela
Análisis de GoogleBot con Google Analytics por Lino UruñuelaAnálisis de GoogleBot con Google Analytics por Lino Uruñuela
Análisis de GoogleBot con Google Analytics por Lino UruñuelaNatzir Turrado
 
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019Webpositer
 
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]Luis M Villanueva
 
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid MJ Cachón Yáñez
 
Javier Lorente Seonthebeach 2016
Javier Lorente Seonthebeach 2016Javier Lorente Seonthebeach 2016
Javier Lorente Seonthebeach 2016Javier Lorente
 
Multichannel Marketing: El efecto de la multicanalidad en SEO
Multichannel Marketing: El efecto de la multicanalidad en SEOMultichannel Marketing: El efecto de la multicanalidad en SEO
Multichannel Marketing: El efecto de la multicanalidad en SEONatzir Turrado
 
La intencion es lo que cuenta #innobi19
La intencion es lo que cuenta #innobi19La intencion es lo que cuenta #innobi19
La intencion es lo que cuenta #innobi19MJ Cachón Yáñez
 
Tendencias SEO actuales (Junio 2018) - Webminar en Siteground
Tendencias SEO actuales (Junio 2018) - Webminar en SitegroundTendencias SEO actuales (Junio 2018) - Webminar en Siteground
Tendencias SEO actuales (Junio 2018) - Webminar en SitegroundIñaki Huerta (ikhuerta)
 
Análisis de precios de tu competencia con Screaming Frog #SEOGirona
Análisis de precios de tu competencia con Screaming Frog #SEOGironaAnálisis de precios de tu competencia con Screaming Frog #SEOGirona
Análisis de precios de tu competencia con Screaming Frog #SEOGironaMJ Cachón Yáñez
 

La actualidad más candente (20)

Diagnóstico SEO Técnico con Herramientas #TheInbounder
Diagnóstico SEO Técnico con Herramientas #TheInbounderDiagnóstico SEO Técnico con Herramientas #TheInbounder
Diagnóstico SEO Técnico con Herramientas #TheInbounder
 
Clinic SEO: migraciones y cambios de marca
Clinic SEO: migraciones y cambios de marcaClinic SEO: migraciones y cambios de marca
Clinic SEO: migraciones y cambios de marca
 
Experimentos SEO #SOB18
Experimentos SEO #SOB18Experimentos SEO #SOB18
Experimentos SEO #SOB18
 
Taller SEO con Screaming Frog #seoconlarana
Taller SEO con Screaming Frog  #seoconlaranaTaller SEO con Screaming Frog  #seoconlarana
Taller SEO con Screaming Frog #seoconlarana
 
"Todo Sobre Mi Madre" #EnsaladaSeo 2017
"Todo Sobre Mi Madre" #EnsaladaSeo 2017 "Todo Sobre Mi Madre" #EnsaladaSeo 2017
"Todo Sobre Mi Madre" #EnsaladaSeo 2017
 
Usos de Screaming Frog para SEO #DSM2018 #DSM18
Usos de Screaming Frog para SEO   #DSM2018 #DSM18Usos de Screaming Frog para SEO   #DSM2018 #DSM18
Usos de Screaming Frog para SEO #DSM2018 #DSM18
 
SEO para E-COMMERCE por Natzir y Dani Pinillos
SEO para E-COMMERCE por Natzir y Dani PinillosSEO para E-COMMERCE por Natzir y Dani Pinillos
SEO para E-COMMERCE por Natzir y Dani Pinillos
 
Análisis de Logs para SEO
Análisis de Logs para SEOAnálisis de Logs para SEO
Análisis de Logs para SEO
 
SEO semántico y búsqueda semántica
SEO semántico y búsqueda semánticaSEO semántico y búsqueda semántica
SEO semántico y búsqueda semántica
 
Análisis de GoogleBot con Google Analytics por Lino Uruñuela
Análisis de GoogleBot con Google Analytics por Lino UruñuelaAnálisis de GoogleBot con Google Analytics por Lino Uruñuela
Análisis de GoogleBot con Google Analytics por Lino Uruñuela
 
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019
El SEO ha resucitado - Luis M. Villanueva y Chuiso - SEOPLUS 2019
 
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]
Minority Log Report (Analisis de LOGS para SEO) - ESHOW [CLINIC SEO 2018]
 
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid
Usos de @UrlProfiler #MeasureMad - Measure Camp Madrid
 
MIgraciones SEO - Clinic SEO - Eshow 2019
MIgraciones SEO - Clinic SEO - Eshow 2019MIgraciones SEO - Clinic SEO - Eshow 2019
MIgraciones SEO - Clinic SEO - Eshow 2019
 
Sigue indexando #seoplus2019
Sigue indexando #seoplus2019Sigue indexando #seoplus2019
Sigue indexando #seoplus2019
 
Javier Lorente Seonthebeach 2016
Javier Lorente Seonthebeach 2016Javier Lorente Seonthebeach 2016
Javier Lorente Seonthebeach 2016
 
Multichannel Marketing: El efecto de la multicanalidad en SEO
Multichannel Marketing: El efecto de la multicanalidad en SEOMultichannel Marketing: El efecto de la multicanalidad en SEO
Multichannel Marketing: El efecto de la multicanalidad en SEO
 
La intencion es lo que cuenta #innobi19
La intencion es lo que cuenta #innobi19La intencion es lo que cuenta #innobi19
La intencion es lo que cuenta #innobi19
 
Tendencias SEO actuales (Junio 2018) - Webminar en Siteground
Tendencias SEO actuales (Junio 2018) - Webminar en SitegroundTendencias SEO actuales (Junio 2018) - Webminar en Siteground
Tendencias SEO actuales (Junio 2018) - Webminar en Siteground
 
Análisis de precios de tu competencia con Screaming Frog #SEOGirona
Análisis de precios de tu competencia con Screaming Frog #SEOGironaAnálisis de precios de tu competencia con Screaming Frog #SEOGirona
Análisis de precios de tu competencia con Screaming Frog #SEOGirona
 

Similar a Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016

Optimización del rastreo y la indexación en buscadores
Optimización del rastreo y la indexación en buscadoresOptimización del rastreo y la indexación en buscadores
Optimización del rastreo y la indexación en buscadoresJavier Lorente
 
Clinic seo crawling & logs
Clinic seo crawling & logsClinic seo crawling & logs
Clinic seo crawling & logsClinic Seo
 
Crawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urlsCrawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urlsSiteGround España
 
Google Analytics para SEO
Google Analytics para SEOGoogle Analytics para SEO
Google Analytics para SEOEli Garcia
 
SEO, posicionamiento web en Internet
SEO, posicionamiento web en InternetSEO, posicionamiento web en Internet
SEO, posicionamiento web en InternetAukera
 
Optimización de crawleo - SEO #SEOPlus 2017
Optimización de crawleo - SEO #SEOPlus 2017Optimización de crawleo - SEO #SEOPlus 2017
Optimización de crawleo - SEO #SEOPlus 2017Antonio Parra Gómez
 
Curso posicionamiento Google
Curso posicionamiento GoogleCurso posicionamiento Google
Curso posicionamiento GoogleNico Roddz
 
Search Engine Marketing - Marketing Web - Universidad Autónoma Barcelona
Search Engine Marketing - Marketing Web - Universidad Autónoma BarcelonaSearch Engine Marketing - Marketing Web - Universidad Autónoma Barcelona
Search Engine Marketing - Marketing Web - Universidad Autónoma Barcelonamarcguerrero
 
Posicionamiento En Buscadores
Posicionamiento En BuscadoresPosicionamiento En Buscadores
Posicionamiento En Buscadoresaltanet
 
Web 2.0 y redes sociales virtuales - SEO
Web 2.0 y redes sociales virtuales - SEOWeb 2.0 y redes sociales virtuales - SEO
Web 2.0 y redes sociales virtuales - SEOPablo Garaizar
 
Web con happy ending: Estrategias y consejos en el posicionamiento SEO
Web con happy ending: Estrategias y consejos en el posicionamiento SEOWeb con happy ending: Estrategias y consejos en el posicionamiento SEO
Web con happy ending: Estrategias y consejos en el posicionamiento SEOWajari Velásquez Fernández
 
Ouali benmeziane - SEO - webinar
Ouali benmeziane -  SEO - webinarOuali benmeziane -  SEO - webinar
Ouali benmeziane - SEO - webinarLa WebSchool
 
Curso SEO. Teórico-Básico
Curso SEO. Teórico-BásicoCurso SEO. Teórico-Básico
Curso SEO. Teórico-Básicomuga1
 
Qué es seo-guia de introducción para principiantes
Qué es seo-guia de introducción para principiantesQué es seo-guia de introducción para principiantes
Qué es seo-guia de introducción para principiantesHernán Rodríguez Amaya
 

Similar a Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016 (20)

Optimización del rastreo y la indexación en buscadores
Optimización del rastreo y la indexación en buscadoresOptimización del rastreo y la indexación en buscadores
Optimización del rastreo y la indexación en buscadores
 
Clinic seo crawling & logs
Clinic seo crawling & logsClinic seo crawling & logs
Clinic seo crawling & logs
 
Crawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urlsCrawling e Indexacion mejorando la eficacia de tus urls
Crawling e Indexacion mejorando la eficacia de tus urls
 
Google Analytics para SEO
Google Analytics para SEOGoogle Analytics para SEO
Google Analytics para SEO
 
WebmasterTools
WebmasterToolsWebmasterTools
WebmasterTools
 
SEO, posicionamiento web en Internet
SEO, posicionamiento web en InternetSEO, posicionamiento web en Internet
SEO, posicionamiento web en Internet
 
Optimización de crawleo - SEO #SEOPlus 2017
Optimización de crawleo - SEO #SEOPlus 2017Optimización de crawleo - SEO #SEOPlus 2017
Optimización de crawleo - SEO #SEOPlus 2017
 
Curso posicionamiento Google
Curso posicionamiento GoogleCurso posicionamiento Google
Curso posicionamiento Google
 
¿Cómo funciona Google?
¿Cómo funciona Google?¿Cómo funciona Google?
¿Cómo funciona Google?
 
Search Engine Marketing - Marketing Web - Universidad Autónoma Barcelona
Search Engine Marketing - Marketing Web - Universidad Autónoma BarcelonaSearch Engine Marketing - Marketing Web - Universidad Autónoma Barcelona
Search Engine Marketing - Marketing Web - Universidad Autónoma Barcelona
 
Seo para no técnicos
Seo para no técnicosSeo para no técnicos
Seo para no técnicos
 
Posicionamiento En Buscadores
Posicionamiento En BuscadoresPosicionamiento En Buscadores
Posicionamiento En Buscadores
 
Web 2.0 y redes sociales virtuales - SEO
Web 2.0 y redes sociales virtuales - SEOWeb 2.0 y redes sociales virtuales - SEO
Web 2.0 y redes sociales virtuales - SEO
 
Web con happy ending: Estrategias y consejos en el posicionamiento SEO
Web con happy ending: Estrategias y consejos en el posicionamiento SEOWeb con happy ending: Estrategias y consejos en el posicionamiento SEO
Web con happy ending: Estrategias y consejos en el posicionamiento SEO
 
Ouali benmeziane - SEO - webinar
Ouali benmeziane -  SEO - webinarOuali benmeziane -  SEO - webinar
Ouali benmeziane - SEO - webinar
 
Curso SEO. Teórico-Básico
Curso SEO. Teórico-BásicoCurso SEO. Teórico-Básico
Curso SEO. Teórico-Básico
 
Curso de SEO presencial en Bilbao
Curso de SEO presencial en BilbaoCurso de SEO presencial en Bilbao
Curso de SEO presencial en Bilbao
 
Seo + analitycs
Seo + analitycsSeo + analitycs
Seo + analitycs
 
Qué es seo-guia de introducción para principiantes
Qué es seo-guia de introducción para principiantesQué es seo-guia de introducción para principiantes
Qué es seo-guia de introducción para principiantes
 
SEO Basics
SEO BasicsSEO Basics
SEO Basics
 

Más de Lino Uruñuela

SEO desde la línea de comandos
SEO desde la línea de comandosSEO desde la línea de comandos
SEO desde la línea de comandosLino Uruñuela
 
Agrupa y vencerás - SEO técnico
Agrupa y vencerás - SEO técnicoAgrupa y vencerás - SEO técnico
Agrupa y vencerás - SEO técnicoLino Uruñuela
 
Google Search Console - el dato de Schrödinger
Google Search Console - el dato de  SchrödingerGoogle Search Console - el dato de  Schrödinger
Google Search Console - el dato de SchrödingerLino Uruñuela
 
Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022Lino Uruñuela
 
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Lino Uruñuela
 
Search Console, descifrando las cifras
Search Console, descifrando las cifrasSearch Console, descifrando las cifras
Search Console, descifrando las cifrasLino Uruñuela
 
Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018Lino Uruñuela
 
SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)Lino Uruñuela
 

Más de Lino Uruñuela (9)

SEO desde la línea de comandos
SEO desde la línea de comandosSEO desde la línea de comandos
SEO desde la línea de comandos
 
Agrupa y vencerás - SEO técnico
Agrupa y vencerás - SEO técnicoAgrupa y vencerás - SEO técnico
Agrupa y vencerás - SEO técnico
 
Google Search Console - el dato de Schrödinger
Google Search Console - el dato de  SchrödingerGoogle Search Console - el dato de  Schrödinger
Google Search Console - el dato de Schrödinger
 
Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022Que no te den dato por liebre - enpresadigitala 2022
Que no te den dato por liebre - enpresadigitala 2022
 
SeoQL: SQL para SEO
SeoQL: SQL para SEOSeoQL: SQL para SEO
SeoQL: SQL para SEO
 
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
Obtener un listado de keywords en base a su potencial SEO (Google Search Cons...
 
Search Console, descifrando las cifras
Search Console, descifrando las cifrasSearch Console, descifrando las cifras
Search Console, descifrando las cifras
 
Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018Seo Técnico - Del mito al dato - Seonthebeach 2018
Seo Técnico - Del mito al dato - Seonthebeach 2018
 
SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)SEO para periodistas por Lino Uruñuela (2008)
SEO para periodistas por Lino Uruñuela (2008)
 

Último

las tic en la vida cotidiana, y como influyen en nosotros
las tic en la vida cotidiana, y como influyen en nosotroslas tic en la vida cotidiana, y como influyen en nosotros
las tic en la vida cotidiana, y como influyen en nosotrosAxel Melendez
 
Tecnología 2024 11-2 .pdf..............
Tecnología 2024  11-2 .pdf..............Tecnología 2024  11-2 .pdf..............
Tecnología 2024 11-2 .pdf..............edepsantiagomoreno
 
Cuadro comparativo acerca de Wiki vs Blog
Cuadro comparativo acerca de Wiki vs BlogCuadro comparativo acerca de Wiki vs Blog
Cuadro comparativo acerca de Wiki vs Blogmartinez012tm
 
web 1.0 hasta la actualidad y futuro con ia
web 1.0 hasta la actualidad y futuro con iaweb 1.0 hasta la actualidad y futuro con ia
web 1.0 hasta la actualidad y futuro con iacristiansantiago583c
 
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdf
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdfPLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdf
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdfalprazobad
 
PLATAFORMAS SOCIALES.pdf- mundos digitales
PLATAFORMAS SOCIALES.pdf- mundos digitalesPLATAFORMAS SOCIALES.pdf- mundos digitales
PLATAFORMAS SOCIALES.pdf- mundos digitalesJolettVictoriano
 
Haz tu página web y conquista el Gran Line Digital
Haz tu página web y conquista el Gran Line DigitalHaz tu página web y conquista el Gran Line Digital
Haz tu página web y conquista el Gran Line DigitalJoshua Díaz Robayna
 
Presentación Legaltech Forum 2024 - Federico Ast
Presentación Legaltech Forum 2024 - Federico AstPresentación Legaltech Forum 2024 - Federico Ast
Presentación Legaltech Forum 2024 - Federico AstFederico Ast
 
Herramientas tecnológicas para los abogados.pptx
Herramientas tecnológicas para los abogados.pptxHerramientas tecnológicas para los abogados.pptx
Herramientas tecnológicas para los abogados.pptxCarolina Linares
 
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptx
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptxCuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptx
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptxmayorsamuel959
 
Las_Redes_sociales.metodos_de_muestreo.pptx
Las_Redes_sociales.metodos_de_muestreo.pptxLas_Redes_sociales.metodos_de_muestreo.pptx
Las_Redes_sociales.metodos_de_muestreo.pptxLeoOspina3
 

Último (11)

las tic en la vida cotidiana, y como influyen en nosotros
las tic en la vida cotidiana, y como influyen en nosotroslas tic en la vida cotidiana, y como influyen en nosotros
las tic en la vida cotidiana, y como influyen en nosotros
 
Tecnología 2024 11-2 .pdf..............
Tecnología 2024  11-2 .pdf..............Tecnología 2024  11-2 .pdf..............
Tecnología 2024 11-2 .pdf..............
 
Cuadro comparativo acerca de Wiki vs Blog
Cuadro comparativo acerca de Wiki vs BlogCuadro comparativo acerca de Wiki vs Blog
Cuadro comparativo acerca de Wiki vs Blog
 
web 1.0 hasta la actualidad y futuro con ia
web 1.0 hasta la actualidad y futuro con iaweb 1.0 hasta la actualidad y futuro con ia
web 1.0 hasta la actualidad y futuro con ia
 
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdf
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdfPLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdf
PLAN DE ESTUDIOS UPSJB ENFERMERIA2024.pdf
 
PLATAFORMAS SOCIALES.pdf- mundos digitales
PLATAFORMAS SOCIALES.pdf- mundos digitalesPLATAFORMAS SOCIALES.pdf- mundos digitales
PLATAFORMAS SOCIALES.pdf- mundos digitales
 
Haz tu página web y conquista el Gran Line Digital
Haz tu página web y conquista el Gran Line DigitalHaz tu página web y conquista el Gran Line Digital
Haz tu página web y conquista el Gran Line Digital
 
Presentación Legaltech Forum 2024 - Federico Ast
Presentación Legaltech Forum 2024 - Federico AstPresentación Legaltech Forum 2024 - Federico Ast
Presentación Legaltech Forum 2024 - Federico Ast
 
Herramientas tecnológicas para los abogados.pptx
Herramientas tecnológicas para los abogados.pptxHerramientas tecnológicas para los abogados.pptx
Herramientas tecnológicas para los abogados.pptx
 
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptx
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptxCuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptx
Cuadro comparativo WEB 1 WEB 2 WEB 3 Samuel Mayor 10-1.pptx
 
Las_Redes_sociales.metodos_de_muestreo.pptx
Las_Redes_sociales.metodos_de_muestreo.pptxLas_Redes_sociales.metodos_de_muestreo.pptx
Las_Redes_sociales.metodos_de_muestreo.pptx
 

Seo Logs y Big Data, Lino Uruñuela en Seonthebeach 2016

  • 1. SEO, Logs y Big Data 24/06/2016 → By Lino Uruñuela
  • 2. ¿Qué son los logs? Información que guarda nuestro servidor de cualquier interacción que se realiza en él. ¿Dónde y cómo se guardan? ● Se guardan en ficheros .tar.gz ● Se suelen borrar cada X días ● Pregúntale a tu proveedor de hosting cómo obtenerlos ● Pideselo a tus técnicos
  • 3. ¿Qué información nos ofrecen? CLF → Formato común de registro ● Ip del cliente ● “-” Id cliente máquina ● Id del usuario ● Fecha → fecha y hora de cuando el servidor recibió esa petición ● Método, url, protocolo -> “Get url HTTP/1.0” ● Código de estado → 200 (correcto), 40x (error del cliente), 30x (redirección), 50x (error del servidor) ● Tamaño Formato de registro combinado ● Referer → url de referencia ● User Agent → Navegador, sistema operativo, Googlebot, Bingbot
  • 5. ¿Por qué son importantes? ● Cuándo → ○ Sin tener en cuenta las fechas los datos pierden valor ● ¿Dónde? → ○ La url de nuestro site, o un grupo de urls (mediante regex) ● ¿Desde? → ○ Puede ser un buscador, como este ejemplo. ○ Puede ser otro dominio, enlace desde otro site (referencia) ○ Puede ir en blanco, normalmente bots
  • 6. ¿Por qué son importantes? ● ¿Quién? → ○ Nos interesan solamente tres: ■ contienen “GoogleBot” o el bot que quieras ■ Usuarios normales ● No lo llevan vacío ● No contiene “bot” (muchas posibilidades) Y además, tiene referer no vació
  • 7. ¿Por qué son importantes? ● Estado → ○ Es uno de los campos por los que “pivotaremos” todos nuestros logs ○ Nos dice que URLs son ● Errores ● Redirecciones ● Correctas
  • 8. Filtrando datos para darle valor Urls 200 ok ● ¿Quién? → Googlebot ● ¿Cuándo? → 1 mes ● ¿Dónde? → grupo Urls ● ¿Status? -> 200 Urls con 200 rastreadas por Google, también Hits Urls error 410 ● ¿Quién? → Googlebot ● ¿Cuándo? → 1 mes ● ¿Dónde? → grupo Urls ● ¿Status? -> 410 Páginas con error “para siempre” rastreadas por Google
  • 9. Si segmentamos los datos por grupo de urls podemos analizar todo lo anterior por tipo de plantilla/página, por ejemplo sobre: ● Filtro o sección del site (filtro por tipo de producto,etc) ● Paginaciones ● Parámetros Segmentando datos por URL
  • 11. ¿Segmento que genera errores 410?
  • 13. Filtrando datos para darle valor Urls redirección 301 ● ¿Quién? → Googlebot ● ¿Cuándo? → 1 mes ● ¿Dónde? → grupo Urls ● ¿Status? -> 301 URLs con redirección que rastrea Google Urls error 404 ● ¿Quién? → Googlebot ● ¿Cuándo? → 1 mes ● ¿Dónde? → grupo Urls ● ¿Status? -> 404 Urls que da error
  • 15. Urls y Segmentando datos ● Las gráficas nos muestran una “foto” o línea del tiempo de ese momento Nos sirven para ver la evolución. ● Hay información muy útil que no te lo muestra una gráfica ○ Urls con redirección a urls 404 → hay que saber las urls ,no una gráfica ○ Urls que hacen dobles, triples, n redirecciones ● Para profundizar en las causas es indispensable poder analizar qué urls exactamente forman cada grupo del gráfico. ● Estas urls hay que ordenarlas de alguna manera para asignar prioridad a cada url
  • 16. Urls y Segmentando datos El cómo ordenemos estos datos es vital para su análisis ● Podemos ordenar por accesos del bot o usuarios. ● Podemos cruzarlos con datos de analytics!
  • 17. Cruzando datos con Analytics Al ordenar los datos en base a tráfico orgánico ● Obtenemos una rápida priorización mediante el dato estrella en SEO ● Filtrando campos y cruzando datos podemos obtener datos de gran relevancia
  • 18. Cruzando datos con Analytics Por ejemplo urls que dan 404 por Googlebot y recibían tráfico orgánico ● Podemos ver las urls que dan 404 y ordenarlas por visitas que recibían ● Podemos obtener la última vez que dio un status correcto (200) y visitas ○ Han existido anteriormente si hay fecha ○ No existieron nunca => posible error técnico o de enlazado
  • 22. Backlinks ●¿Cuándo? → Vamos a obtener la última fecha de acceso ●¿Desde? → ¿quién nos enlaza? ○ Red social → Si el referer contien Facebook, Twitter, etc ○ Buscador → Si contiene Google, Bing, etc ○ Otra página web → si no es red social ni buscador => Enlace externo ● Status → ¿Que tipo de urls queremos ver? ○ 200 → (enlaces correctos) ○ 302 → (enlaces con redirección que no valorará Google) ○ 40x → Enlaces a urls de error, conviene arreglarlas!
  • 23. Backlinks a urls con 404 ●¿Cuándo? → Último mes ●¿Desde? → ¿quién nos enlaza? ○ Red social → Si el referer contien Facebook, Twitter, etc ○ Buscador → Si contiene Google, Bing, etc ○ Otra página web → si no es red social ni buscador => Enlace externo ● Status → ¿Que tipo de urls queremos ver? ○ 200 → (enlaces correctos) ○ 302 → (enlaces con redirección que no valorará Google) ○ 404→ Enlaces a urls de error, conviene arreglarlas!
  • 24. Backlinks a urls con 404 ● ¿Cuándo? → 1 mes ● ¿Desde? → Otra página web ● ¿Status? -> 404 Ordenándolo por el número de accesos que recibe de usuarios También podríamos ordenarlo por número de veces que GoogleBot accede a esa url, de esta manera nos priorizará mejor las urls que reciben enlaces y dan 404
  • 25. Similitudes y diferencias con GSC ● Cuenta todos (200, 404,410,30x) ● Solo 200
  • 26. Similitudes y diferencias con GSC ● Algunos ejemplos de usos que no te da GSC ○ Status 200 ■ Cuántas y que urls rastrea todos los días → Importancia de Google ■ Cuántas y qué urls que dan 200 pero nunca han tenido tráfico orgánico ○ Redirecciones 30x ■ Redirecciones 302 antes con visitas→ ¿Son correctas o error? ■ Redirecciones a urls con error 404 o 410 ■ URls con redirección 301 rastreadas → muy bueno para migraciones ○ Errores 4xx (las urls podrías sacarlas de GSC y luego darle la lógica) ■ URLs que dan error a Google ■ URls que dan error y antes daban 200 ■ Urls que dan error y antes tenían visitas → muy útil en megawebs
  • 27. Similitudes y diferencias con GSC ● Backlinks ○ Status 200 → enlaces entrantes correctos ■ Enlaces que además nos aportan tráfico ■ Importancia para Google de ese link → cuántos más accesos del bot a esa url más importante es la url de origen ○ Redirecciones 30x ■ Backlinks a urls con 302 → desperdiciamos page Rank ■ Backlinks a urls con Dobles, triples, redirecciones ○ Errores 4xx ■ Backlinks a urls que dan error a Google ■ Backlinks a urls que dan error y antes tenían visitas
  • 28. Similitudes y diferencias con GSC ● Infinidad de cosas ○ Comparaciones ■ tráfico orgánico Vs Nº urls rastreadas (ratio eficiencia) ■ Comparar cada día con la media para alertas automáticas ○ Redirecciones 30x ■ Nuevas redirecciones encontradas ■ Redirecciones creadas por bots ○ Errores 4xx ■ Cuando comenzó una url a dar error o cuando dejó de darlo ■ URLs con errores ya corregidas (tienen fecha último 200 posterior a último 404)
  • 30. Cruzando datos con Analytics Gracias!! Seo, Logs y Big Data 24/06/2016 → By Lino Uruñuela (Seonthebeach 2016)