El documento describe las nuevas funcionalidades del Google Search Console (antiguamente Google Webmaster Tools). Resume tres nuevos informes: 1) El informe de rendimiento ahora proporciona datos de 16 meses en lugar de 3 meses; 2) El informe AMP ayuda a depurar la implementación AMP y validar páginas; 3) El informe de cobertura analiza qué URLs ha indexado Google a través de enlaces internos y externos, y las razones por las que otras URLs no han sido indexadas.
4. #clinicseo @ikhuerta
Google Webmaster Tools
Nos da información “real” sobre la indexación
del site.
• Permite subir Sitemaps.xml
• Permite ver lo que está bloqueando el archivo robots.txt
• Permite ver que páginas se han indexado.
• Permite ver que páginas estaban indexadas y han pasado a
provocar un error.
• Permite examinar cuanto contenido indexan las arañas cada
día de nuestros sites.
• Y muchas otras cosas no relacionadas con la indexación.
www.google.com/webmasters
9. #clinicseo @ikhuerta
3 “NUEVOS” INFORMES
RENDIMIENTO
COBERTURA
AMP
ANALISIS DE VISIBILIDAD EN EL BUSCADOR
ANALISIS DE LA INDEXACIÓN
ANALISIS DE IMPLEMENTACIONES AMP
10. #clinicseo @ikhuerta
¡Hola! Soy,,,
IÑAKI HUERTA
Director de IKAUE
SEO, ANALISTA DIGITAL y TÉCNICO
….con 15 años de experiencia en el sector, coorganizador del user web Analytics, director del master de
analítica web del DIC y todas esas cosas que se cuentan en mi linkedin…
Y LO IMPORTANTE:
Seguramente, la persona más empeñada en sacar datos accionables de las
herramientas de Marketing Online que escucharéis hoy.
14. #clinicseo @ikhuerta
EL CAMBIO:
En GSC antigüo: Datos de 90 días (3 meses)
En GSC nuevo: Datos de 480 días (16 meses)
PERO ES QUE ESTO ES UN CAMBIO ENORME
15. #clinicseo @ikhuerta
PARA ANALIZAR HAY QUE CONOCER
LA ESTACIONALIDAD
¿Google Panda?
Evolución de visitas SEO de una Escuela Online…
2018
16. #clinicseo @ikhuerta
¿Google Panda?
Pues NO :)
PARA ANALIZAR HAY QUE CONOCER
LA ESTACIONALIDAD
Evolución de visitas SEO de una Escuela Online…
2018
2017
29. #clinicseo @ikhuerta
Acabé contigo,
preséntame a tus
amigas…
LINK LINK LINK
LINK
LINK
LINK LINK LINK
LINK
LINK
LINK
LINK
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
30. #clinicseo @ikhuerta
Y ahora las amigas de
tus amigas…
LINK LINK LINK
LINK
LINK
LINK LINK LINK
LINK
LINK
LINK
LINK
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
KL
I
N
K
L
I
N
K
L
I
N
K
L
I
N
KL
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
31. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
… a rastrear las nuevas URLs …
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
L
I
N
K
32. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
Robots
Allowed
Robots Disallowed
Descubiertas sin rastrear
… a rastrear las nuevas URLs …
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿robots.txt?
Robots.txt disallow
Denegación desde server
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
33. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
… a rastrear las nuevas URLs …
¿código HTTP?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿robots.txt?
401
404
410
Soft 404
Robots.txt disallow
Denegación desde server
301
302
307
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
34. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Texto
HTML
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
Códigos front
…y algo de
texto
NoHTML
Contenidos “alternate”
Multimedia
… a rastrear las nuevas URLs …
¿código HTTP?
¿tipo archivo?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿robots.txt?
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
301
302
307
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
35. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Texto
HTML
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
Indexables
NoIndex
Códigos front
…y algo de
texto
NoHTML
Contenidos “alternate”
Multimedia
… a rastrear las nuevas URLs …
¿código HTTP?
¿tipo archivo?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿meta robots?
¿robots.txt?
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
meta robots
http x-robots-tag
301
302
307
Etiquetadas
“index” o no
etiquetadas
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
36. #clinicseo @ikhuerta
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Texto
HTML
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
Indexables Canónicas
Canónicalizadas
Duplicadas
NoIndex
Códigos front
…y algo de
texto
NoHTML
Contenidos “alternate”
Multimedia
… a rastrear las nuevas URLs …
¿código HTTP?
¿tipo archivo?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿meta robots?
¿canonical?
¿robots.txt?
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
meta robots
http x-robots-tag
externas
y no canonizables
301
302
307
Etiquetadas
Asignadas por
Google
Etiquetadas
o asignadas
Etiquetadas
“index” o no
etiquetadas
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
37. #clinicseo @ikhuerta
Válidas
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Texto
HTML
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
Indexables Canónicas
Baja calidad
Canónicalizadas
Duplicadas
NoIndex
Códigos front
…y algo de
texto
NoHTML
Contenidos “alternate”
Multimedia
… a rastrear las nuevas URLs …
¿código HTTP?
¿tipo archivo?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿meta robots?
¿canonical?
¿robots.txt?
Thin content
Paginaciones
URLs sin autoridad
otros soft404
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
meta robots
http x-robots-tag
externas
y no canonizables
301
302
307
Etiquetadas
Asignadas por
Google
Etiquetadas
o asignadas
Etiquetadas
“index” o no
etiquetadas
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
38. #clinicseo @ikhuerta
Válidas
Total
de URLs a
Rastrear
Robots
Allowed 200 code
(& 304)
Texto
HTML
Robots Disallowed
Descubiertas sin rastrear
400 code
300 code
500 code
Indexables Canónicas
Aparece
en los
SERPs
Baja calidad
Canónicalizadas
Duplicadas
NoIndex
Códigos front
…y algo de
texto
NoHTML
Contenidos “alternate”
Multimedia
… a rastrear las nuevas URLs …
¿código HTTP?
¿tipo archivo?
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
¿meta robots?
¿canonical?
¿robots.txt?
Thin content
Paginaciones
URLs sin autoridad
otros soft404
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
meta robots
http x-robots-tag
externas
y no canonizables
301
302
307
Etiquetadas
Asignadas por
Google
Etiquetadas
o asignadas
Etiquetadas
“index” o no
etiquetadas
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y
sin rastreo
45. #clinicseo @ikhuerta
ERRORES interesantes…
El “Soft 404”
Páginas que GOOGLE entiende que no existen
aunque no devuelvan 404:
1. Redirecciones masivas a una misma URL (aunque sean 301)
2. Páginas sin contenido o con layout roto (errores internos de
páginas mal montadas)
46. #clinicseo @ikhuerta
ERRORES interesantes…
El “Errores de redirección”
Demasiadas redirecciones seguidas:
Has dado demasiados saltos entre URLs o tus redirecciones
forman un bucle infinito.
48. #clinicseo @ikhuerta
ADVERTENCIAS interesantes…
“Indexada aunque estaba bloqueda en robots.xt”
Google ha llevado a su índice una URL que tu
no le permites rastrear
1. Restos de rastreos antigüos (o redirecciones)
2. Páginas bloqueadas pero de las que tiene señales externas
para poder indexarla (normalmente links)
50. #clinicseo @ikhuerta
NO SIEMPRE SON UN PROBLEMA…
La mayoría desaparecen solas y no molestan
(no hace falta arreglar nada)
LO QUE DEBEMOS HACER ES VALIDAR QUE NO TENGAN
ENLACES ENTRANTES
ESO SUPONDRÍA QUE ESTAS TIRANDO
AUTORIDAD A LA BASURA…
52. #clinicseo @ikhuerta
EXCLUIDAS que si tienen que excluirse…
URLs que no tiene sentido que Google indexe
- Bloqueada por robots.txt
- Página con redirección
- Marcadas como “noindex”
Tu página le esta diciendo que no las incluya.
Y como no están en sitemaps.xml no son errores.
53. #clinicseo @ikhuerta
EXCLUIDAS que si tienen que excluirse…
URLs que no tiene sentido que Google indexe
- Bloqueada por robots.txt
- Página con redirección
- Marcadas como “noindex”
Tu página le esta diciendo que no las incluya.
Y como no están en sitemaps.xml no son errores.
LA DIFERENCIA ENTRE ENCONTRAR NUESTRAS PÁGINAS DE ESTE TIPO EN
EXCLUIDAS o ERRORES
ESTÁ EN SI LAS HEMOS AÑADIDO O NO A LOS SITEMAPS
54. #clinicseo @ikhuerta
EXCLUIDAS por duplicidades
Decisiones que toma Google sobre tu contenido
- Etiqueta canonica adecuada → Lo marcaste y Te hicieron caso
- No se seleccionó como canónica → No lo marcaste y escogió otra
- Google eligió una página canónica diferente → Lo marcaste pero escogió otra
Por fin tenemos la clave para saber con qué
URLs se queda Google
55. #clinicseo @ikhuerta
EXCLUIDAS interesantes…
”Anomalías en el rastreo”
Problemas en tu servidor, a veces sirves cosas
distintas
1. Páginas que a veces dan códigos de servidor distinto
2. Páginas que a veces devuelven contenidos distintos
56. #clinicseo @ikhuerta
EXCLUIDAS interesantes…
”Descubiertas pero no rastreadas”
Google tiene tu URL pero no ha querido
rastrearla (al menos aun)
1. Páginas que indicas en tu sitemap, pero que no rastrea
porque no tienen enlaces o son muy profundos
2. Páginas que Google conoce, pero no ha rastreado por no
saturar tu página (muchas veces por errores 500 en otras
páginas
59. #clinicseo @ikhuerta
LA CLAVE ES FRAGMENTAR EL SITEMAP
Ahora más que nunca
Cada sitemap.xml se transforma en un
filtro sobre el total de URLs
Separados en segmentos de negocio
resultan una herramienta esencial para
analizar la indexación
60. #clinicseo @ikhuerta
Listado de URLs total
rastreadas
cliente
Distancia de rastreo 1 .txt (Level = 0 – 1 )
Ejemplos de uso:
creación de
sitemaps
distancia/niveles
de rastreo
Distancia de rastreo 2 .txt (Level = 2)
Distancia de rastreo 3 .txt (Level = 3 )
Distancia de rastreo n .txt …
61. #clinicseo @ikhuerta
Listado de URLs Total
rastreadas
cliente
Muy poco enlazada .txt (Inlinks = 0-10)
Otros Ejemplos:
Por cantidad
de enlaces
entrantes
Poco enlazadas .txt (Inlinks = 11-100)
Bastante enlazadas .txt (Inlinks = 101-500)
Muy Enlazadas .txt (inlinks = >500)
62. #clinicseo @ikhuerta
Listado de URLs Total
rastreadas
cliente
Thin content.txt (Carácteres = 0-50)
Otros Ejemplos:
Por cantidad
de texto de
contenido
Poco contenido.txt (Carácteres = 51-500)
Contenido Mínimo.txt (Carácteres= 501-3.000)
Contenido decente.txt (Carácteres = >3.000)
63. #clinicseo @ikhuerta
Listado de URLs Total
rastreadas
cliente
articulos-0-1-mes.txt
Otros Ejemplos:
Por fecha de
publicación
articulos-2-6-meses.txt
articulos-7-12-meses.txt
Articulos-12+meses.txt
64. #clinicseo @ikhuerta
NOTA:
Los índices de sitemaps
son tratados como sitemaps completos
El informe de cobertura no nos permitirá
analizar cada fragmento de sitemap por
separado si no los subimos uno a uno.
69. Recuerda nuestro hashtag!
#CLINICSEO
Y ESO ES TODO LO QUE TENGO QUE DECIR DEL NUEVO
GOOGLE SEARCH CONSOLE…
GRACIAS
Iñaki Huerta
@ikhuerta
hola@Ikaue.com