Una charla que da una vuelta de tuerca a los conceptos de indexación SEO intentando discernir que partes de lo que solemos trabajar importa de verdad y que verdades y mentiras nos cuentan.
Mitos y Realidades de la indexación - SeoPlus 2018
1. IÑAKI HUERTA - @IKHUERTA
A L
Mitos y realidades de la indexación
Hoy, en
#SEO
#INDEXACIÓN
#CRAWLBUDGET
#SEGUNDAOLA
#LOGS
Con Iñaki Huerta (de IKAUE)
#WHITEHAT
2. IÑAKI HUERTA - @IKHUERTA
SEÑORES ORGANIZADORES DEL
¿DE QUÉ VAIS?
5. IÑAKI HUERTA - @IKHUERTA
EL
¡ESTÁ DE MODA!
Voy pa’
trending-
topic!!!
SEO TÉCNICO
6. IÑAKI HUERTA - @IKHUERTA
Hola,
SOY SEO TÉNICO
No se programar
No se HTML
No se Javascript
No se CSS
No se como funciona realmente un servidor
… pero soy SEO TÉCNICO
(por mis santos cojones)
7. IÑAKI HUERTA - @IKHUERTA
Por qué lo llaman
SEO TÉNICO
cuando quieren decir
INDEXACIÓN
8. IÑAKI HUERTA - @IKHUERTA
Autoridad
Rastreo
e Indexación
Semántica
Calidad
9. IÑAKI HUERTA - @IKHUERTA
Otras hipótesis
De Engagement
Sociales
Otras
Señales
Links Externos
Links InternosLinks
Entrantes
Referencias
Credibilidad
(Relación)
Autoritividad
(Reputación y
Marca)
Experiencia
(Demostrada)
Autor
(E-A-T)
Responde a la Intención
Referencia en Internet
MC
Relevante
Page
Quality
Directa/Exacta
Semántica Latente
Natural Language
Similitud
Semántica
con la KW
Intención .
de Búsqueda
Priorización
del
Contenido
Clasificación
Análisis
Documento
URLs Rastreables
URLs Rastreadas
URLs Indexadas
Embudo de
Indexación
Acceso a
Documentos
Contenido
Autoridad
Rastreo
e Indexación
Semántica
Calidad
Priorización
del Rastreo
10. IÑAKI HUERTA - @IKHUERTA
EL PROBLEMA ES QUE NI GOOGLE NOS DEJA CLARO LO
QUÉ ES LA INDEXACIÓN…
“INDEXAR” → Añadir al índice
12. IÑAKI HUERTA - @IKHUERTA
ÚNICO AMBIENTE EN
EL QUE IMPORTA
QUE SIGNIFICA
“URL INDEXADA”
13. IÑAKI HUERTA - @IKHUERTA
EL
ÍNDICETAL Y COMO LO ENTENDEMOS LOS SEO
NO EXISTE
Troleando SEOs desde 1998
Todos sonríen, por algo será…
14. IÑAKI HUERTA - @IKHUERTA
EL ÍNDICE EN UNA BBDD
ID Nombre Apellidos Departamento Puesto Funciones Depende de
1 Pe-Pe Pino - CEO
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
0
2 Car-Men Tira Comercial
Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
3 M-Arta De la vida Financiero Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
4 Sor Iasis Desarrollo Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
5 Vic-Tor Menta Comercial Country Manager
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
2
6 Lu-Is Terico Desarrollo
Dev Leader
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
4
7 Jo-Se Pulcro Financiero Controller
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
3
15. IÑAKI HUERTA - @IKHUERTA
EL ÍNDICE EN UNA BBDD
ID Nombre Apellidos Departamento Puesto Funciones Depende de
1 Pe-Pe Pino - CEO
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
0
2 Car-Men Tira Comercial
Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
3 M-Arta De la vida Financiero Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
4 Sor Iasis Desarrollo Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
5 Vic-Tor Menta Comercial Country Manager
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
2
6 Lu-Is Terico Desarrollo
Dev Leader
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
4
7 Jo-Se Pulcro Financiero Controller
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
3
SI CREAMOS ESTOS TRES CAMPOS COMO ÍNDICES
LA BASE DE DATOS SERÁ MÁS RÁPIDA EN LA MAYORÍA DE SUS BÚSQUEDAS
16. IÑAKI HUERTA - @IKHUERTA
EL ÍNDICE EN UNA BBDD
ID Nombre Apellidos Departamento Puesto Funciones Depende de
1 Pe-Pe Pino - CEO
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
0
2 Car-Men Tira Comercial
Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
3 M-Arta De la vida Financiero Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
4 Sor Iasis Desarrollo Dirección
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
1
5 Vic-Tor Menta Comercial Country Manager
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
2
6 Lu-Is Terico Desarrollo
Dev Leader
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
4
7 Jo-Se Pulcro Financiero Controller
Bla bal bla bla
blablá bla bla bla
blaa bla bla
blablibo …
3
SI CREAMOS ESTOS TRES CAMPOS COMO ÍNDICES
LA BASE DE DATOS SERÁ MÁS RÁPIDA EN LA MAYORÍA DE SUS BÚSQUEDAS
UN ÍNDICE ES SOLO UN SISTEMA DE ORGANIZACIÓN
DE LA INFORMACIÓN QUE PERMITE AGILIZAR CONSULTAS
POR CRITERIOS DEFINIDOS DE ANTEMANO
17. IÑAKI HUERTA - @IKHUERTA
EN GOOGLE EL ÍNDICE
TIENE QUE SER POR
INDEXAR → “ASOCIAR UN RESULTADO A UNA
KEYWORD Y/O INTENCIÓN DE
BÚSQUEDA”
KW
18. IÑAKI HUERTA - @IKHUERTA
KW Nivel 3
KW buscada
KW Interpretada
KW sin interpretar
KW Nivel 2
KW Nivel n
KW más buscadas
…
INDICE DE KW Usadas
Búsquedas
Indexadas
19. IÑAKI HUERTA - @IKHUERTA
KW Nivel 3
KW buscada
KW Interpretada
KW sin interpretar
KW Nivel 2
KW Nivel n
KW más buscadas
Búsquedas no
Interpretadas y
Fuera de Indice
…
INDICE DE KW Usadas
Búsquedas
Indexadas
???
22. IÑAKI HUERTA - @IKHUERTA
DIFERENCIEMOS (por favor)…
RASTREAR ALMACENAR ANALIZAR /
CLASIFICAR
INDEXAR
QUE UNA URL SE RASTREE
NO SIGNIFICA QUE
SIEMPRE SE ALMACENE
23. IÑAKI HUERTA - @IKHUERTA
DIFERENCIEMOS (por favor)…
RASTREAR ALMACENAR ANALIZAR /
CLASIFICAR
INDEXAR
QUE UNA URL SE
ALMACENCE NO IMPLICA
QUE SE ANALICE
24. IÑAKI HUERTA - @IKHUERTA
DIFERENCIEMOS (por favor)…
RASTREAR ALMACENAR ANALIZAR /
CLASIFICAR
INDEXAR
QUE ALGO SE ANALICE NO
SIGNIFICA QUE SE VAYA A
INDEXAR
25. IÑAKI HUERTA - @IKHUERTA
CUAL ES EL
EN INDEXACIÓN
TRABAJO SEO
1 GARANTIZAR LA
DISPONIBILIDAD
Garantizar que Google puede leer lo que
deseamos que lea de nuestro negocio
3
CONTROLAR EL
CRAWL BUDGET
Gestionar los posibles problemas que tenga
la araña y priorizar lo importante
2 MEJORAR LA COBERTURA
Conseguir que Google se tome en serio
nuestros contenidos y los tenga en cuenta
para la indexación
26. IÑAKI HUERTA - @IKHUERTA
SI SÓLO GOOGLE SABE LO QUE SE INDEXA
¿QUÉ TAL SI LE HACEMOS CASO?
27. IÑAKI HUERTA - @IKHUERTA
Aparece en
los SERPs
Válidas
Canónicas
¿canonical?
Etiquetadas o
asignadas
Indexables
¿meta robots?
Etiquetadas
“index” o no
etiquetadas
Texto
HTML
…y algo de
texto
NoHTML
¿tipo archivo?
200 code
(& 304)
¿código HTTP?
Robots
Allowed
¿robots.txt?
Total
de URLs a
Rastrear
Robots Disallowed
400 code
Códigos front
Contenidos “alternate”
NoIndex
500 code
Multimedia
Descubiertas sin rastrear
Duplicadas
Canónicalizadas
Baja calidad
… a rastrear las nuevas URLs …
Perdida, no se trabaja
Referencia a otra URL
Provoca retraso en rastreo
Termina indexando
pero es poco útil
300 code
Thin content
Paginaciones
URLs sin autoridad
otros soft404
401
404
410
Soft 404
js
css
otros xml & feeds
versiones doc/pdf
otros
Robots.txt disallow
Denegación desde server
meta robots
http x-robots-tag
externas
y no canonizables
301
302
307
Etiquetadas
Asignadas por Google
images
videos
otros…
Factores Externos
(links desde otras webs)
URLs
solo con info
externa (links) y sin
rastreo
29. IÑAKI HUERTA - @IKHUERTA
HTML Plano
PRIMERA OLEADA
HTML Plano
versión Desktop
HTML Plano
versión Mobile
2º
1º
30. IÑAKI HUERTA - @IKHUERTA
HTML Plano
versión Desktop
HTML Plano
HTML Plano
versión Mobile
HTML Renderizado
versión Desktop
HTML Renderizado
versión Mobile
HTML Renderizado
3º
2º
1º
4º
PRIMERA OLEADA SEGUNDA OLEADA
31. IÑAKI HUERTA - @IKHUERTA
HTML Plano
versión Desktop
HTML Plano
HTML Plano
versión Mobile
HTML Renderizado
versión Desktop
HTML Renderizado
versión Mobile
HTML Renderizado
Aquí Google no llega aun
Acciones del Usuario
versión Desktop
Acciones del Usuario
versión Mobile
3º
2º
1º
4º
PRIMERA OLEADA SEGUNDA OLEADA
HTML Dinámico
32. IÑAKI HUERTA - @IKHUERTA
HTML Plano
versión Desktop
HTML Plano
HTML Plano
versión Mobile
HTML Renderizado
versión Desktop
HTML Renderizado
versión Mobile
HTML Renderizado
Aquí Google no llega aun
Acciones del Usuario
versión Desktop
Acciones del Usuario
versión Mobile
3º
2º
1º
4º
PRIMERA OLEADA SEGUNDA OLEADA
HTML Dinámico
SÓLO HAY
UN ÍNDICE
33. IÑAKI HUERTA - @IKHUERTA
¡HEY!
Que tengo en los logs datos de googlebot con referal…
¿No será por el render de la segunda ola?
https://www.mecagoenlos.com/Posicionamiento/la-segunda-ola-de.php
Lino Uruñuela:
34. IÑAKI HUERTA - @IKHUERTA
Pues tiene sentido… ¡Eres un pedazo de Crack!
Voy a investigarlo y a ver que saco…
Iñaki Huerta:
35. IÑAKI HUERTA - @IKHUERTA
Pues tiene sentido… ¡Eres un pedazo de Crack!
Voy a investigarlo y a ver que saco…
Iñaki Huerta:
36. IÑAKI HUERTA - @IKHUERTA
Pues tiene sentido… ¡Eres un pedazo de Crack!
Voy a investigarlo y a ver que saco…
Iñaki Huerta:
37. IÑAKI HUERTA - @IKHUERTA
Pues tiene sentido… ¡Eres un pedazo de Crack!
Voy a investigarlo y a ver que saco…
Iñaki Huerta:
38. IÑAKI HUERTA - @IKHUERTA
Visita del bot SIN render
Visita del bot CON render
NO ES VISITA (solo el JS)
Visita del bot CON render
NO ES VISITA (solo el JS)
Pues tiene sentido… ¡Eres un pedazo de Crack!
Voy a investigarlo y a ver que saco…
Iñaki Huerta:
¡Tal cual!
Ya podemos calcular los Renders de
páginas exactos que hace Google
Iñaki Huerta:
39. IÑAKI HUERTA - @IKHUERTA
LA NUEVA FÓRMULA MÁGICA PARA TRABAJAR EL RENDER:
1 Elimina todos los hits con referrer de tus análisis de logs básicos
(no son visitas, son recursos de renderizado)
40. IÑAKI HUERTA - @IKHUERTA
LA NUEVA FÓRMULA MÁGICA PARA TRABAJAR EL RENDER:
1 Elimina todos los hits con referrer de tus análisis de logs básicos
(no son visitas, son recursos de renderizado)
2
Calcula cuantas visitas con render tienes en tu página
Sacamos por los recursos cargados, cuantas veces como minimo se ha renderizado la página
- En tus logs calculas: Total de hits por “URL + Referrer”
- Te quedas con el Referrer y coges el recurso con más hits de todos.
41. IÑAKI HUERTA - @IKHUERTA
LA NUEVA FÓRMULA MÁGICA PARA TRABAJAR EL RENDER:
1 Elimina todos los hits con referrer de tus análisis de logs básicos
(no son visitas, son recursos de renderizado)
2
Calcula cuantas visitas con render tienes en tu página
Sacamos por los recursos cargados, cuantas veces como minimo se ha renderizado la página
- En tus logs calculas: Total de hits por “URL + Referrer”
- Te quedas con el Referrer y coges el recurso con más hits de todos.
3
Total hits sin render = Total Hits – Visitas con Render
Recuerda que esas visitas también las tenias en el análisis normal, pero no sabias que eran visitas
con renderización
42. IÑAKI HUERTA - @IKHUERTA
Visita del bot SIN render
Visita del bot CON render
NO ES VISITA (solo el JS)
Visita del bot CON render
NO ES VISITA (solo el JS)
Pero…
¡¡¡Veo algo raro!!!
Iñaki Huerta:
¿Y ESTO QUÉ ES?
Visita del bot CON render
NO ES VISITA (solo el JS)
¿Y ESTO QUÉ ES?
Visita del bot SIN render
43. IÑAKI HUERTA - @IKHUERTA
Visita del bot SIN render
Visita del bot CON render
NO ES VISITA (solo el JS)
Visita del bot CON render
NO ES VISITA (solo el JS)
Pero…
¡¡¡Veo algo raro!!!
Iñaki Huerta:
¿Y ESTO QUÉ ES?
Visita del bot CON render
NO ES VISITA (solo el JS)
¿Y ESTO QUÉ ES?
Visita del bot SIN render
INSIGHT 1 :
Google no renderiza como un navegador normal o al menos no lo hace en
tiempo real: Acumula información para los renderizados
1. Cachea recursos: De las páginas pide solo los que necesita y cree que no han cambiado.
2. Puede solicitar un mismo recurso varias veces, sobretodo si cree que puede ir cambiando
con el tiempo y la sesión.
44. IÑAKI HUERTA - @IKHUERTA
Páginas renderizadas en 30 días Páginas renderizadas en 6 meses
PRIMERA OLA
SEGUNDA OLA
45. IÑAKI HUERTA - @IKHUERTA
Páginas renderizadas en 30 días Páginas renderizadas en 6 meses
INSIGHT 2 :
El Crawl Budget de renderizado es mucho menor que el normal.
1. Google Renderiza una pequeñísima parte de las páginas. <4%
2. Repite muchas visitas a páginas de gran autoridad (tal y como hace el bot normal) y va
atacando poco a poco a las pendiente, este porcentaje de render más o menos se mantiene
46. IÑAKI HUERTA - @IKHUERTA
Páginas visitadas por día Páginas visitadas por mes
PRIMERA OLA
SEGUNDA OLA
PRIMERA OLA
SEGUNDA OLA
47. IÑAKI HUERTA - @IKHUERTA
Páginas visitadas por día Páginas visitadas por mes
INSIGHT 3 :
No existe relación entre el crawl Budget de la primera y segunda ola
1. Cada uno actúa según sus necesidades
2. La primera oleada no provoca de forma apreciable el lanzamiento de la segunda.
48. IÑAKI HUERTA - @IKHUERTA
Y BUENO…
HEMOS MIRADO
MUCHAS COSAS ;)
49. IÑAKI HUERTA - @IKHUERTA
OTROS INSIGHTS MÁS ANECDÓTICOS:
Sólo se renderizan URLs indexadas (200, no thin, no canonical)
Sobretodo carga JS y algo menos CSS (por la caché)
Los archivos dinámicos se piden mucho más que los cacheados
No imágenes ni fuentes, pero si iframes
Todo archivo al que llama el JS en el onReady se carga
También desde otros dominios cargan los archivos que renderizan
usando archivos nuestros (referal de otros dominios)
50. IÑAKI HUERTA - @IKHUERTA
VAMOS CON EL CRAWL BUDGET:
Partimos de la idea de que…
Google destina a cada dominio unos recursos
Que gasta en rastrear nuestro site (tiempo, coste conexión, etc.)
Así que…
Cuanto menos trabajo le demos más rastreará con esos recursos
51. IÑAKI HUERTA - @IKHUERTA
Tiempo que nos dedican las arañas de Google
En este tiempo tiene que rastrear el máximo posible de
nuestro site siguiendo sus enlaces…
52. IÑAKI HUERTA - @IKHUERTA
Tiempo que nos dedican las arañas de Google
Página
Rastreada
Página
Rastreada
Página 404
No se indexa
Redi-
rección
Página 503
No se indexa
Página
Rastreada
A esta
página las
arañas ya no
llegan
53. IÑAKI HUERTA - @IKHUERTA
Tiempo que nos dedican las arañas de Google
Página
Rastreada
Página
Rastreada
Página 404
No se indexa
Redi-
rección
Página 503
No se indexa
Página
Rastreada
A esta
página las
arañas ya no
lleganTODO ESTO ES TIEMPO QUE
LE HEMOS HECHO PERDER
54. IÑAKI HUERTA - @IKHUERTA
Sólo que…
EL
NO EXISTE
CRAWL BUDGET
55. IÑAKI HUERTA - @IKHUERTA
Sólo que…
EL
NO EXISTE
CRAWL BUDGET
56. IÑAKI HUERTA - @IKHUERTA
PERO SI NOS LO CREEMOS TODO ES MÁS FÁCIL
La idea es la misma…
Destine el esfuerzo que destine Google a nuestro site
Lo gasta en rastrear nuestro Site (tiempo, coste conexión, etc.)
Así que…
Cuanto menos trabajo le demos más rastreará con esos recursos
57. IÑAKI HUERTA - @IKHUERTA
Optimización del
Crawl Budget:
- Errores de servidor (5xx)
- Redirecciones (3xx)
- Páginas que no existen o sin acceso (4xx)
- Páginas “Thin Content”
- Páginas con KW duplicadas
- Páginas y filtros sin KW de negocio
1º. Eliminar Rastreos innecesarios
58. IÑAKI HUERTA - @IKHUERTA
ES IMPORANTE DEFINIR
¿QUÉ ES UNA URL INÚTIL?
¿QUÉ NO VA A INDEXARSE?
¿QUÉ NO APORTA TRÁFICO?
¿QUE NO APORTA NEGOCIO?
59. IÑAKI HUERTA - @IKHUERTA
https://es.slideshare.net/mjcachon
/experimentos-seo-sob18
60. IÑAKI HUERTA - @IKHUERTA
¿CÓMO SE ENTERA
DE LA ORDEN?
Eliminar URL
Anular Parámetros
Bloqueo en Robots
NoIndex en Robots
Meta NoIndex
HTTP NoIndex
404
410
50x
30x
¿CUANTO CASO LE
HACE GOOGLE?
¿A QUÉ
VELOCIDAD?
(desde que se entera)
MÉTODOS DE
DESINDEXACIÓN
GSCRobots.txtCódigosdeServidorHTML
61. IÑAKI HUERTA - @IKHUERTA
¿CÓMO SE ENTERA
DE LA ORDEN?
Forms en GSC
Lo recibe al momento
Eliminar URL
Anular Parámetros
Bloqueo en Robots
NoIndex en Robots
Meta NoIndex
HTTP NoIndex
404
410
50x
30x
Obedece pero sólo 90 días
¿CUANTO CASO LE
HACE GOOGLE?
¿A QUÉ
VELOCIDAD?
(desde que se entera)
Muy Poco
Inmediato
MÉTODOS DE
DESINDEXACIÓN
GSCRobots.txtCódigosdeServidorHTML
62. IÑAKI HUERTA - @IKHUERTA
¿CÓMO SE ENTERA
DE LA ORDEN?
Rastreo del Robots.txt
Varias veces al día
Forms en GSC
Lo recibe al momento
Eliminar URL
Anular Parámetros
Bloqueo en Robots
NoIndex en Robots
Meta NoIndex
HTTP NoIndex
404
410
50x
30x
Obedece pero sólo 90 días
¿CUANTO CASO LE
HACE GOOGLE?
¿A QUÉ
VELOCIDAD?
(desde que se entera)
Muy Poco
No desindexa, Desinforma
Inmediato
En pocos días, pero eso
no significa desindexar
MÉTODOS DE
DESINDEXACIÓN
GSCRobots.txtCódigosdeServidorHTML
63. IÑAKI HUERTA - @IKHUERTA
¿CÓMO SE ENTERA
DE LA ORDEN?
Rastreo del Robots.txt
Varias veces al día
Rastreo de la Página
Depende de la página
Forms en GSC
Lo recibe al momento
Eliminar URL
Anular Parámetros
Bloqueo en Robots
NoIndex en Robots
Meta NoIndex
HTTP NoIndex
404
410
50x
30x
Obedece pero sólo 90 días
¿CUANTO CASO LE
HACE GOOGLE?
¿A QUÉ
VELOCIDAD?
(desde que se entera)
Muy Poco
No desindexa, Desinforma
Obedece y desindexa
Obedece y reindexa
Se vuelve loco ;)
Depende de autoridad
(pero tarda más)
[1º]: 410
[2º]: 404
[3º]: 301
[4º]: 30x
[5º]: 50x… (y si lo hace…)
Inmediato
En pocos días, pero eso
no significa desindexar
MÉTODOS DE
DESINDEXACIÓN
GSCRobots.txtCódigosdeServidorHTML
64. IÑAKI HUERTA - @IKHUERTA
¿CÓMO SE ENTERA
DE LA ORDEN?
Rastreo del Robots.txt
Varias veces al día
Rastreo de la Página
Depende de la página
Forms en GSC
Lo recibe al momento
Eliminar URL
Anular Parámetros
Bloqueo en Robots
NoIndex en Robots
Meta NoIndex
HTTP NoIndex
404
410
50x
30x
Obedece pero sólo 90 días
¿CUANTO CASO LE
HACE GOOGLE?
¿A QUÉ
VELOCIDAD?
(desde que se entera)
Muy Poco
No desindexa, Desinforma
Obedece y desindexa
Obedece y reindexa
Obedece y desindexa
Se vuelve loco ;)
Lectura de la Página
Depende de la página
En menos de 1 día
Depende de autoridad
(pero tarda más)
[1º]: 410
[2º]: 404
[3º]: 301
[4º]: 30x
[5º]: 50x… (y si lo hace…)
Inmediato
En pocos días, pero eso
no significa desindexar
MÉTODOS DE
DESINDEXACIÓN
GSCRobots.txtCódigosdeServidorHTML
65. IÑAKI HUERTA - @IKHUERTA
VALE,
¿QUÉ HACEMOS ENTONCES
CON LAS URLs INÚTILES?
66. IÑAKI HUERTA - @IKHUERTA
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
No
67. IÑAKI HUERTA - @IKHUERTA
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
68. IÑAKI HUERTA - @IKHUERTA
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
69. IÑAKI HUERTA - @IKHUERTA
Sí
¿PODEMOS
APROVECHAR
LA URL?
REDEFINICIÓN DE KW
Y CONTENIDO
Sí
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
70. IÑAKI HUERTA - @IKHUERTA
Sí
¿PODEMOS
APROVECHAR
LA URL?
REDEFINICIÓN DE KW
Y CONTENIDO
Sí
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
¿NECESITAMOS
SEGUIR SUS
ENLACES?
No BLOQUEO
SIN ELIMINAR
No
71. IÑAKI HUERTA - @IKHUERTA
Sí
¿PODEMOS
APROVECHAR
LA URL?
REDEFINICIÓN DE KW
Y CONTENIDO
Sí
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
¿NECESITAMOS
SEGUIR SUS
ENLACES?
No BLOQUEO
SIN ELIMINAR
¿PERDEMOS
AUTH CON EL
ENLACE?
SÍ OFUSCAR SUS
ENLACES
ENTRANTES
Con el nivel de ofuscación
más
complejo posible.
¡Cuidado con abusar!
BLOQUEAR
URL
200
+ Disallow robots.txt
+ Borrar en GSC
No mucha…
No
72. IÑAKI HUERTA - @IKHUERTA
Sí
¿PODEMOS
APROVECHAR
LA URL?
REDEFINICIÓN DE KW
Y CONTENIDO
Sí
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
¿NECESITAMOS
SEGUIR SUS
ENLACES?
No BLOQUEO
SIN ELIMINAR
¿PERDEMOS
AUTH CON EL
ENLACE?
SÍ OFUSCAR SUS
ENLACES
ENTRANTES
Con el nivel de ofuscación
más
complejo posible.
¡Cuidado con abusar!
BLOQUEAR
URL
200
+ Disallow robots.txt
+ Borrar en GSC
No mucha…
¿SUPONE UN
PROBLEMA AL
CRAWL
BUDGET?
No
BUSCA OTRA VÍA
PARA EL ENLAZADO
Sí
S
í
73. IÑAKI HUERTA - @IKHUERTA
Sí
¿PODEMOS
APROVECHAR
LA URL?
REDEFINICIÓN DE KW
Y CONTENIDO
Sí
Sí
URL
INÚTIL
¿ES PARTE
DEL SITE?
ELIMINAR
ENLAZADO
¿TIENE
EQUIVALENTE?
SÍ
301 HACIA
EQUIVALENTE
No
ELIMINAR
URL
404 / 410
+ Disallow robots.txt
+ Borrar en GSC
No
¿APORTA
ALGO AL
USUARIO?
ARREGLOS DE
USABILIDAD
No
¿NECESITAMOS
SEGUIR SUS
ENLACES?
No BLOQUEO
SIN ELIMINAR
¿PERDEMOS
AUTH CON EL
ENLACE?
SÍ OFUSCAR SUS
ENLACES
ENTRANTES
Con el nivel de ofuscación
más
complejo posible.
¡Cuidado con abusar!
BLOQUEAR
URL
200
+ Disallow robots.txt
+ Borrar en GSC
No mucha…
¿SUPONE UN
PROBLEMA AL
CRAWL
BUDGET?
No
BUSCA OTRA VÍA
PARA EL ENLAZADO
Sí
S
í
No
SIMPLEMENTE
QUE NO INDEXE
DESINDEXAR
URL
200
+ noIndex,follow
74. IÑAKI HUERTA - @IKHUERTA
- Tiempos de respuesta del servidor (rendimiento y caché)
- Peso de las páginas (imágenes, scripts, css, html)
- Respuesta de dominios y DNS
- Localización del servidor que da la respuesta
- Negociaciones (cookies, etc.)
2º. Mejorar velocidad de rastreo (WPO)Optimización del
Crawl Budget:
75. IÑAKI HUERTA - @IKHUERTA
SOLO UN CONSEJO:
INVESTIGA
Y ENCUENTRA LOS PROBLEMAS
ANTES DE APLICAR WPO
CARGA DEL HTML
CONEXIÓN
CARGA DEL SERVIDOR
PROCESOS Y CACHÉ RECURSOS DEL FRONT
76. IÑAKI HUERTA - @IKHUERTA
Network & Lighthouse Audits
Recomendaciones + Media de carga Real
Carga desde USA
Detalles fáciles de analizar
Acceso rápido a varias herramientas
unidas
77. IÑAKI HUERTA - @IKHUERTA
- Productos estrella sobre productos
- Categorías con volumen sobre menores
- Primera página sobre el resto
- Páginas de KW con volumen
- Páginas de KW con potencial de volumen (TOP10-15)
- Etc…
3º. Priorizar recursos con mayor potencial SEOOptimización del
Crawl Budget:
78. IÑAKI HUERTA - @IKHUERTA
Distancia de rastreo
Número de saltos que necesita dar la araña desde una URL de gran
autoridad para encontrar tu contenido.
Home
Categoría
Contenido
Página 2
Punto de gran
autoridad
Contenido a
posicionar
79. IÑAKI HUERTA - @IKHUERTA
Número de saltos que necesita dar la araña desde una URL de gran
autoridad para encontrar tu contenido.
Home
Categoría
Contenido
Página 2
21
3
Punto de gran
autoridad
Contenido a
posicionar
Distancia de rastreo
80. IÑAKI HUERTA - @IKHUERTA
Nuestras herramientas de optimización OnSite del Rastreo
Gran mejora
No afectamos
a la UX del site
Afectamos mucho
a la UX del site
Sin mejora
81. IÑAKI HUERTA - @IKHUERTA
Nuestras herramientas de optimización OnSite del Rastreo
Gran mejora
No afectamos
a la UX del site
Afectamos mucho
a la UX del site
Sin mejora
Cambios en la AI
Menús dinámicos y
Breadcrumbs
Rel=nofollow
Robots.txt
Sitemaps.xml
Etiquetados HTML Bloques de linking
Sitemaps HTML
Content Links
Meta Robots
82. IÑAKI HUERTA - @IKHUERTA
Nuestras herramientas de optimización OnSite del Rastreo
Gran mejora
No afectamos
a la UX del site
Afectamos mucho
a la UX del site
Sin mejora
Cambios en la AI
Menús dinámicos y
Breadcrumbs
Rel=nofollow
Robots.txt
Sitemaps.xml
Etiquetados HTML Bloques de linking
Sitemaps HTML
OPTIMIZACIONES TÉCNICAS LINK SCULPING
Content Links
Meta Robots
83. IÑAKI HUERTA - @IKHUERTA
NO HAY NADA QUE AFECTE MÁS A LA
INDEXACIÓNQUE UN CAMBIO COMPLETO DE LA
ARQUITECTURA
DE INFORMACIÓN
84. IÑAKI HUERTA - @IKHUERTA
Al final la indexación es muy simple…
PONLE A GOOGLE DELANTE
TU NEGOCIO
Y OCÚLTALE AQUELLO QUE
PUEDE HACERTE DAÑO
85. IÑAKI HUERTA - @IKHUERTA
¡GRACIAS!
@ikhuerta
Ikaue.com
hola@Ikaue.com