Taller de 2 horitas, sobre Screaming Frog versón 10, y todo lo que podemos exprimir la tool para hacer SEO y analizar webs.
Disponible en vídeo https://www.youtube.com/watch?v=S59TLVW6Svg
5. @mjcachon#SEOconlaRana
¿Qué es un crawler?
Screaming Frog es un programa que simula el
comportamiento de un crawler, es decir, inspecciona
páginas web de manera sistemática y recoge
información relevante en cada rastreo, útil para su
posterior análisis.
El crawler funciona como cualquier otro bot o araña,
rastreando los contenidos saltando de enlace en enlace y
recabando los distintos tipologías de contenidos, su
extensión, su formato, su status actual y una interminable
lista de ítems de gran utilidad para el diagnóstico SEO.
6. @mjcachon#SEOconlaRana
¿Qué es Screaming Frog?
• Crawler de escritorio
• Windows & iOS
• Scraper personalizado
• Buscador de código
• Crawleos Modo lista, modo sitemap
• Render & Ajax
• Hreflang
• Https
8. @mjcachon#SEOconlaRana
Interfaz de Screaming Frog
• Panel Central:
Tablas de
información por
pestañas
• Panel Lateral: Tablas
de datos
acumulados en %
• Panel Inferior: Info
adicional individual
por url seleccionada
en el panel central
9. @mjcachon#SEOconlaRana
Principales usos de la herramienta
Análisis en bruto de un proyecto
para detectar el status actual de una
web, en términos de SEO On Page,
etiquetas e instrucciones para robots,
extensión de los contenidos, tiempo
de carga, situación del enlazado,
etc.
Emular comportamiento de un rastreador
para comprobar y comprender cómo se
rastrean e indexan los contenidos del sitio
web analizado.
10. @mjcachon#SEOconlaRana
Formas de usar Screaming Frog
1. Análisis “en bruto” del estado de una web
2. Extraer o detectar mejoras
3. Comprobación de implementaciones
4. Simulación de cómo rastrearía Googlebot el sitio web
5. Otras revisiones específicas
a. Chequear urls de un sitemap o índice de sitemaps
b. Chequear una web en pre-producción
c. Chequear redirecciones tras una migración
d. Chequear marcado hreflang de un proyecto
internacional
e. Chequear qué urls son más “fuertes”
f. Visualizar el sitio
g. …
12. @mjcachon#SEOconlaRana
Uso 1
Uso 1
1. Chequear recursos de imágenes (src)
2. Chequear recursos de css
3. Chequear recursos de js
4. Chequear recursos de flash
5. Chequear recursos (enlaces) externos
6. Chequear enlaces fuera de la carpeta de inicio
7. Seguir los enlaces internos “nofollow”
8. Seguir los enlaces externos “nofollow”
9. Rastrear todos los Subdominios
10. Rastrear fuera de la carpeta de inicio
11. Rastrear Canonicals (discovery)
12. Rastrear Next/Prev
13. Extraer Hreflang
14. Rastrear Hreflang
15. Extraer AMP Links
16. Rastrear AMP Links
17. Rastrear Sitemaps enlazados
18. Auto-descubrir Sitemaps del Robots.txt
19. Rastrear estos Sitemaps:
13. @mjcachon#SEOconlaRana
1. Limitar nº de urls
2. Limitar profundidad de rastreo
3. Limitar profundidad de carpetas máximas
4. Limitar numero de query strings (param)
5. Longitud máxima de url a rastrear
6. Redirecciones máximas a seguir
14. @mjcachon#SEOconlaRana
1. Rastreo texto
2. Rastreo Ajax
3. Rastreo Javascript
1. Permitir capturas de página renderizada
2. Tiempo máximo en peticiones Ajax
3. Tamaño de la pantalla
17. @mjcachon#SEOconlaRana
1. Permitir Cookies
2. Pausar con alto consumo de memoria
3. Siempre seguir redirecciones
4. Siempre seguir canonicals
5. Respetar noindex
6. Respetar canonical
7. Respect next/prev
8. Extraer imágenes de atributos img srcset
9. Respetar política HSTS
10. Respetar auto-meta-refresh
11. Tiempo máximo de respuesta
12. Nº máximo de re-intentos en 5xx
13. Guardar HTML
14. Guardar HTML Renderizado
21. @mjcachon#SEOconlaRana
Gestión de Parámetros
IMPORTANTE: entender qué comportamiento hace cada parámetro
Parámetro Pasivo: No cambia el contenido
Parámetro Activo: Si influye en el contenido,
¿cómo?
- Pagina
- Ordena
- Especifica
- Restringe
- …
38. @mjcachon#SEOconlaRana
Enlazado Interno Actual (I)
Conocer cuántos links internos recibe cada página y desde cuantas páginas internas
Las que tengan pocos enlaces y sean urls importantes, habrá que potenciarlas
62. @mjcachon#SEOconlaRana
• Resumen del crawleo
• Cadenas de redirecciones y canonicals
• Errores de canonicals
• Errores de rel next rel prev
• Errores de hreflang
• Errores de https
• Resumen de etiquetas
• Gaps urls crawleadas vs GA y GSC
Otros usos: reports