SlideShare una empresa de Scribd logo
1 de 53
Descargar para leer sin conexión
#wmf16
Federico Sasso @vseostudio
Comprendere la
Crawl Budget Optimization
#wmf16
Federico Sasso @vseostudio
Mi presento
Federico Sasso
● Sviluppatore Software
● SEO
● Moderatore Forum GT
● Neo Imprenditore
● ...
● Autore di
Visual SEO Studio
#wmf16
Federico Sasso @vseostudio
Alzate la mano
● chi ha idea di cosa sia il Crawl Budget?
● chi ha mai dovuto ottimizzarlo?
#wmf16
Federico Sasso @vseostudio
Oggi vi parlerò di
● Cos'è il Crawl Budget
● Quando serve preoccuparsene
● Come ottimizzarlo
#wmf16
Federico Sasso @vseostudio
Cos’è il Crawl Budget?
#wmf16
Federico Sasso @vseostudio
Cos’è il Crawl Budget?
La quantità di risorse che il motore
di ricerca alloca in un periodo di
tempo per visitare il tuo sito
#wmf16
Federico Sasso @vseostudio
Cos’è il Crawl Budget?
Gary Illyes fornisce qualche chiarimento
#wmf16
Federico Sasso @vseostudio
Cos’è il Crawl Budget?
“It's more like what's the limit or what's a threshold where there
or after which the server becomes slower for example or stuff
like that.”
Gary Illyes, 5 Maggio 2016
#wmf16
Federico Sasso @vseostudio
Cos’è il Crawl Budget?
● I SEO parlano di
Crawl Budget
● I Motori di Ricerca parlano di
Schedulazione
#wmf16
Federico Sasso @vseostudio
Il Crawling visto dal SEO
#wmf16
Federico Sasso @vseostudio
Il Crawling visto dal MdR
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Il Motore di Ricerca reperisce elenchi di URL da
visitare da diverse fonti:
● Domini registrati
● Record DNS
● Link estratti da pagine (interni)
● Link estratti da pagine (esterni)
● Sitemap XML
● Testi che sembrano URL
● Tag/attributi con URL
● ...
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Scheduler Lista
URL
HTTP
Parser
(estrazione link)
Normalizzazione / CanonicalizzazionePrioritizzazione
Altre fonti
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
La prima volta che Googlebot visita un sito, di cui
non sa nulla, richiede solo la prima pagina.
Ovvio: è l’unico URL che conosce.
Non è compito del crawler estrarre i link e decidere
quali altre pagine esplorare!
==> Crawl Budget = 1 pagina
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Scheduler Lista
URL
HTTP
Parser
(estrazione link)
Prioritizzazione
Altre fonti
Normalizzazione / Canonicalizzazione
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Il Parser estrae i link e alimenta la lista URL
● HTTP X-Robots-Tag
● robots meta tag
● Canonical link header
● Canonical link tag
● Normalizzazione
● rel=“nofollow”
● robots.txt
● Numero di link
● Dimensione pagina
● Errori HTML
● ...
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Scheduler Lista
URL
HTTP
Parser
(estrazione link)
Prioritizzazione
Altre fonti
Normalizzazione / Canonicalizzazione
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
Non tutti gli URL sono prioritizzati allo stesso modo
● PageRank
● Importanza
● Profondità di link
● Storia/Frequenza aggiornamento
● Presenza in Sitemap
● Storico prestazioni
● Linking interno
● Tipo di contenuto
● Posizione link in HTML
● Lunghezza URL?
● ...
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
● Alcuni URL ritenuti “importanti” saranno visitati
prima / più frequentemente
● Altri saranno visitati dopo, e meno
frequentemente
● Altri ancora… rassegnatevi!
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
L’esplorazione Breadth-First (“in ampiezza”), in
assenza di segnali esterni, è dimostrato essere il
metodo più efficiente per il MdR per trovare prima
pagine importanti.
Eppure è solo una vaga approssimazione
dell’ordine di crawl.
#wmf16
Federico Sasso @vseostudio
Come funziona il Crawling
L’ordine di Crawling non è prevedibile con certezza.
● Breadth-first tarato da PageRank
● Pipeline asincrona
(crawling, link extraction, …)
● Chiamate HTTP asincrone
● Code asincrone
● Il sistema gestisce URL da molti siti
● Posizione link in HTML
● Lunghezza URL?
● ...
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
L’ 89.73% dei siti non si deve preoccupare
di Crawl Budget Optimization
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
L’ 89.73% dei siti non si deve preoccupare
di Crawl Budget Optimization
OK,
Questo me lo
sono inventato
per fare colpo
:)
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
La CBO è un
problema più
sentito per i
siti grandi.
Siti piccoli e
che cambiano
poco possono
ignorarla.
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
Quando serve ottimizzare il “crawl budget”:
Poniamo di avere un piccolo
e-commerce
● 50.000 pagine
● Googlebot:
max 1 richiesta ogni 30”
==>
occorrono almeno 17 giorni perché il motore di
ricerca possa rivisitarne tutte le pagine.
#wmf16
Federico Sasso @vseostudio
È sufficiente?
Un’idea del crawl budget la si può avere dalle
statistiche di scansione di Google Search Console
Va considerata tenendo conto conto del numero di
pagine e dei tassi di crescita e aggiornamento.
#wmf16
Federico Sasso @vseostudio
Chi ha bisogno della CBO?
● Quante pagine ha il sito?
(più di quanto pensa il cliente)
● Che crawl-path seguono gli spider?
dov’è il crawl-waste?
● I contenuti importanti sono
(ri)visitati nei tempi
desiderati?
● Che velocità di scansione
massima imposta il MdR?
#wmf16
Federico Sasso @vseostudio
Il numero totale di pagine
Per sapere quante pagine ha il sito, il modo
migliore è contarle con uno “SEO spider”.
Occhio alle opzioni di esplorazione!
#wmf16
Federico Sasso @vseostudio
La velocità Crawling
Nel caso di Google, potete scoprire da soli qual è la velocità di
scansione massima del vostro sito:
In Search Console
Impostazioni >
Velocità di scansione
● Selezionate “Limita la velocità massima di scansione di
Google”
● Leggete il valore attuale
● E poi scegliete “Annulla!”
#wmf16
Federico Sasso @vseostudio
Individuare crawl-waste
Tramite uso di Log Analyzer
Pro: dati reali
Contro:
● File di log non sempre disponibili
● Elaborazione complessa, tempi molto lunghi prima di
poter analizzare dopo modifiche
● Impossibile lavorare su sistema di pre-produzione
#wmf16
Federico Sasso @vseostudio
Individuare crawl-waste
Tramite uso di un SEO Crawler
Pro:
●
Anche su sito pre-produzione
●
Visualizzazione crawl-path
(Visual SEO Studio, altri?)
● Lavoro iterativo
●
Tempi più ridotto per testare modifiche
Contro:
● Emulazione
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Si interviene tramite:
● robots.txt
● rel=”nofollow”
● Struttura di link
● Meta robots
● Fix errori 404, 30x, etc...
● Impostazione Parametri URL
● Eliminazione contenuti inutili
● Eliminazione contenuti inutili
● Migliorare prestazione web server
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Intervenire sui robots.txt
Poco elegante, ma tampona un problema e costa
nulla. Occhio, i robots.txt tendono a “fumarsi”...
User-agent: *
Disallow: /spammy-forum/
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Ci sono casi in cui
l’attributo
rel=“nofollow”
salva il crawl budget!
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
La “faceted navigation” degli e-commerce può creare
migliaia di crawl-path indesiderati.
Un bel
rel=“nofollow”
e non ci
pensiamo più.
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
La “faceted navigation” degli e-commerce può creare
migliaia di crawl-path indesiderati.
A volte
possiamo
riuscire a
risolvere con
wild-cards nel
robots.txt
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
La “faceted navigation” degli e-commerce può creare
migliaia di crawl-path indesiderati.
Altre volte
riusciamo invece
a risolvere
impostando (sul
singolo motore di
ricerca) i
Parametri URL
da ignorare
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
La “faceted navigation” degli e-commerce può creare
migliaia di crawl-path indesiderati.
Occhio:
un crawl-path
canonico
dobbiamo
sempre
lasciarlo!
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Controllare i percorsi di esplorazione è un po’
come cercare di controllare l’acqua
Portate pazienza!
#wmf16
Federico Sasso @vseostudio
Avvertimento!
Se devo intervenire pesantemente con
espressioni complesse nel robots.txt e con regole
nei Parametri URL...
è segno che
la struttura
degli URL
ha seri
problemi!
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Intervenire sulla struttura di link
Evitare i
menu
esaustivi
(usabilità a
parte)
permette
miglior
controllo sui
crawl-path
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Una struttura di link gerarchica rende più facile ai
MdR attribuire importanza e priorità alle pagine, e
definisce percorsi di esplorazione chiari
Home Page
Prodotti Servizi Blog
Prod. A Prod. A Serv. A Serv. B Post A Post 2
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
“L’URL che non c’è
non spreca
crawl-budget”
Henry Ford
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Eliminate i contenuti
duplicati!
(e quelli inutili)
#wmf16
Federico Sasso @vseostudio
Come ottimizzare il crawl-budget?
Eliminate gli errori
HTTP
(broken links,
redirects...)
#wmf16
Federico Sasso @vseostudio
Suggerimento
Lo strumento migliore per rilevare contenuti
duplicati ed errori HTTP non è la Search Console
Crawlate, crawlate, crawlate!
#wmf16
Federico Sasso @vseostudio
La velocità Crawling
Migliorare il tempo di
risposta del sito
aumenta il crawl
budget.
...spesso in modo
anche più marcato
che in questo
esempio!
#wmf16
Federico Sasso @vseostudio
Cosa abbiamo visto oggi
● Cos'è il Crawl Budget
● Quando serve preoccuparsene
● Come ottimizzarlo
#wmf16
Federico Sasso @vseostudio
fin
#wmf16
Federico Sasso @vseostudio
Riferimenti
● Scheduler for Search Engine Crawler
http://www.google.com/patents/US8707313
● Enrico Altavilla – SEO serendipità
http://www.lowlevel.it/seo-serendipita-cosa-si-scopre-su-googlebot-quando-me
no-te-laspetti/
● Google crawl order
https://www.onetomarket.nl/blog/seo/google-crawler-bewegingen/
● Google patent granted on polite web crawling
http://www.seobythesea.com/2010/08/google-patent-granted-on-polite-web-cr
awling/
● Crawling the web: Discovery and Maintenance of large-scale web data
http://oak.cs.ucla.edu/~cho/papers/cho-thesis.pdf
● Google.com is your friend :)
#wmf16
Federico Sasso @vseostudio
Grazie!
Federico Sasso
● @vseostudio
● https://plus.google.com/u/0/+FedericoSasso
● https://www.linkedin.com/in/federicosasso
● http://visual-seo.com/it/

Más contenido relacionado

La actualidad más candente

Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOSemrush Italia
 
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Giovanni Sacheli
 
Potare un sito web: come farlo correttamente
Potare un sito web: come farlo correttamentePotare un sito web: come farlo correttamente
Potare un sito web: come farlo correttamenteSemrush Italia
 
Consigli e best practices SEO e PPC per l'Ecommerce
Consigli e best practices SEO e PPC per l'EcommerceConsigli e best practices SEO e PPC per l'Ecommerce
Consigli e best practices SEO e PPC per l'EcommerceMOCA Interactive
 
Black Hat Seo: il Lato Oscuro della SEO
Black Hat Seo: il Lato Oscuro della SEOBlack Hat Seo: il Lato Oscuro della SEO
Black Hat Seo: il Lato Oscuro della SEOPaolo Dello Vicario
 
Ottimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaOttimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaTiziano Fogliata
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyMeta Line
 
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...Andrea Spila
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleGiovanni Sacheli
 
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...Libro SEO
 
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015Andrea Cardinali
 
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOChrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOGiovanni Sacheli
 
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...Giovanni Sacheli
 
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016Giovanni Sacheli
 
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...Andrea Cardinali
 
Le basi della SEO | Quando il posizionamento ha un'anima
Le basi della SEO | Quando il posizionamento ha un'animaLe basi della SEO | Quando il posizionamento ha un'anima
Le basi della SEO | Quando il posizionamento ha un'animaMichele Franzese
 

La actualidad más candente (18)

Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEO
 
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
 
Potare un sito web: come farlo correttamente
Potare un sito web: come farlo correttamentePotare un sito web: come farlo correttamente
Potare un sito web: come farlo correttamente
 
Consigli e best practices SEO e PPC per l'Ecommerce
Consigli e best practices SEO e PPC per l'EcommerceConsigli e best practices SEO e PPC per l'Ecommerce
Consigli e best practices SEO e PPC per l'Ecommerce
 
Black Hat Seo: il Lato Oscuro della SEO
Black Hat Seo: il Lato Oscuro della SEOBlack Hat Seo: il Lato Oscuro della SEO
Black Hat Seo: il Lato Oscuro della SEO
 
Ottimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaOttimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricerca
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
 
Seo Audit Demo
Seo Audit DemoSeo Audit Demo
Seo Audit Demo
 
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...
Motori di ricerca, SEO e PPC per traduttori e interpreti. Come farsi pubblici...
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search Console
 
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...
SEO efficace per le aziende italiane dopo Google Panda e Google Penguin SMAU ...
 
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015
WPDay 2015 - WordPress Performance Optimization - Pordenone - 13 Novembre 2015
 
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOChrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
 
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
Tracciare le azioni sul sito con Google Analytics e Tag Manager - Web Marketi...
 
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
Scansioni avanzate con Screaming Frog - Advanced SEO Tools 2016
 
Negative SEO
Negative SEONegative SEO
Negative SEO
 
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...
5 consigli SEO da tenere a mente durante lo sviluppo di temi e plugin @ WpCam...
 
Le basi della SEO | Quando il posizionamento ha un'anima
Le basi della SEO | Quando il posizionamento ha un'animaLe basi della SEO | Quando il posizionamento ha un'anima
Le basi della SEO | Quando il posizionamento ha un'anima
 

Similar a [IT] Comprendere la Crawl Budget Optimization

Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)
Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)
Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)Giorgio Taverniti
 
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013FIND / Search Driven Marketing
 
Search engine optimization - Posizionare un sito web nei motori di ricerca
Search engine optimization -  Posizionare un sito web nei motori di ricercaSearch engine optimization -  Posizionare un sito web nei motori di ricerca
Search engine optimization - Posizionare un sito web nei motori di ricercaWeb In Fermento
 
Seo per ecommerce - Caso Studio Birredamanicomio.com
Seo per ecommerce - Caso Studio Birredamanicomio.comSeo per ecommerce - Caso Studio Birredamanicomio.com
Seo per ecommerce - Caso Studio Birredamanicomio.comFattoretto s.r.l.
 
Massimo Fattoretto - Seo per ecommerce
Massimo Fattoretto - Seo per ecommerce  Massimo Fattoretto - Seo per ecommerce
Massimo Fattoretto - Seo per ecommerce semrush_webinars
 
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptx
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptxL'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptx
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptxEcommerce HUB
 
Technical seo | Primositoweb.it
 Technical seo | Primositoweb.it Technical seo | Primositoweb.it
Technical seo | Primositoweb.itstefano basso
 
Dalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationDalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationMartino Mosna
 
21 SEO actions per il lancio di un nuovo sito
21 SEO actions per il lancio di un nuovo sito21 SEO actions per il lancio di un nuovo sito
21 SEO actions per il lancio di un nuovo sitoMarketing Freaks
 
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...Bizup
 
Web Analytics nelal SEO e nella SEM
Web Analytics nelal SEO e nella SEMWeb Analytics nelal SEO e nella SEM
Web Analytics nelal SEO e nella SEMMatteo Zambon
 
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...Matteo Stefan
 
Session isolation e rendering delle pagine web
Session isolation e rendering delle pagine webSession isolation e rendering delle pagine web
Session isolation e rendering delle pagine webGiacomo Zecchini
 
Nozioni Base Di Seo
Nozioni Base Di SeoNozioni Base Di Seo
Nozioni Base Di SeoPivari.com
 

Similar a [IT] Comprendere la Crawl Budget Optimization (20)

Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)
Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)
Gtstudy2008: Breve presentazione SEO (senza l'argomento popolarità)
 
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013
Come pianificare e mettere in atto una migrazione SEO - SuperSummit 2013
 
Search engine optimization - Posizionare un sito web nei motori di ricerca
Search engine optimization -  Posizionare un sito web nei motori di ricercaSearch engine optimization -  Posizionare un sito web nei motori di ricerca
Search engine optimization - Posizionare un sito web nei motori di ricerca
 
Seo per ecommerce - Caso Studio Birredamanicomio.com
Seo per ecommerce - Caso Studio Birredamanicomio.comSeo per ecommerce - Caso Studio Birredamanicomio.com
Seo per ecommerce - Caso Studio Birredamanicomio.com
 
Massimo Fattoretto - Seo per ecommerce
Massimo Fattoretto - Seo per ecommerce  Massimo Fattoretto - Seo per ecommerce
Massimo Fattoretto - Seo per ecommerce
 
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptx
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptxL'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptx
L'importanza dei Core Web Vitals per l'ecommerce - Ivano Di Biasi.pptx
 
Giuseppe Liguori: SEO Audit tecnico
Giuseppe Liguori: SEO Audit tecnicoGiuseppe Liguori: SEO Audit tecnico
Giuseppe Liguori: SEO Audit tecnico
 
Technical seo | Primositoweb.it
 Technical seo | Primositoweb.it Technical seo | Primositoweb.it
Technical seo | Primositoweb.it
 
Dalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationDalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget Optimization
 
Salvo
SalvoSalvo
Salvo
 
21 SEO actions per il lancio di un nuovo sito
21 SEO actions per il lancio di un nuovo sito21 SEO actions per il lancio di un nuovo sito
21 SEO actions per il lancio di un nuovo sito
 
Errori Comuni nella SEO - Intervento Smau 2020
Errori Comuni nella SEO - Intervento Smau 2020Errori Comuni nella SEO - Intervento Smau 2020
Errori Comuni nella SEO - Intervento Smau 2020
 
Workshop Seo Basic
Workshop Seo BasicWorkshop Seo Basic
Workshop Seo Basic
 
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...
Ottimizzare il ROI di una campagnal link-building - Monari SEO al Web Marketi...
 
Errori Comuni nella SEO - Intervento smau 2020
Errori Comuni nella SEO - Intervento smau 2020Errori Comuni nella SEO - Intervento smau 2020
Errori Comuni nella SEO - Intervento smau 2020
 
Web Analytics nelal SEO e nella SEM
Web Analytics nelal SEO e nella SEMWeb Analytics nelal SEO e nella SEM
Web Analytics nelal SEO e nella SEM
 
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
Tre modi per aumentare la velocità del tuo Business Website e guadagnare on...
 
Seonoantri
SeonoantriSeonoantri
Seonoantri
 
Session isolation e rendering delle pagine web
Session isolation e rendering delle pagine webSession isolation e rendering delle pagine web
Session isolation e rendering delle pagine web
 
Nozioni Base Di Seo
Nozioni Base Di SeoNozioni Base Di Seo
Nozioni Base Di Seo
 

[IT] Comprendere la Crawl Budget Optimization

  • 1. #wmf16 Federico Sasso @vseostudio Comprendere la Crawl Budget Optimization
  • 2. #wmf16 Federico Sasso @vseostudio Mi presento Federico Sasso ● Sviluppatore Software ● SEO ● Moderatore Forum GT ● Neo Imprenditore ● ... ● Autore di Visual SEO Studio
  • 3. #wmf16 Federico Sasso @vseostudio Alzate la mano ● chi ha idea di cosa sia il Crawl Budget? ● chi ha mai dovuto ottimizzarlo?
  • 4. #wmf16 Federico Sasso @vseostudio Oggi vi parlerò di ● Cos'è il Crawl Budget ● Quando serve preoccuparsene ● Come ottimizzarlo
  • 6. #wmf16 Federico Sasso @vseostudio Cos’è il Crawl Budget? La quantità di risorse che il motore di ricerca alloca in un periodo di tempo per visitare il tuo sito
  • 7. #wmf16 Federico Sasso @vseostudio Cos’è il Crawl Budget? Gary Illyes fornisce qualche chiarimento
  • 8. #wmf16 Federico Sasso @vseostudio Cos’è il Crawl Budget? “It's more like what's the limit or what's a threshold where there or after which the server becomes slower for example or stuff like that.” Gary Illyes, 5 Maggio 2016
  • 9. #wmf16 Federico Sasso @vseostudio Cos’è il Crawl Budget? ● I SEO parlano di Crawl Budget ● I Motori di Ricerca parlano di Schedulazione
  • 10. #wmf16 Federico Sasso @vseostudio Il Crawling visto dal SEO
  • 11. #wmf16 Federico Sasso @vseostudio Il Crawling visto dal MdR
  • 12. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Il Motore di Ricerca reperisce elenchi di URL da visitare da diverse fonti: ● Domini registrati ● Record DNS ● Link estratti da pagine (interni) ● Link estratti da pagine (esterni) ● Sitemap XML ● Testi che sembrano URL ● Tag/attributi con URL ● ...
  • 13. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Scheduler Lista URL HTTP Parser (estrazione link) Normalizzazione / CanonicalizzazionePrioritizzazione Altre fonti
  • 14. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling La prima volta che Googlebot visita un sito, di cui non sa nulla, richiede solo la prima pagina. Ovvio: è l’unico URL che conosce. Non è compito del crawler estrarre i link e decidere quali altre pagine esplorare! ==> Crawl Budget = 1 pagina
  • 15. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Scheduler Lista URL HTTP Parser (estrazione link) Prioritizzazione Altre fonti Normalizzazione / Canonicalizzazione
  • 16. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Il Parser estrae i link e alimenta la lista URL ● HTTP X-Robots-Tag ● robots meta tag ● Canonical link header ● Canonical link tag ● Normalizzazione ● rel=“nofollow” ● robots.txt ● Numero di link ● Dimensione pagina ● Errori HTML ● ...
  • 17. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Scheduler Lista URL HTTP Parser (estrazione link) Prioritizzazione Altre fonti Normalizzazione / Canonicalizzazione
  • 18. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling Non tutti gli URL sono prioritizzati allo stesso modo ● PageRank ● Importanza ● Profondità di link ● Storia/Frequenza aggiornamento ● Presenza in Sitemap ● Storico prestazioni ● Linking interno ● Tipo di contenuto ● Posizione link in HTML ● Lunghezza URL? ● ...
  • 19. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling ● Alcuni URL ritenuti “importanti” saranno visitati prima / più frequentemente ● Altri saranno visitati dopo, e meno frequentemente ● Altri ancora… rassegnatevi!
  • 20. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling L’esplorazione Breadth-First (“in ampiezza”), in assenza di segnali esterni, è dimostrato essere il metodo più efficiente per il MdR per trovare prima pagine importanti. Eppure è solo una vaga approssimazione dell’ordine di crawl.
  • 21. #wmf16 Federico Sasso @vseostudio Come funziona il Crawling L’ordine di Crawling non è prevedibile con certezza. ● Breadth-first tarato da PageRank ● Pipeline asincrona (crawling, link extraction, …) ● Chiamate HTTP asincrone ● Code asincrone ● Il sistema gestisce URL da molti siti ● Posizione link in HTML ● Lunghezza URL? ● ...
  • 22. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO?
  • 23. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO? L’ 89.73% dei siti non si deve preoccupare di Crawl Budget Optimization
  • 24. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO? L’ 89.73% dei siti non si deve preoccupare di Crawl Budget Optimization OK, Questo me lo sono inventato per fare colpo :)
  • 25. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO? La CBO è un problema più sentito per i siti grandi. Siti piccoli e che cambiano poco possono ignorarla.
  • 26. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO? Quando serve ottimizzare il “crawl budget”: Poniamo di avere un piccolo e-commerce ● 50.000 pagine ● Googlebot: max 1 richiesta ogni 30” ==> occorrono almeno 17 giorni perché il motore di ricerca possa rivisitarne tutte le pagine.
  • 27. #wmf16 Federico Sasso @vseostudio È sufficiente? Un’idea del crawl budget la si può avere dalle statistiche di scansione di Google Search Console Va considerata tenendo conto conto del numero di pagine e dei tassi di crescita e aggiornamento.
  • 28. #wmf16 Federico Sasso @vseostudio Chi ha bisogno della CBO? ● Quante pagine ha il sito? (più di quanto pensa il cliente) ● Che crawl-path seguono gli spider? dov’è il crawl-waste? ● I contenuti importanti sono (ri)visitati nei tempi desiderati? ● Che velocità di scansione massima imposta il MdR?
  • 29. #wmf16 Federico Sasso @vseostudio Il numero totale di pagine Per sapere quante pagine ha il sito, il modo migliore è contarle con uno “SEO spider”. Occhio alle opzioni di esplorazione!
  • 30. #wmf16 Federico Sasso @vseostudio La velocità Crawling Nel caso di Google, potete scoprire da soli qual è la velocità di scansione massima del vostro sito: In Search Console Impostazioni > Velocità di scansione ● Selezionate “Limita la velocità massima di scansione di Google” ● Leggete il valore attuale ● E poi scegliete “Annulla!”
  • 31. #wmf16 Federico Sasso @vseostudio Individuare crawl-waste Tramite uso di Log Analyzer Pro: dati reali Contro: ● File di log non sempre disponibili ● Elaborazione complessa, tempi molto lunghi prima di poter analizzare dopo modifiche ● Impossibile lavorare su sistema di pre-produzione
  • 32. #wmf16 Federico Sasso @vseostudio Individuare crawl-waste Tramite uso di un SEO Crawler Pro: ● Anche su sito pre-produzione ● Visualizzazione crawl-path (Visual SEO Studio, altri?) ● Lavoro iterativo ● Tempi più ridotto per testare modifiche Contro: ● Emulazione
  • 33. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget?
  • 34. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Si interviene tramite: ● robots.txt ● rel=”nofollow” ● Struttura di link ● Meta robots ● Fix errori 404, 30x, etc... ● Impostazione Parametri URL ● Eliminazione contenuti inutili ● Eliminazione contenuti inutili ● Migliorare prestazione web server
  • 35. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Intervenire sui robots.txt Poco elegante, ma tampona un problema e costa nulla. Occhio, i robots.txt tendono a “fumarsi”... User-agent: * Disallow: /spammy-forum/
  • 36. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Ci sono casi in cui l’attributo rel=“nofollow” salva il crawl budget!
  • 37. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? La “faceted navigation” degli e-commerce può creare migliaia di crawl-path indesiderati. Un bel rel=“nofollow” e non ci pensiamo più.
  • 38. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? La “faceted navigation” degli e-commerce può creare migliaia di crawl-path indesiderati. A volte possiamo riuscire a risolvere con wild-cards nel robots.txt
  • 39. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? La “faceted navigation” degli e-commerce può creare migliaia di crawl-path indesiderati. Altre volte riusciamo invece a risolvere impostando (sul singolo motore di ricerca) i Parametri URL da ignorare
  • 40. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? La “faceted navigation” degli e-commerce può creare migliaia di crawl-path indesiderati. Occhio: un crawl-path canonico dobbiamo sempre lasciarlo!
  • 41. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Controllare i percorsi di esplorazione è un po’ come cercare di controllare l’acqua Portate pazienza!
  • 42. #wmf16 Federico Sasso @vseostudio Avvertimento! Se devo intervenire pesantemente con espressioni complesse nel robots.txt e con regole nei Parametri URL... è segno che la struttura degli URL ha seri problemi!
  • 43. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Intervenire sulla struttura di link Evitare i menu esaustivi (usabilità a parte) permette miglior controllo sui crawl-path
  • 44. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Una struttura di link gerarchica rende più facile ai MdR attribuire importanza e priorità alle pagine, e definisce percorsi di esplorazione chiari Home Page Prodotti Servizi Blog Prod. A Prod. A Serv. A Serv. B Post A Post 2
  • 45. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? “L’URL che non c’è non spreca crawl-budget” Henry Ford
  • 46. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Eliminate i contenuti duplicati! (e quelli inutili)
  • 47. #wmf16 Federico Sasso @vseostudio Come ottimizzare il crawl-budget? Eliminate gli errori HTTP (broken links, redirects...)
  • 48. #wmf16 Federico Sasso @vseostudio Suggerimento Lo strumento migliore per rilevare contenuti duplicati ed errori HTTP non è la Search Console Crawlate, crawlate, crawlate!
  • 49. #wmf16 Federico Sasso @vseostudio La velocità Crawling Migliorare il tempo di risposta del sito aumenta il crawl budget. ...spesso in modo anche più marcato che in questo esempio!
  • 50. #wmf16 Federico Sasso @vseostudio Cosa abbiamo visto oggi ● Cos'è il Crawl Budget ● Quando serve preoccuparsene ● Come ottimizzarlo
  • 52. #wmf16 Federico Sasso @vseostudio Riferimenti ● Scheduler for Search Engine Crawler http://www.google.com/patents/US8707313 ● Enrico Altavilla – SEO serendipità http://www.lowlevel.it/seo-serendipita-cosa-si-scopre-su-googlebot-quando-me no-te-laspetti/ ● Google crawl order https://www.onetomarket.nl/blog/seo/google-crawler-bewegingen/ ● Google patent granted on polite web crawling http://www.seobythesea.com/2010/08/google-patent-granted-on-polite-web-cr awling/ ● Crawling the web: Discovery and Maintenance of large-scale web data http://oak.cs.ucla.edu/~cho/papers/cho-thesis.pdf ● Google.com is your friend :)
  • 53. #wmf16 Federico Sasso @vseostudio Grazie! Federico Sasso ● @vseostudio ● https://plus.google.com/u/0/+FedericoSasso ● https://www.linkedin.com/in/federicosasso ● http://visual-seo.com/it/