SlideShare a Scribd company logo
1 of 34
Download to read offline
15/09/2016
Robots Exclusion
Protocol
Di cosa parleremo
Definizioni Robots.txt
Meta
robots
X-robots Errori Altro Domande
Crawling
Accedere alle URL per scaricarne il contenuto senza
processarlo
Definizioni
Indicizzazione
Processare il contenuto recuperato dal crawler e salvarlo in
un archivio creando un indice
Definizioni
Perché dobbiamo creare un robots.txt file?
Lo spider è molto goloso…ma non tutte le pagine sono utili ed
informative
Definizioni
Perché dobbiamo creare un robots.txt file?
Lo spider dedica risorse limitate per ogni sito (crawl budget), meglio
concentrare gli sforzi verso pagine utili
Definizioni
Accedendo ad un sito lo spider si fa delle domande
?
1. Quali risorse posso leggere?
2. Cosa posso farci?
3. Quali link posso seguire?
4. Cosa posso mostrare nelle SERP?
Definizioni
Cos’è il robots.txt file
Definizione
Il file robots.txt contiene delle regole
utilizzate dai crawler per applicare
restrizioni di analisi e indicizzazione
sulle pagine di un sito internet.
Robots.txt
Come impostare il robots.txt file
 Il robots.txt file risiede sempre nel
root folder del tuo sito:
http://domain.com/robots.txt
 Crea un text file semplice usando il
Blocco note o Textedit Apple OS
 Appena salvato lo puoi caricare al
‘root folder’ del tuo sito tramite il
cPanel o FTP client
Robots.txt
Comandi robots.txt file
User-agent: *
Disallow: /random/
Allow: /
Robots.txt
Bloccare robots specifici robots.txt file
user-agent: *
Disallow: /
user-agent: googlebot-news
Disallow: /
user-agent: googlebot
Disallow: /
user-agent: bingbot
Disallow: /
User-agent: ia_archiver
Disallow: /
Robots.txt
Wildcard matching robots.txt file
1.* carattere jolly indica 0 o più istanze di un valore valido
2.$ indica la fine dell'URL
Esempio:
User-agent: *
Disallow: /*?
Disallow: /*.php$
Robots.txt
Robots.txt
Sitemap: [URL Sitemap XML]
Sitemap: http://example.com/sitemap.xml
Robots.txt
Ordine di precedenza
Robots.txt
Robots.txt tester
• Se vuoi controllare che la
sintassi che hai scritto nel
robots.txt sia fatto
correttamente ci sono
diversi tester a disposizione
ma la migliore e da usare e
sempre quello di Google
Robots.txt
Robots.txt tester
Risorsa
Link esterni
User-agent: *
Disallow: /risorsa/
Link interni
Ricordati che se
blocchi una pagina
in robots.txt non
può passare
autorità al resto
del sito.
Robots.txt
Altre cose da considerare
• Bloccare il crawling di una URL non significa
che non sarà indicizzata
• Comportamento 4xx (errori client) e 5xx (errore del
server)
• Sempre sul root domain ma anche sul dominio di terzo
livello:
- http://root.com/robots.txt (primo livello)
- http://subdomain.root.com/robots.txt (terzo livello)
• Bloccare parametri tramite parametri URL del Google
Search Console
• Spazi nella URL non saranno rispettati /category/
/product page
• User-agent: msnbot
Crawl-delay: 5
Robots.txt
Il REP prevede anche istruzioni che danno una
maggiore granularità alle direttive
Possono essere espresse nel doc HTML
<meta name="robots content="noindex">
Oppure con un header HTTP
X-Robots-Tag: noindex
Meta
robots
X-robots
Meta robots
• Meta robots inseriti in pagina nel <head> del documento HTML
• Danno istruzioni ai robots per come comportarsi quando arrivano
alla pagina dove il codice meta robots e presente
• Funzionano bene per il noindex
Meta
robots
Tabella Valori Meta Robots
Valori Azione
noindex rimuove/non inserisce nell’indice
nofollow non segue i link
index Si richiede di indicizzare la pagina
follow seguire tutti i link
noodp non mostra la descrizione di DMOZ
noydir non mostra la descrizione di ydir (non esiste più la Yahoo
directory)
Meta
robots
Tabella Altri Valori Meta Robots
Valori Azione
noarchive non mostrare un link "Copia cache" nei risultati di ricerca
(meglio usare l'intestazione HTTP)
nosnippet non mostrare uno snippet (meta description) nei risultati di
ricerca per questa pagina
notranslate non proporre la traduzione della pagina nei risultati di
ricerca
noimageindex non proporre la traduzione della pagina nei risultati di
ricerca
unavailable_after: [RFC-850
date/time]
rimuove dall’indice dopo [data]
Meta
robots
Meta robots espressioni
<META NAME="ROBOTS" CONTENT="NOINDEX">
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
<meta name="googlebot-news" content="noindex">
<meta name="googlebot-image,bingbot" content="nosnippet">
NB: i meta robots non sono ‘case sensitive’
Specificato regola
per ‘tutti’ robots
Separando con una virgola puoi inserire
più di un valore
Specificato regola
per robots specifico
Meta
robots
X-robots
• Funziona simile ai meta robots ma viene letto tramite l’intestazione
HTTP
• Usano valori uguali ai meta robots
• Sì possono inserire usando php o tramite .htaccess e httpd.conf
• Vantaggio è che si possono usare per bloccare tipi di file che non
puoi con i meta robots (file non HTML) a livello globale
X-robots
X-robots tramite php
Esempi:
Se vuoi bloccare il motore di ricerca da un file creato in php, inserisci
questo tag nel header file:
1. header("X-Robots-Tag: noindex", true);
O forse vuoi prevenire che i robots seguono i link anche:
2. header("X-Robots-Tag: noindex, nofollow", true);
X-robots
X-robots tramite .htaccess
Esempi:
Se vuoi bloccare il motore di ricerca da tutti i file .pdf, inserisci questo
tag nel header file:
<FilesMatch ".pdf$">
Header set X-Robots-Tag “noindex, nofollow"
</FilesMatch>
X-robots
Errori comuni
User-agent: *
Disallow: /
Errori
Errori comuni
<meta="robots" content="index, follow">
Errori
Errori comuni
User-agent: *
Disallow: /images/
Errori
Errori comuni
User-agent: *
Disallow: /passwords.txt
Errori
Cercando lavoro?
Altro
Risorse
• https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt?hl=it
• https://yoast.com/ultimate-guide-robots-txt/
• https://moz.com/learn/seo/robotstxt
• https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag
• https://yoast.com/x-robots-tag-play/
Altro
Grazie
Domande
Robin Armit
SEO Consultant Reprise Media
LinkedIn - https://www.linkedin.com/in/robin-armit-56663462
Twitter - @armit_robin
Domande

More Related Content

What's hot

[IT] Comprendere la Crawl Budget Optimization
[IT] Comprendere la Crawl Budget Optimization[IT] Comprendere la Crawl Budget Optimization
[IT] Comprendere la Crawl Budget OptimizationFederico Sasso
 
SEO On Site & WordPress - Errori da Evitare - #10 WordPress Meetup Romagna C...
SEO On Site & WordPress - Errori da Evitare  - #10 WordPress Meetup Romagna C...SEO On Site & WordPress - Errori da Evitare  - #10 WordPress Meetup Romagna C...
SEO On Site & WordPress - Errori da Evitare - #10 WordPress Meetup Romagna C...Andrea Cardinali
 
Analisi dei competitor con Screaming Frog
Analisi dei competitor con Screaming FrogAnalisi dei competitor con Screaming Frog
Analisi dei competitor con Screaming FrogGiovanni Sacheli
 
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOChrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOGiovanni Sacheli
 
Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOSemrush Italia
 
Come fare SEO con AngularJS
Come fare SEO con AngularJSCome fare SEO con AngularJS
Come fare SEO con AngularJSGiovanni Sacheli
 
Guida Seo di Esperto Seo
Guida Seo di Esperto SeoGuida Seo di Esperto Seo
Guida Seo di Esperto SeoEsperto Seo
 
Come analizzare il log del web server
Come analizzare il log del web serverCome analizzare il log del web server
Come analizzare il log del web serverGiovanni Sacheli
 
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Giovanni Sacheli
 
Sviluppare Plugin per WordPress
Sviluppare Plugin per WordPress Sviluppare Plugin per WordPress
Sviluppare Plugin per WordPress Thomas Vitale
 
I link interni sono fattori di rank? Scopriamolo!
I link interni sono fattori di rank? Scopriamolo!I link interni sono fattori di rank? Scopriamolo!
I link interni sono fattori di rank? Scopriamolo!Semrush Italia
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleGiovanni Sacheli
 
Ottimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaOttimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaTiziano Fogliata
 
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013Andrea Cardinali
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyMeta Line
 
Gestione del crawling e indicizzazione
Gestione del crawling e indicizzazioneGestione del crawling e indicizzazione
Gestione del crawling e indicizzazioneAlessandro Martin
 

What's hot (19)

[IT] Comprendere la Crawl Budget Optimization
[IT] Comprendere la Crawl Budget Optimization[IT] Comprendere la Crawl Budget Optimization
[IT] Comprendere la Crawl Budget Optimization
 
SEO On Site & WordPress - Errori da Evitare - #10 WordPress Meetup Romagna C...
SEO On Site & WordPress - Errori da Evitare  - #10 WordPress Meetup Romagna C...SEO On Site & WordPress - Errori da Evitare  - #10 WordPress Meetup Romagna C...
SEO On Site & WordPress - Errori da Evitare - #10 WordPress Meetup Romagna C...
 
Analisi dei competitor con Screaming Frog
Analisi dei competitor con Screaming FrogAnalisi dei competitor con Screaming Frog
Analisi dei competitor con Screaming Frog
 
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEOChrome DevTools: le basi tecniche per comprendere meglio la SEO
Chrome DevTools: le basi tecniche per comprendere meglio la SEO
 
Come eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEOCome eseguire correttamente una migrazione SEO
Come eseguire correttamente una migrazione SEO
 
Come fare SEO con AngularJS
Come fare SEO con AngularJSCome fare SEO con AngularJS
Come fare SEO con AngularJS
 
Guida Seo di Esperto Seo
Guida Seo di Esperto SeoGuida Seo di Esperto Seo
Guida Seo di Esperto Seo
 
Come analizzare il log del web server
Come analizzare il log del web serverCome analizzare il log del web server
Come analizzare il log del web server
 
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
Technical SEO Audit Checklist - Giovanni Sacheli Search Marketing Connect 2018
 
SEO MIni Guida
SEO MIni GuidaSEO MIni Guida
SEO MIni Guida
 
Salvo
SalvoSalvo
Salvo
 
Sviluppare Plugin per WordPress
Sviluppare Plugin per WordPress Sviluppare Plugin per WordPress
Sviluppare Plugin per WordPress
 
I link interni sono fattori di rank? Scopriamolo!
I link interni sono fattori di rank? Scopriamolo!I link interni sono fattori di rank? Scopriamolo!
I link interni sono fattori di rank? Scopriamolo!
 
Analisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search ConsoleAnalisi SEO con Screaming Frog e Google Search Console
Analisi SEO con Screaming Frog e Google Search Console
 
Ottimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricercaOttimizzare WordPress non solo per i motori di ricerca
Ottimizzare WordPress non solo per i motori di ricerca
 
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013
Seo on site - La stai facendo nel modo giusto? | GT Conference Torino 2013
 
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital AgencyChecklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
Checklist: 18 passi per fare SEO Audit nel 2021 | Meta Line Digital Agency
 
Seo Audit Demo
Seo Audit DemoSeo Audit Demo
Seo Audit Demo
 
Gestione del crawling e indicizzazione
Gestione del crawling e indicizzazioneGestione del crawling e indicizzazione
Gestione del crawling e indicizzazione
 

Viewers also liked

Webinar SEMrush - Social Selling: generare Lead con LinkedIn
Webinar SEMrush - Social Selling: generare Lead con LinkedInWebinar SEMrush - Social Selling: generare Lead con LinkedIn
Webinar SEMrush - Social Selling: generare Lead con LinkedInsemrush_webinars
 
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding SEMrush WebStudy Marathon - Branding per il business - Strategie di branding
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding semrush_webinars
 
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...semrush_webinars
 
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgere
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgereLe analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgere
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgeresemrush_webinars
 
Ottimizzare Google Shopping per un e-commerce vincente.
Ottimizzare Google Shopping per un e-commerce vincente.Ottimizzare Google Shopping per un e-commerce vincente.
Ottimizzare Google Shopping per un e-commerce vincente.semrush_webinars
 
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interni
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interniSEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interni
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link internisemrush_webinars
 
SEMrush WebStudy Marathon - SEO Tecnico - SEO semantica
SEMrush WebStudy Marathon - SEO Tecnico - SEO semanticaSEMrush WebStudy Marathon - SEO Tecnico - SEO semantica
SEMrush WebStudy Marathon - SEO Tecnico - SEO semanticasemrush_webinars
 
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...semrush_webinars
 
SEMrush WebStudy Marathon - Branding per il business - Personal Branding
SEMrush WebStudy Marathon - Branding per il business - Personal BrandingSEMrush WebStudy Marathon - Branding per il business - Personal Branding
SEMrush WebStudy Marathon - Branding per il business - Personal Brandingsemrush_webinars
 
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.semrush_webinars
 
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...semrush_webinars
 
Digital Analytics: tools e KPI per il data driven marketing
Digital Analytics: tools e KPI per il data driven marketingDigital Analytics: tools e KPI per il data driven marketing
Digital Analytics: tools e KPI per il data driven marketingsemrush_webinars
 
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sitoRestyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sitosemrush_webinars
 
Conversion Optimization: non sai cosa ti perdi
Conversion Optimization: non sai cosa ti perdiConversion Optimization: non sai cosa ti perdi
Conversion Optimization: non sai cosa ti perdisemrush_webinars
 
Usabilità e User Experience​ - L'utente al centro della progettazione
Usabilità e User Experience​ - L'utente al centro della progettazioneUsabilità e User Experience​ - L'utente al centro della progettazione
Usabilità e User Experience​ - L'utente al centro della progettazionesemrush_webinars
 
Quando l'ordine ti fa risparmiare tempo prezioso.
Quando l'ordine ti fa risparmiare tempo prezioso.Quando l'ordine ti fa risparmiare tempo prezioso.
Quando l'ordine ti fa risparmiare tempo prezioso.semrush_webinars
 
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.semrush_webinars
 
Adwords per eCommerce: Strategie pratiche.
Adwords per eCommerce: Strategie pratiche.Adwords per eCommerce: Strategie pratiche.
Adwords per eCommerce: Strategie pratiche.semrush_webinars
 
Elementi essenziali per una Efficace Strategia di Lead Generation
 Elementi essenziali per una Efficace Strategia di Lead Generation Elementi essenziali per una Efficace Strategia di Lead Generation
Elementi essenziali per una Efficace Strategia di Lead Generationsemrush_webinars
 

Viewers also liked (19)

Webinar SEMrush - Social Selling: generare Lead con LinkedIn
Webinar SEMrush - Social Selling: generare Lead con LinkedInWebinar SEMrush - Social Selling: generare Lead con LinkedIn
Webinar SEMrush - Social Selling: generare Lead con LinkedIn
 
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding SEMrush WebStudy Marathon - Branding per il business - Strategie di branding
SEMrush WebStudy Marathon - Branding per il business - Strategie di branding
 
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...
SEMrush WebStudy Marathon - Branding per il business - Neuromarketing per Bra...
 
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgere
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgereLe analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgere
Le analisi fondamentali (non solo SEO) che ogni azienda online dovrebbe svolgere
 
Ottimizzare Google Shopping per un e-commerce vincente.
Ottimizzare Google Shopping per un e-commerce vincente.Ottimizzare Google Shopping per un e-commerce vincente.
Ottimizzare Google Shopping per un e-commerce vincente.
 
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interni
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interniSEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interni
SEMrush WebStudy Marathon - SEO Tecnico - Aspetto e Struttura dei link interni
 
SEMrush WebStudy Marathon - SEO Tecnico - SEO semantica
SEMrush WebStudy Marathon - SEO Tecnico - SEO semanticaSEMrush WebStudy Marathon - SEO Tecnico - SEO semantica
SEMrush WebStudy Marathon - SEO Tecnico - SEO semantica
 
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...
Landing Copywriting: quali sono le prime parole che gli utenti vogliono trova...
 
SEMrush WebStudy Marathon - Branding per il business - Personal Branding
SEMrush WebStudy Marathon - Branding per il business - Personal BrandingSEMrush WebStudy Marathon - Branding per il business - Personal Branding
SEMrush WebStudy Marathon - Branding per il business - Personal Branding
 
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.
Webinar - Anatomia di una lead generation efficace: magnets, flussi e relazione.
 
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...
SEMrush WebStudy Marathon - Branding per il business - Brand Identity: 9 aspe...
 
Digital Analytics: tools e KPI per il data driven marketing
Digital Analytics: tools e KPI per il data driven marketingDigital Analytics: tools e KPI per il data driven marketing
Digital Analytics: tools e KPI per il data driven marketing
 
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sitoRestyling e Web Analytics: quali KPI monitorare quando cambi design sito
Restyling e Web Analytics: quali KPI monitorare quando cambi design sito
 
Conversion Optimization: non sai cosa ti perdi
Conversion Optimization: non sai cosa ti perdiConversion Optimization: non sai cosa ti perdi
Conversion Optimization: non sai cosa ti perdi
 
Usabilità e User Experience​ - L'utente al centro della progettazione
Usabilità e User Experience​ - L'utente al centro della progettazioneUsabilità e User Experience​ - L'utente al centro della progettazione
Usabilità e User Experience​ - L'utente al centro della progettazione
 
Quando l'ordine ti fa risparmiare tempo prezioso.
Quando l'ordine ti fa risparmiare tempo prezioso.Quando l'ordine ti fa risparmiare tempo prezioso.
Quando l'ordine ti fa risparmiare tempo prezioso.
 
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.
AdWords nightmare: campagne da incubo. Come NON ottenere i risultati desiderati.
 
Adwords per eCommerce: Strategie pratiche.
Adwords per eCommerce: Strategie pratiche.Adwords per eCommerce: Strategie pratiche.
Adwords per eCommerce: Strategie pratiche.
 
Elementi essenziali per una Efficace Strategia di Lead Generation
 Elementi essenziali per una Efficace Strategia di Lead Generation Elementi essenziali per una Efficace Strategia di Lead Generation
Elementi essenziali per una Efficace Strategia di Lead Generation
 

Similar to SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol

Corso seo 3
Corso seo 3Corso seo 3
Corso seo 3webenjoy
 
Seo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerSeo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerMatteo Magni
 
Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesignerHtml e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesignerMatteo Magni
 
Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesigner Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesigner Matteo Magni
 
Seo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerSeo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerMatteo Magni
 
DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009psicomante
 
Rich Snippet - ST 2012
Rich Snippet - ST 2012Rich Snippet - ST 2012
Rich Snippet - ST 2012ST2012
 
Le Penalizzazioni Di Google
Le Penalizzazioni Di GoogleLe Penalizzazioni Di Google
Le Penalizzazioni Di GoogleFrancesco Tinti
 
WebSphere Portal & User Experience
WebSphere Portal & User ExperienceWebSphere Portal & User Experience
WebSphere Portal & User ExperienceAndrea Fontana
 
REST API fantastiche e dove trovarle
REST API fantastiche e dove trovarleREST API fantastiche e dove trovarle
REST API fantastiche e dove trovarleMarco Breveglieri
 
Dalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationDalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationMartino Mosna
 

Similar to SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol (20)

Seo html russo
Seo html russoSeo html russo
Seo html russo
 
I motori di_ricerca_1
I motori di_ricerca_1I motori di_ricerca_1
I motori di_ricerca_1
 
Corso seo 3
Corso seo 3Corso seo 3
Corso seo 3
 
Seo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerSeo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesigner
 
Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesignerHtml e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesigner
 
Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesigner Html e Css - 1 | WebMaster & WebDesigner
Html e Css - 1 | WebMaster & WebDesigner
 
Seo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesignerSeo e Web Marketing - 1 | WebMaster & WebDesigner
Seo e Web Marketing - 1 | WebMaster & WebDesigner
 
DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009DrupalCamp Italy - Crema 2009
DrupalCamp Italy - Crema 2009
 
Rich Snippet - ST 2012
Rich Snippet - ST 2012Rich Snippet - ST 2012
Rich Snippet - ST 2012
 
Glossario seo
Glossario seoGlossario seo
Glossario seo
 
Le Penalizzazioni Di Google
Le Penalizzazioni Di GoogleLe Penalizzazioni Di Google
Le Penalizzazioni Di Google
 
WebSphere Portal & User Experience
WebSphere Portal & User ExperienceWebSphere Portal & User Experience
WebSphere Portal & User Experience
 
IBM WCM e SEO
IBM WCM e SEOIBM WCM e SEO
IBM WCM e SEO
 
WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12WebSphere Portal e WCM #dd12
WebSphere Portal e WCM #dd12
 
Grasso Frameworks Ajax
Grasso Frameworks AjaxGrasso Frameworks Ajax
Grasso Frameworks Ajax
 
REST API fantastiche e dove trovarle
REST API fantastiche e dove trovarleREST API fantastiche e dove trovarle
REST API fantastiche e dove trovarle
 
Introduzione alla SEO
Introduzione alla SEOIntroduzione alla SEO
Introduzione alla SEO
 
Guida seo joomla
Guida seo joomlaGuida seo joomla
Guida seo joomla
 
Dalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget OptimizationDalla SEO alla CBO: Il Crawling Budget Optimization
Dalla SEO alla CBO: Il Crawling Budget Optimization
 
Lamp Ld2008
Lamp Ld2008Lamp Ld2008
Lamp Ld2008
 

SEMrush WebStudy Marathon - SEO Tecnico - Robots Exclusion Protocol

  • 2. Di cosa parleremo Definizioni Robots.txt Meta robots X-robots Errori Altro Domande
  • 3. Crawling Accedere alle URL per scaricarne il contenuto senza processarlo Definizioni
  • 4. Indicizzazione Processare il contenuto recuperato dal crawler e salvarlo in un archivio creando un indice Definizioni
  • 5. Perché dobbiamo creare un robots.txt file? Lo spider è molto goloso…ma non tutte le pagine sono utili ed informative Definizioni
  • 6. Perché dobbiamo creare un robots.txt file? Lo spider dedica risorse limitate per ogni sito (crawl budget), meglio concentrare gli sforzi verso pagine utili Definizioni
  • 7. Accedendo ad un sito lo spider si fa delle domande ? 1. Quali risorse posso leggere? 2. Cosa posso farci? 3. Quali link posso seguire? 4. Cosa posso mostrare nelle SERP? Definizioni
  • 8. Cos’è il robots.txt file Definizione Il file robots.txt contiene delle regole utilizzate dai crawler per applicare restrizioni di analisi e indicizzazione sulle pagine di un sito internet. Robots.txt
  • 9. Come impostare il robots.txt file  Il robots.txt file risiede sempre nel root folder del tuo sito: http://domain.com/robots.txt  Crea un text file semplice usando il Blocco note o Textedit Apple OS  Appena salvato lo puoi caricare al ‘root folder’ del tuo sito tramite il cPanel o FTP client Robots.txt
  • 10. Comandi robots.txt file User-agent: * Disallow: /random/ Allow: / Robots.txt
  • 11. Bloccare robots specifici robots.txt file user-agent: * Disallow: / user-agent: googlebot-news Disallow: / user-agent: googlebot Disallow: / user-agent: bingbot Disallow: / User-agent: ia_archiver Disallow: / Robots.txt
  • 12. Wildcard matching robots.txt file 1.* carattere jolly indica 0 o più istanze di un valore valido 2.$ indica la fine dell'URL Esempio: User-agent: * Disallow: /*? Disallow: /*.php$ Robots.txt
  • 14. Sitemap: [URL Sitemap XML] Sitemap: http://example.com/sitemap.xml Robots.txt
  • 16. Robots.txt tester • Se vuoi controllare che la sintassi che hai scritto nel robots.txt sia fatto correttamente ci sono diversi tester a disposizione ma la migliore e da usare e sempre quello di Google Robots.txt
  • 17. Robots.txt tester Risorsa Link esterni User-agent: * Disallow: /risorsa/ Link interni Ricordati che se blocchi una pagina in robots.txt non può passare autorità al resto del sito. Robots.txt
  • 18. Altre cose da considerare • Bloccare il crawling di una URL non significa che non sarà indicizzata • Comportamento 4xx (errori client) e 5xx (errore del server) • Sempre sul root domain ma anche sul dominio di terzo livello: - http://root.com/robots.txt (primo livello) - http://subdomain.root.com/robots.txt (terzo livello) • Bloccare parametri tramite parametri URL del Google Search Console • Spazi nella URL non saranno rispettati /category/ /product page • User-agent: msnbot Crawl-delay: 5 Robots.txt
  • 19. Il REP prevede anche istruzioni che danno una maggiore granularità alle direttive Possono essere espresse nel doc HTML <meta name="robots content="noindex"> Oppure con un header HTTP X-Robots-Tag: noindex Meta robots X-robots
  • 20. Meta robots • Meta robots inseriti in pagina nel <head> del documento HTML • Danno istruzioni ai robots per come comportarsi quando arrivano alla pagina dove il codice meta robots e presente • Funzionano bene per il noindex Meta robots
  • 21. Tabella Valori Meta Robots Valori Azione noindex rimuove/non inserisce nell’indice nofollow non segue i link index Si richiede di indicizzare la pagina follow seguire tutti i link noodp non mostra la descrizione di DMOZ noydir non mostra la descrizione di ydir (non esiste più la Yahoo directory) Meta robots
  • 22. Tabella Altri Valori Meta Robots Valori Azione noarchive non mostrare un link "Copia cache" nei risultati di ricerca (meglio usare l'intestazione HTTP) nosnippet non mostrare uno snippet (meta description) nei risultati di ricerca per questa pagina notranslate non proporre la traduzione della pagina nei risultati di ricerca noimageindex non proporre la traduzione della pagina nei risultati di ricerca unavailable_after: [RFC-850 date/time] rimuove dall’indice dopo [data] Meta robots
  • 23. Meta robots espressioni <META NAME="ROBOTS" CONTENT="NOINDEX"> <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <meta name="googlebot-news" content="noindex"> <meta name="googlebot-image,bingbot" content="nosnippet"> NB: i meta robots non sono ‘case sensitive’ Specificato regola per ‘tutti’ robots Separando con una virgola puoi inserire più di un valore Specificato regola per robots specifico Meta robots
  • 24. X-robots • Funziona simile ai meta robots ma viene letto tramite l’intestazione HTTP • Usano valori uguali ai meta robots • Sì possono inserire usando php o tramite .htaccess e httpd.conf • Vantaggio è che si possono usare per bloccare tipi di file che non puoi con i meta robots (file non HTML) a livello globale X-robots
  • 25. X-robots tramite php Esempi: Se vuoi bloccare il motore di ricerca da un file creato in php, inserisci questo tag nel header file: 1. header("X-Robots-Tag: noindex", true); O forse vuoi prevenire che i robots seguono i link anche: 2. header("X-Robots-Tag: noindex, nofollow", true); X-robots
  • 26. X-robots tramite .htaccess Esempi: Se vuoi bloccare il motore di ricerca da tutti i file .pdf, inserisci questo tag nel header file: <FilesMatch ".pdf$"> Header set X-Robots-Tag “noindex, nofollow" </FilesMatch> X-robots
  • 30. Errori comuni User-agent: * Disallow: /passwords.txt Errori
  • 32. Risorse • https://developers.google.com/webmasters/control-crawl-index/docs/robots_txt?hl=it • https://yoast.com/ultimate-guide-robots-txt/ • https://moz.com/learn/seo/robotstxt • https://developers.google.com/webmasters/control-crawl-index/docs/robots_meta_tag • https://yoast.com/x-robots-tag-play/ Altro
  • 34. Robin Armit SEO Consultant Reprise Media LinkedIn - https://www.linkedin.com/in/robin-armit-56663462 Twitter - @armit_robin Domande