SlideShare una empresa de Scribd logo
1 de 3
Descargar para leer sin conexión
Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware
© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/
Sitemap.xml i robots.txt
Què és i per a què serveix el sitemap?
El posicionament en buscadors dels llocs que dissenyem o que simplement estem administrant
té una gran importància en un entorn tan competitiu com és la web avui en dia. Del
posicionament web depèn moltes vegades l’èxit o el fracàs del site i per això hem de fer tot el
possible per informar als buscadors de la existència del nostre lloc web.
Un sitemap.xml és un arxiu que conté una llista de les pàgines del lloc web junt amb alguna
informació extra, tal com en quina freqüència la web canvia els seus continguts, quan va ser la
última vegada que es va actualitzar i com d’important és respecte a la resta de pàgines del
mateix site.
El robots.txt és un arxiu que tots els buscadors han de llegir.
Com construim el sitemap.xml
La programació de l’arxiu sitemap.xml ha de seguir una sèrie de pautes especificades en el
protocol de sitemaps i després hem d’informar als buscadors de la existència del mateix,
estigueu al cas dels següents passos:
· Continguts obligatoris del sitemap.xml:
El sitemap.xml es construeix fent servir etiquetes XML o tags incloses en un arxiu sempre amb
codificació UTF8. Els valors de dades (contraposats a les mateixes etiquetes) han de fer servir
codis d’escapament per certs caràcters especials, tal com s’acostuma a fer en HTML. Veiem un
exemple:
Les cometes dobles “ s’han de substituir per “
Els signes de major > i menor < per > i < respectivament.
· Exemple senzill d’un sitemap.xml:
Amb la primera etiqueta, definim la versió de XML que fem servir i la codificació en aquest cas
(com en la majoria) de UTF8
En la segona línia, fem referència al protocol d’ús: 0.9
· Etiquetes que formen el sitemap.xml:
<loc>http://www.xxx.xxxx….</loc> adreça de la pàgina que forma part del sitemap.xml
<lastmod>Data</lastmod>, data de la última modificació.
Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware
© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/
El format de la data és: ANY-MES-DIA (On ANY és de 4 xifres, el MES de 2 i el DIA de 2).
Exemple: 2013-03-13
<changefrec>Freqüència</changefrec>, Freqüència o cada quan es produeix el canvi.
always, sempre per pàgines que canvien cada vegada que es mostren. Principalment les
dinàmiques.
hourly, la freqüència de canvi es produeix cada hora.
daily, la freqüència de canvi es produeix diàriament.
weekly, la freqüència de canvi es produeix setmanalment.
monthly, la freqüència de canvi es produeix mensualment.
Yearly, la freqüència de canvi es produeix anualment.
never, mai, típicament per a pàgines arxivades o històriques.
<priority>Value</priority> La prioritat es refereix a la importància que té la pàgina que es
troba en respecte de les demès que composen el site. És simplement una manera d’indicar
prioritats relatives dins del site, sense efecte cap a l’exterior del mateix. El valor o value pot
prendre valors entre el 0 i el 1, considerarem el valor per defecte el 0.5
Allotjament del sitemap.xml
L’arxiu sitemap.xml programat, s’allotja en el servidor com un arxiu més del site, amb la
peculiaritat de que pot contenir les adreces web contingudes en el mateix directori en que es
troba o en d’altres continguts en ell mateix. Normalment, es posa a l’arrel del server com a
sitemap.xml
Enviament del sitemap.xml als servers
A través de les eines per a webmasters de Google o el Yahoo site explorer, podem
proporcionar directament la informació del nostre sitemap.xml als buscadors. Però també ho
podem fer amb l’arxiu robots.txt
Podeu trobar més informació relativa a robots.txt en la següent adreça web:
http://www.sitemaps.org/protocol.php#submit_robots
Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware
© Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/
Programació de l’arxiu robots.txt
L’arxiu robots.txt diu als motors de recerca a quines parts del teu site poden accedir per
indexar i rastrejar. Aquest arxiu s’ha d’anomenar sempre robots.txt i ha d’estar situat a l’arrel
del teu site.
Un exemple seria:
User-Agent: *
Disallow: /privat/theme.css
Disallow: /confidencial/
Disallow: /webadmin/
Disallow: /sessions/
Sitemap: http://www.exabyteinformatica.com/sitemap.xml
En primer lloc amb el paràmetre User-Agent: * estem dient que tots els buscadors tenen
cabuda per rastrejar i indexar el lloc web (tal com indica el *), es pot posar també per exemple
google per indicar que només volem que sigui aquest buscador el que pugui indexar.
La resta de paràmetres del disallow, indiquen quines carpetes o directoris tenen la indexació
prohibida o quins resultats NO volem que el buscador indexi.
La línia del sitemap, indica als buscadors i robots crawlers, on està situat l’arxiu sitemap.xml
perquè el puguin llegir i a l’hora indexar.

Más contenido relacionado

Similar a Sitemap.xml i robots.txt

Presentació M8 UF1NF1
Presentació M8 UF1NF1Presentació M8 UF1NF1
Presentació M8 UF1NF1fgherathlet
 
PRESENTACIO
PRESENTACIOPRESENTACIO
PRESENTACIOsowe17
 
Pwp copia - copia
Pwp   copia - copiaPwp   copia - copia
Pwp copia - copiasowe17
 
M08 fulls d'estil
M08 fulls d'estilM08 fulls d'estil
M08 fulls d'estiljsanzvi
 
Dai 9 - Ruby on Rails
Dai 9 - Ruby on RailsDai 9 - Ruby on Rails
Dai 9 - Ruby on RailsCarles Mateu
 
SIGT09 Introducció Joomla
SIGT09 Introducció JoomlaSIGT09 Introducció Joomla
SIGT09 Introducció JoomlaAlex Araujo
 
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)Alberto Saavedra
 
ARSO-M6: Administracio del web - Guio
ARSO-M6: Administracio del web - GuioARSO-M6: Administracio del web - Guio
ARSO-M6: Administracio del web - GuioAurora Lara Marin
 
Dai 09-ruby on rails
Dai 09-ruby on railsDai 09-ruby on rails
Dai 09-ruby on railsCarles Mateu
 
Introducció a Joomla
Introducció a JoomlaIntroducció a Joomla
Introducció a JoomlaAlex Araujo
 
Introducció a Drupal - CINC Girona
Introducció a Drupal - CINC GironaIntroducció a Drupal - CINC Girona
Introducció a Drupal - CINC Gironatalkomraja
 
4. Introducció a Joomla
4. Introducció a Joomla4. Introducció a Joomla
4. Introducció a Joomlamnicolau
 
Seo Drupal
Seo DrupalSeo Drupal
Seo Drupaldrauta
 
Turbo Gears, Framework De Python Per Aplicacions Web
Turbo Gears, Framework De Python Per Aplicacions WebTurbo Gears, Framework De Python Per Aplicacions Web
Turbo Gears, Framework De Python Per Aplicacions WebTomàs Reverter
 

Similar a Sitemap.xml i robots.txt (20)

Dues tecniques SEO de programació web
Dues tecniques SEO de programació webDues tecniques SEO de programació web
Dues tecniques SEO de programació web
 
Presentació M8 UF1NF1
Presentació M8 UF1NF1Presentació M8 UF1NF1
Presentació M8 UF1NF1
 
PRESENTACIO
PRESENTACIOPRESENTACIO
PRESENTACIO
 
Pwp copia - copia
Pwp   copia - copiaPwp   copia - copia
Pwp copia - copia
 
Presentació
PresentacióPresentació
Presentació
 
M08 fulls d'estil
M08 fulls d'estilM08 fulls d'estil
M08 fulls d'estil
 
Html, Xtml & Php
Html, Xtml & PhpHtml, Xtml & Php
Html, Xtml & Php
 
Dai 9 - Ruby on Rails
Dai 9 - Ruby on RailsDai 9 - Ruby on Rails
Dai 9 - Ruby on Rails
 
Presentació d'Oscommerce
Presentació d'OscommercePresentació d'Oscommerce
Presentació d'Oscommerce
 
SIGT09 Introducció Joomla
SIGT09 Introducció JoomlaSIGT09 Introducció Joomla
SIGT09 Introducció Joomla
 
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)
Curs de SEO i Promoció de pàgines web a buscadors per Albert Saavedra (part 1)
 
ARSO-M6: Administracio del web - Guio
ARSO-M6: Administracio del web - GuioARSO-M6: Administracio del web - Guio
ARSO-M6: Administracio del web - Guio
 
Dai 09-ruby on rails
Dai 09-ruby on railsDai 09-ruby on rails
Dai 09-ruby on rails
 
Presentació de Magento
Presentació de MagentoPresentació de Magento
Presentació de Magento
 
Introducció a Joomla
Introducció a JoomlaIntroducció a Joomla
Introducció a Joomla
 
Introducció a Drupal - CINC Girona
Introducció a Drupal - CINC GironaIntroducció a Drupal - CINC Girona
Introducció a Drupal - CINC Girona
 
4. Introducció a Joomla
4. Introducció a Joomla4. Introducció a Joomla
4. Introducció a Joomla
 
Presentació del servidor Apache
Presentació del servidor ApachePresentació del servidor Apache
Presentació del servidor Apache
 
Seo Drupal
Seo DrupalSeo Drupal
Seo Drupal
 
Turbo Gears, Framework De Python Per Aplicacions Web
Turbo Gears, Framework De Python Per Aplicacions WebTurbo Gears, Framework De Python Per Aplicacions Web
Turbo Gears, Framework De Python Per Aplicacions Web
 

Más de Roger Casadejús Pérez

Presentació de Wordpress fins a la 3.5.1
Presentació de Wordpress fins a la 3.5.1Presentació de Wordpress fins a la 3.5.1
Presentació de Wordpress fins a la 3.5.1Roger Casadejús Pérez
 
Presentació de les novetats i llicències Vmware esxi 5
Presentació de les novetats i llicències Vmware esxi 5Presentació de les novetats i llicències Vmware esxi 5
Presentació de les novetats i llicències Vmware esxi 5Roger Casadejús Pérez
 

Más de Roger Casadejús Pérez (20)

Presentació de Wordpress fins a la 3.5.1
Presentació de Wordpress fins a la 3.5.1Presentació de Wordpress fins a la 3.5.1
Presentació de Wordpress fins a la 3.5.1
 
Presentació de Facebook
Presentació de FacebookPresentació de Facebook
Presentació de Facebook
 
Presentació de Twitter
Presentació de TwitterPresentació de Twitter
Presentació de Twitter
 
Presentació del protocol TCP/IP
Presentació del protocol TCP/IPPresentació del protocol TCP/IP
Presentació del protocol TCP/IP
 
Presentació de la història de Google
Presentació de la història de GooglePresentació de la història de Google
Presentació de la història de Google
 
Presentació de les novetats i llicències Vmware esxi 5
Presentació de les novetats i llicències Vmware esxi 5Presentació de les novetats i llicències Vmware esxi 5
Presentació de les novetats i llicències Vmware esxi 5
 
Presentació de Virtual box
Presentació de Virtual boxPresentació de Virtual box
Presentació de Virtual box
 
Presentació històrica del VHS
Presentació històrica del VHSPresentació històrica del VHS
Presentació històrica del VHS
 
Presentació de Playstation 3
Presentació de Playstation 3Presentació de Playstation 3
Presentació de Playstation 3
 
Què és W3C?
Què és W3C?Què és W3C?
Què és W3C?
 
Seo: Com triomfar en els buscadors?
Seo: Com triomfar en els buscadors?Seo: Com triomfar en els buscadors?
Seo: Com triomfar en els buscadors?
 
Què és i com funciona el pagerank?
Què és i com funciona el pagerank?Què és i com funciona el pagerank?
Què és i com funciona el pagerank?
 
Url amigables
Url amigablesUrl amigables
Url amigables
 
Zona DMZ
Zona DMZZona DMZ
Zona DMZ
 
Presentació de spoofing
Presentació de spoofingPresentació de spoofing
Presentació de spoofing
 
IP brick
IP brickIP brick
IP brick
 
Presentació de Smoothwall
Presentació de SmoothwallPresentació de Smoothwall
Presentació de Smoothwall
 
Presentació històrica de Visual.NET
Presentació històrica de Visual.NETPresentació històrica de Visual.NET
Presentació històrica de Visual.NET
 
Presentació de MySQL
Presentació de MySQLPresentació de MySQL
Presentació de MySQL
 
Presentació de Javascript
Presentació de JavascriptPresentació de Javascript
Presentació de Javascript
 

Sitemap.xml i robots.txt

  • 1. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware © Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/ Sitemap.xml i robots.txt Què és i per a què serveix el sitemap? El posicionament en buscadors dels llocs que dissenyem o que simplement estem administrant té una gran importància en un entorn tan competitiu com és la web avui en dia. Del posicionament web depèn moltes vegades l’èxit o el fracàs del site i per això hem de fer tot el possible per informar als buscadors de la existència del nostre lloc web. Un sitemap.xml és un arxiu que conté una llista de les pàgines del lloc web junt amb alguna informació extra, tal com en quina freqüència la web canvia els seus continguts, quan va ser la última vegada que es va actualitzar i com d’important és respecte a la resta de pàgines del mateix site. El robots.txt és un arxiu que tots els buscadors han de llegir. Com construim el sitemap.xml La programació de l’arxiu sitemap.xml ha de seguir una sèrie de pautes especificades en el protocol de sitemaps i després hem d’informar als buscadors de la existència del mateix, estigueu al cas dels següents passos: · Continguts obligatoris del sitemap.xml: El sitemap.xml es construeix fent servir etiquetes XML o tags incloses en un arxiu sempre amb codificació UTF8. Els valors de dades (contraposats a les mateixes etiquetes) han de fer servir codis d’escapament per certs caràcters especials, tal com s’acostuma a fer en HTML. Veiem un exemple: Les cometes dobles “ s’han de substituir per “ Els signes de major > i menor < per > i < respectivament. · Exemple senzill d’un sitemap.xml: Amb la primera etiqueta, definim la versió de XML que fem servir i la codificació en aquest cas (com en la majoria) de UTF8 En la segona línia, fem referència al protocol d’ús: 0.9 · Etiquetes que formen el sitemap.xml: <loc>http://www.xxx.xxxx….</loc> adreça de la pàgina que forma part del sitemap.xml <lastmod>Data</lastmod>, data de la última modificació.
  • 2. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware © Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/ El format de la data és: ANY-MES-DIA (On ANY és de 4 xifres, el MES de 2 i el DIA de 2). Exemple: 2013-03-13 <changefrec>Freqüència</changefrec>, Freqüència o cada quan es produeix el canvi. always, sempre per pàgines que canvien cada vegada que es mostren. Principalment les dinàmiques. hourly, la freqüència de canvi es produeix cada hora. daily, la freqüència de canvi es produeix diàriament. weekly, la freqüència de canvi es produeix setmanalment. monthly, la freqüència de canvi es produeix mensualment. Yearly, la freqüència de canvi es produeix anualment. never, mai, típicament per a pàgines arxivades o històriques. <priority>Value</priority> La prioritat es refereix a la importància que té la pàgina que es troba en respecte de les demès que composen el site. És simplement una manera d’indicar prioritats relatives dins del site, sense efecte cap a l’exterior del mateix. El valor o value pot prendre valors entre el 0 i el 1, considerarem el valor per defecte el 0.5 Allotjament del sitemap.xml L’arxiu sitemap.xml programat, s’allotja en el servidor com un arxiu més del site, amb la peculiaritat de que pot contenir les adreces web contingudes en el mateix directori en que es troba o en d’altres continguts en ell mateix. Normalment, es posa a l’arrel del server com a sitemap.xml Enviament del sitemap.xml als servers A través de les eines per a webmasters de Google o el Yahoo site explorer, podem proporcionar directament la informació del nostre sitemap.xml als buscadors. Però també ho podem fer amb l’arxiu robots.txt Podeu trobar més informació relativa a robots.txt en la següent adreça web: http://www.sitemaps.org/protocol.php#submit_robots
  • 3. Més manuals a: http://www.exabyteinformatica.com/manuales-y-apuntes-freeware © Roger Casadejús Pérez | http://www.exabyteinformatica.com/tienda/ Programació de l’arxiu robots.txt L’arxiu robots.txt diu als motors de recerca a quines parts del teu site poden accedir per indexar i rastrejar. Aquest arxiu s’ha d’anomenar sempre robots.txt i ha d’estar situat a l’arrel del teu site. Un exemple seria: User-Agent: * Disallow: /privat/theme.css Disallow: /confidencial/ Disallow: /webadmin/ Disallow: /sessions/ Sitemap: http://www.exabyteinformatica.com/sitemap.xml En primer lloc amb el paràmetre User-Agent: * estem dient que tots els buscadors tenen cabuda per rastrejar i indexar el lloc web (tal com indica el *), es pot posar també per exemple google per indicar que només volem que sigui aquest buscador el que pugui indexar. La resta de paràmetres del disallow, indiquen quines carpetes o directoris tenen la indexació prohibida o quins resultats NO volem que el buscador indexi. La línia del sitemap, indica als buscadors i robots crawlers, on està situat l’arxiu sitemap.xml perquè el puguin llegir i a l’hora indexar.