Présentation effectuée lors d'une soirée SEO Camp à Paris le 3 décembre 2014.
Elle passe en revue les différents codes réponse (301, 404, 410, 500,...) et leur impact sur le SEO et le crawl de Google
2. Nicolas Chollet
Qui suis-je ?
Fondateur @One Clic Conseil, Agence de conseil en référencement
naturel et web-conversion
Me suivre
• Twitter : @NicolasChollet
• Blog : www.pureside.fr
• Mail : nicolas@1-clic.info
Quelques clients ;-)
4. Quelques définitions
Crawl et logs, quels indicateurs suivre ?
• Evolution du crawl / visites par type de pages
• Evolution du crawl / visites par codez réponse
• Pages actives / pages inutiles
• …
5. Google n’aime pas perdre son temps
Tout se passe comme si Google allouait un certain temps, chaque jour
à chaque site
• Aller plus loin : http://www.pureside.fr/referencement/limpact-du-temps-de-chargement-
des-pages-sur-le-referencement-naturel/
6. Temps de réponse : de quoi parlons-nous ?
Pour en savoir plus :
• http://www.pureside.fr/referencement/limpact-du-temps-de-chargement-des-pages-sur-
le-referencement-naturel/
9. Codes 404 : que retenir ?
Avoir des codes 404 sur des pages qui n’existent plus
Ce n’est pas grave !
Avoir des 404s internes en revanche, c’est un signe
évident de non-qualité…
Une erreur 410 fera globalement la même chose, mais la
désindexation est plus rapide… et cela permet de laisser les
404s aux « vraies » erreurs
10. Cas où on veut éviter les 404…
Code 200
Quand on a pas assez de contenu…
11. Cas où on veut éviter les 404…
Code 200
Quand l’info reste intéressante…
12. Cas où on veut éviter les 404…
Code 301
Quand les contenus changent souvent, on peut vouloir
mettre une redirection 301
14. Codes 301 : que retenir ?
Google continue pendant très longtemps à aller
crawler des 301s. Au bout d’un moment, il revient par
vagues.
Si une page reçoit des liens (externes ou internes), il peut
continuer à crawler plusieurs années
Cela fait artificiellement monter le volume de
pages crawlées dans GWT… et baisser le temps de
réponse
Google ne charge que le code réponse, c’est donc très peu
couteux…
18. Code 304
C’est quoi ça ??
Not Modified : document non modifié depuis la dernière
requête…
19. Balise Canonical
Plutôt 301, l’équivalent d’un gros lien,… ?
Une chose est sure: c’est très dangereux !
20. Et le crawl des ressources ?
Exemple :
Css / js / images
<link rel='stylesheet' type='text/css' media='screen' href=‘http://www.monsite.com/mon-url/
style.css' />
<script type='text/javascript' src=' http://www.monsite.com/mon-url/main.js '></script>
21. Et le crawl des ressources ?
Css / js / images
Laissez Google Crawler…
Mais ne faites pas n’importe quoi !
Google respecte le fichier robots.txt à la lettre…
Attention aux infos de Google Webmaster Tools. Elles sont
très agrégées
22. Autres codes réponse ?
C’est quoi ça ??
401 et 403 : ne pas en abuser, surtout les 403s…
302 : on cherche encore…
418 :
23. Bilan
Qu’est-ce que ça change ?
Regardez vos logs serveurs
Ecoutez les alertes (GWT notamment)
Mettez-vous à la place de Google
Ne faites pas de choses bizarres…
24. Où sommes nous
13 rue des arquebusiers
75003 Paris
Mail
nicolas@1-clic.info
Contact
Venez nous dire bonjour
Téléphone :
Nicolas Chollet
06 51 42 79 05
www.1-clic.info