1. Indexation et
optimisation
Technique
(SEO)
Présentation réalisée par Jean-Claude Domenget – MCF sciences de
l’information et de la communciation – JCD blog à destination
d’étudiants dans le web.
Diffusable sous licence Creative Commons – by-nc-nd 2.0 http://
creativecommons.org/licenses/by-nc-nd/2.0/fr/ 1
2. Les actions de référencement naturel
Principes du référencement SEO
Indexation et optimisation technique
Optimisation éditoriale
Inscription dans les annuaires, maillage interne et liens entrants
Recherche universelle et derniers moteurs
Mesures d’audience (outils, KPI, tableaux)
Visibilité et présence sur les médias sociaux
Indexation et optimisation technique JCD blog
2
3. Optimiser l’indexation de votre site
Google indexe naturellement votre site.
Vous pouvez néanmoins améliorer l’indexation de votre site :
travailler l’accessibilité pour les robots (fichier robots.txt, fichier
sitemap)
éviter les freins au référencement
Indexation et optimisation technique JCD blog
3
5. La syntaxe d’un fichier robots.txt
Ce fichier explique au moteur où il ne doit pas aller, avec l’instruction :
« Disallow » suivie soit d’un répertoire, soit d’un fichier.
User-agent: *
Disallow: /cgi-bin/
Disallow: /tempo/
Disallow: /abonnes/prix.html + Depuis 2007, indication
User-agent: Googlebot de l’adresse du fichier
sitemap dans le fichier
Disallow: /cgi-bin/
robots.txt :
Disallow: /perso/ (user-agent ; disallow, sitemap (Url))
Disallow: /entravaux/
Indexation et optimisation technique JCD blog
5
6. Créer un fichier robots.txt
Cf :https://www.google.com/webmasters/tools/dashboard?hl=fr
Indexation et optimisation technique JCD blog
6
7. Où placer votre fichier robots.txt
Le fichier texte robots.txt est à placer à la racine du site :
http://monexemple.com/robots.txt
Ou http://premier.monexemple.com/robots.txt
Indexation et optimisation technique JCD blog
7
8. Le fichier sitemap
Fichier Sitemap = plan du site au format xml
Il s’agit de la liste des adresses de vos pages.
4 informations sont distinguées : adresse – dernière modification – fréquence
de mise à jour – priorité d’indexation.
<urlset>
<url>
<loc>http://www.lemechantlipdub.fr/</loc>
<lastmod>2009-04-04</lastmod>
<changefreq>daily</changefreq>
<priority>1</priority>
</url> Pour plus d’informations,
</urlset>
voir : sitemaps.org
Indexation et optimisation technique JCD blog
8
9. Créer un fichier sitemap
Ex : Cf Création d’un fichier sitemap dans le centre d’aide pour les
webmasters.
Possibilité de
- créer un sitemap en fonction du protocole sitemap ;
- créer un sitemap à l’aide d’un fichier .txt ;
- utiliser un flux RSS/Atom sous forme de fichier sitemap.
Liste de liens d'outils pour créer un fichier sitemap : nouveau générateur de google -
outils tiers - outils pour wordpress - Outils pour Dotclear - ou auditmypc
google sitemap generator
Indexation et optimisation technique JCD blog
9
10. Faire connaître votre fichier sitemap
Google :
utiliser Outils pour les webmasters
Yahoo :
utiliser Yahoo ! Search
Indexation et optimisation technique JCD blog
10
11. Les freins au référencement
Certains choix de programmation constituent des facteurs gênant ou
bloquant au référencement
Les Frames
Le Javascript
Cf
Les pages trop graphiques La présentation faite par David Degrelle e
Le flash
La duplication de contenu Cf Les obstacles au
référencement
Les URL exotiques
(Action-rédaction)
Les redirections trompeuses
Les techniques de spam (pages satellites, cloaking etc.)
Indexation et optimisation technique JCD blog
11
12. Les freins au référencement
Cf Présentation de
Sébastien Billard lors
du SEO campus 2009
Indexation et optimisation technique JCD blog
12
13. Conseils
L’indexation de flash pose toujours problème. Eviter les sites full
flash sinon fournir un contenu alternatif en swfobject
Ex : http://www.etc-creations.fr/
Les menus déroulants, les pop ups et les contenus AJAX posent
problème. Le langage Javascript peut être accessible en venant en
surcouche du HTML
Les moteurs ne savent pas remplir les formulaires. Seuls les
résultats de type GET sont indexables et il faut prévoir une navigation
alternative
Source : cours 4 optimisation
structurelle de Sébastien
Billard pp. 11 à 22
Indexation et optimisation technique JCD blog
13
14. Conseils (2)
Les images doivent être dotées d’un attribut alt pertinent
Les balises sémantiques doivent être utilisées pour leur fonction
<strong>. Ne pas les détourner.
La duplication de contenu provient de doublons qui peuvent être
éviter notamment par des redirections 301et balise link rel=canonical
Les redirections doivent être définitives 301 et non temporaires 302
http://www.webrankinfo.com/dossiers/debutants/initiation-aux-redirections
Source :
cours 4 optimisation structurelle de Sébastien
Indexation et optimisation technique JCD blog
14
15. Optimiser techniquement votre site
Précisions
L’optimisation technique est la première étape d’un référencement de
qualité, le socle de votre travail de référencement;
Suivront ensuite, l’optimisation éditoriale (création d’un contenu de
qualité) et les actions de linking pour améliorer la popularité du site
(actions pour augmenter la visibilité du contenu).
Indexation et optimisation technique JCD blog
15
16. Discussion quant à l’utilité de 4 critères
d’optimisation technique
Balise Title
Texte visible et soin du code (X)HMTL
Balises meta
Attribut alt
+ Une technique d’optimisation : l’URL rewriting
Indexation et optimisation technique JCD blog
16
17. Balise TITLE
La balise TITLE est un des critères essentiels d’optimisation SEO
Elle s’affiche comme titre de page dans votre navigateur
Ex : <title>JCD - blog: pre-requis seo - referencement naturel - version 2010</title>
Règles :
Chaque page web possède son titre propre
Ce titre est en relation avec le contenu de la page
Le titre ne doit pas dépasser 69 caractères
Indexation et optimisation technique JCD blog
17
18. Erreurs :
Un seul titre pour toutes les pages
Un titre n’est pas une liste de mots clés
Pas de titres multilingues
Conseils :
créer des pages mono-thèmes – multiplier les pages. Le titre doit
être un résumé de la page (éviter donc les pages multi-thèmes)
Indexation et optimisation technique JCD blog
18
19. Texte visible et soin du code (X)HTML
Le texte visible comprend outre le titre de la page, le contenu textuel
de la page, y compris la légende des images. Autrement dit tout texte
qui n’est pas lissé ou inaccessible au robot.
L’optimisation technique d’une page passe par la rédaction d’un
code propre
Règles :
Respecter la sémantique des balises (X)HTML (vérification par
Lynx cf cours 4 Sébastien Billard p.8)
Utiliser la balise <H1> pour le titre de l’article et <H2>, <H3> etc.
pour les sous-titres
Indexation et optimisation technique JCD blog
19
20. Utilisation de la feuille de style CSS pour mettre en page, avec les
balises de fonction <div> (positionner un bloc) et <span> (modifier le
style d’une portion de texte).
Mise en valeur des mots clés avec les balises d’indication <strong>
(moteurs) et <b> (lecteur)
Longueur des articles : si possible supérieur à 200 mots descriptifs
(Olivier Andrieu). Google prend en compte les textes entre 110 et
1320 mots (Maxime Grandchamp).
L’attribut SWF Object pour proposer un contenu texte alternatif à
une animation flash
Indexation et optimisation technique JCD blog
20
21. Erreurs :
Des pages ou des images trop lourdes (100 ko max environ)
Une page ne contenant qu’une animation flash – Nécessité d’avoir
un contenu texte visible et une image
Détourner des balises. Utiliser des balises de mise en valeur du
contenu au lieu de balise sémantique. Ex : <b> au lieu de <strong>
Indexation et optimisation technique JCD blog
21
22. Balise meta description
La balise meta description n’est plus prise en compte pour le
positionnement d’une page web
Elle permet de donner une indication pour le texte descriptif affiché
sous le titre de page, dans la page de résultats des moteurs de
recherche (snippet)
Règles :
Chaque page web doit posséder une description propre
La description doit contenir les mots clés visés par la page
La description ne doit pas dépasser 152 caractères
Erreurs : Une desciption n’est pas une liste de mots clés
Indexation et optimisation technique JCD blog
22
23. Balise meta keywords
La balise meta keywords n’est plus prise en compte pour le
positionnement d’une page web
Elle ne peut avoir d’intérêt que pour faciliter l’inscription de votre site
dans des annuaires
Règles :
Elle contient une liste de mots clés en relation avec la page
Indiquer l’univers sémantique des mots clés visés, les variations de
genre et de personne
Indexation et optimisation technique JCD blog
23
24. Balise meta robots
La balise meta robots est prise en compte par les moteurs
Elle sert à définir des restrictions au robot qui vient scroller vos pages
Les valeurs principales :
noindex, (pas de crawl avec le fichier robots.txt)
nofollow, (ne crawl pas le lien)
noarchive, (pas d’accès à la version cache dans les résultats)
Noodp (descriptif de DMOZ pas pris en compte)
Cf L’article de Webrankinfo sur les balises meta
Indexation et optimisation technique JCD blog
24
25. L’attribut alt de la balise <img>
L’attribut alt permet de proposer un contenu texte alternatif à une
image. Ce contenu texte est pris en compte par les robots pour
identifier les images.
Règles :
Rédiger un texte alternatif court contenant les mots clés visés par
la page.
Erreurs :
Désigner une image par un code passe-partout. Ex : 0001.jpg
Indexation et optimisation technique JCD blog
25
26. L’URL rewriting
La réécriture d’URL permet de modifier les URL exotiques.
Elle n’a pas forcément d’impact sur le positionnement mais sur
l’incitation au clic
Adresse type : type / genre / produit – voiture / monospace / C4 picasso
Indexation et optimisation technique JCD blog
26
27. Pénalités Google
Risques de dénonciation avec formulaire Spam Report
Techniques à ne pas utiliser : pages satellites, cloaking, liens cachés...
La sandbox / “courbe de vie d’un site”
Le déclassement = “minus 30”, “minus60”, “postion 6 penality”
La liste noire = désindexation de l’index principal # déclassement
Indexation et optimisation technique JCD blog
27
28. Optimisation du délai d’indexation
Juste lancé, déjà indexé ?
Mise en ligne d’une version provisoire du site
= version attractive, proposition de contenus dès le départ, mise à jour
fréquente de la page d’accueil, obtention des 1ers liens, inscription
dans annuaires dès sa sortie, présentation du site sur forum, blog
Si absence de référencement ?
= référencement # positionnement, liste des pages indexées “site:”,
blocage, manque de liens entrants, utilisation de technologies
bloquantes, autre site pénalisé sur un serveur mutualisé
Indexation et optimisation technique JCD blog
28
29. Votre CMS est-il “SEO Friendly” ?
Avez-vous la main sur 100% du code HTML généré par votre
solution ?
Pouvez-vous personnaliser le contenu des balises ?
Votre solution génère-t-elle de la duplication de contenu ?
Utilisez-vous des technologies qui bloquent les moteurs ?
+ Réécriture d’URL, rubricage – navigation, arborescence,
suppression cookies – javascript, erreurs, fichiers et balises
sémantiques, contenus multimédia etc.
Cf : SEO et Joomla
! Comment tirer le meilleur parti du CMS – Philippe
Yonnet
Indexation et optimisation technique JCD blog
29
30. SEO et Joomla !
Problèmes Joomla / SEO = Réécriture URL, champs manquant,
souplesse structurelle etc.
URL = pour que URLs deviennent SEF (search engine friendly)
Cf Joomla.org
Templates SEO : code léger,
pas de facteurs bloquant,
respect des balises sémantiques
Plugin SEO = sh404SEF (incontournable) – ensemble avec Joomla!
Meilleur que des CMS réputés / SEO
Indexation et optimisation technique JCD blog
30
31. User-agent: *
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
SEO et wordpress ! Disallow: /wp-content/cache
Disallow: */trackback
Un code source propre et compréhensible
Disallow: /*.php$
Des thèmes déjà orientés SEO par défaut Disallow: /*.js$
Un système de ping et de trackback Disallow: /*.inc$
Disallow: /*.txt$
Une URL propre avec les permaliens
Allow: /wp-content/uploads
Une structure basée sur les catégories User-agent: Googlebot-Image
et les mots-clés Allow: /
User-agent: Mediapartners-Google
Un ensemble de plugins à intégrer
Allow: /
Le fichier functions.php Sitemap: URL-de-votre-sitemap
Les taxonomies et le custom_post_type Source : Olivier Andrieu
Indexation et optimisation technique JCD blog
31
32. SEO et blog
Certains CMS offre une aide avantageuse. Matt Cutts a indiqué que
wordpress règle 80 à 90% des aspects relatifs au SEO.
Le guide du référencement de blogs de webrankinfo
(dont proposer des flux RSS – articles associés – tags – bookmarks
sociaux)
Et utiliser les plugins qui vont bien avec parcimonie !
Indexation et optimisation technique JCD blog
32
33. Temps de chargement
Optimiser
Tester notammnet avec outils disponibles dans GWT
Compresser avec par exemple Gzip pour Apache
Activer le cache du navigateur
Activer le préchargement des pages
Synchroniser avec serveurs tiers
Mesurer avec le code GA asynchrone
Indexation et optimisation technique JCD blog
33
34. Temps de chargement (2)
Compacter les fichiers CSS
Regrouper les images dans des sprites CSS
Positionner en bas de page les fichiers Javascript
Optimiser les images
Fidéliser vos utilisateurs
Indexation et optimisation technique JCD blog
34
35. Impact du respect des normes W3C
Des pages 100% compatibles avec le standard du W3C ?
Service “validateur W3C”
Utilité en SEO ?
Enjeux plutôt d’accessibilité et de compatibilité
Indexation et optimisation technique JCD blog
35
36. Les questions de l’âge et de la fraîcheur
Fraîcheur de l’information
L’âge d’une page
Pages anciennes ou pages récentes ?
Les requêtes QDF (Query Deserves Freshness)
Indexation et optimisation technique JCD blog
36
37. Les sites multilingues
Un nom de domaine par langue
Un sous-domaine par langue
Un répertoire par langue
Des pages multilingues
Indexation et optimisation technique JCD blog
37
38. Conclusion
L’optimisation technique est le premier maillon d’une stratégie de
référencement. Elle en constitue son socle.
Elle doit faciliter le travail d’indexation des robots.
Elle favorise un bon positionnement des pages sur les mots clés
visés.
Indexation et optimisation technique JCD blog
38
39. Pour aller plus loin :
Cf les cours de Sébastien Billard – master 2 IDEMM.
Cours 4 : Optimisation structurelle pour le référencement
Indexation et optimisation technique JCD blog
39