2. 2
Audrey Schoonwater @witamine
SEO technique depuis 2007
• Dirige l’agence SEO @witamine
• Chez l’annonceur pendant 2 ans
• Consultante en agence SEO pendant 11 ans
• De formation technique
Interview sur Page1.fr
3. 3
Check-list SEO Migration
Le Plan de Redirections n’est qu’une infime partie de la migration.
• 7ème / 49 points de la Check-list SEO Migration
Contactez-moi pour obtenir votre check-list SEO Migration :
contact @ witamine . com
Revoir mon intervention sur le sujet
https://bit.ly/ChecklistSEOMigrationPDF
4. 4
Sommaire
Intro : Migration réussie en 3 étapes
Concepts
• URL vs URI
• Crawl de Google et sa pyramide, Budget Crawl, Fenêtre de Crawl, Taux de Crawl, Efficacité de Crawl, Taux
de rendu
• Taux de pages actives, Budget rendering, Taux de rendu de pages
« Oops, on a changé les URL Chef ! »
Outils
9. Information permettant de localiser un élément.
Exemples d’URL
• Adresse de site internet
• https://example.com/page.htm
• ftp://example.com/doc.zip
• mailto:user@example.com
• https://example.com/ressource?var=foo#segment
Et aussi :
• Adresse postale : 50 avenue Jean Jaurès
9
URL - Uniform Resource Locator
10. 10
URL - Uniform Resource Locator
http://www.example.com
Protocole Nom de domaine
En savoir plus : https://www.afnic.fr/noms-de-domaine/tout-savoir/
11. 11
URL - Uniform Resource Locator
http://142.251.33.110
Protocole IP
13. 13
URL - Uniform Resource Locator
http://www.example.com:80
Protocole Port
Nom de domaine
14. 14
URL - Uniform Resource Locator
https://www.example.com/contact
Protocole Slug de la page
Nom de domaine
15. 15
URL - Uniform Resource Locator
http://www.example.com/robots.txt
Protocole
Nom
de fichier
Extension
de fichier
Fichier
Nom de domaine
16. 16
URL - Uniform Resource Locator
http://www.example.com/fr/docs
Protocole
Répertoires
Nom de domaine Chemin
17. 17
URL - Uniform Resource Locator
http://www.example.com/rech?p=v
Protocole Slug
Recherche
Paramètre
d’URL
Valeur du
paramètre
Nom de domaine
18. Elément permettant d'identifier une ressource.
Par analogie, on peut dire que cela correspond à l'identité d'une personne.
Exemples d’URI :
• Tim Berners-Lee
• Linus Torvald
18
URI - Uniform Resource Identifier
19. Confusion entre URI et URL
• Toutes les URL sont des URI.
Une adresse permet d’identifier une personne
19
Différence entre URI et URL
21. Confusion entre URI et URL
• Toutes les URL sont des URI.
On peut identifier une personne avec son adresse
• Toutes les URI ne sont pas des URL.
Le nom Tim Berners-Lee ne donne aucune information sur la localisation
21
Différence entre URI et URL
22. Confusion entre URI et URL
• Toutes les URL sont des URI.
On peut identifier une personne avec son adresse
• Toutes les URI ne sont pas des URL.
Le nom Tim Berners-Lee ne donne aucune information sur la localisation
Conclusion
• Utilisez l’URI pour faire référence à une ressource par son seul nom.
• Utilisez l’URL pour donner le nom d’une ressource et la méthode d’accès
22
Différence entre URI et URL
24. 24
En théorie, pas besoin de changer les URL
Car le propriétaire de l'espace d’un nom de domaine :
• possède tous les URI qu'il contient
• en a le contrôle, sauf faillite provoquant l’arrêt du serveur
Alors pourquoi tant de liens HS dans le monde ?
• le manque de prévoyance.
28. 28
L’excuse
« Nous avons tellement d’éléments qu’il est impossible de maintenir tout ce
qui est périmé ou confidentiel ou valide… donc on arrête tout. »
29. 29
Bonne pratique
Avant de publier un document, vérifier qu’il pourra rester en ligne et
indiquer une date de création et d'expiration
31. 31
Bonne pratique
Communiquer : Faites des ateliers ou des déjeuners pour vulgariser
Par exemple avec Apache, on peut changer la relation entre une URI et
l’endroit où se trouve le fichier
32. 32
L’excuse
« Nous avions l'habitude d'utiliser un script CGI (/cgi) et maintenant nous
utilisons un programme binaire (/cgibin). »
35. 35
Bonne pratique
Penser aux droits des utilisateurs sur les fichiers.
Que deviennent les fichiers si l’utilisateur en charge de sa mise à jour n’est
plus là ?
36. 36
Récapitulatif des bonnes pratiques
1. Bien choisir ses URL pour qu’elles soient pérennes
2. Avant de publier un document, vérifier qu’il pourra rester en ligne et
indiquer une date de création et d'expiration
3. Vulgariser sur la possibilité de changer le lien entre une URI et l’endroit
où se trouve le fichier
4. Anticiper que le système de scripts ne change pas les URI
5. Prévoir une stratégie de droits qui permettent de gérer les fichiers
même si la personne n’est plus là
37. 37
Construire de nouveaux URI
1. Évitez d'utiliser l’auto-incrémentation lors de la création d’URI
Le risque d’un compteur incrémental à chaque donnée est la réattribution
des URI de manière différente lors de la mise à jour des données existantes.
La séquence ne sera plus la même.
38. 38
Construire de nouveaux URI
2. Évitez d'utiliser des requêtes à base de paramètres d’URL
« ?param=value »
Ces requêtes ne sont pas persistantes car elles reposent sur des
implémentations particulières :
• http://example.com/id/company?id=AB123456
au lieu de :
• http://example.com/id/company/AB123456
39. 39
Construire de nouveaux URI
3. Évitez d'inclure des informations sur la « propriété »
Un modèle d’URI persistants ne doit pas inclure le nom de l'organisation ou
du projet qui a produit l'URI.
Exemple :
France Telecom change de nom. Tous les URI doivent être mis à jour.
• URI non persistant contenant « France Telecom » :
http://example.com/FranceTelecom/id/agence/123456
• URI persistant :
http://example.com/id/agence/123456
40. 40
Construire de nouveaux URI
4. Évitez d'utiliser des extensions de fichiers
Elles doivent être évitées pour des URI persistants
Exemple
L'URI d'un ensemble de données avec la liste des mairies du département
31 serait plutôt :
• http://example.com/31/mairies
que :
• http://example.com/31/mairie.csv
41. 41
Pourquoi s’en soucier ?
Lorsque vous modifiez une URL sur votre serveur, impossible de savoir
quelle sera la source du lien pointant vers l'ancienne URL :
• des pages web.
• des favoris.
• depuis un bloc note (online ou offline)…
Réputation / Confiance
La personne qui est confrontée à un lien rompu perd confiance.
L’utilisateur n’a pas atteint son objectif .
Et en plus il est frustré émotionnellement.
42. 42
URI SEO friendly
Simplicité. URI courts
• ne se cassent pas facilement lors des envois dans des e-mails
• plus faciles à retenir
Stabilité. URI pour la vie
Ne pas inclure dans les URI, les technos php, asp, etc.
Gérabilité.
Émettez vos URI d'une manière que vous pouvez gérer.
Inclure l'année en cours dans le chemin d'URI, afin de pouvoir modifier le
schéma d'URI chaque année sans casser les anciens URI.
43. 43
Crawl de Google
Une URL connue est connue pour la vie !
« Le processus d'exploration commence par une liste
d'adresses Web issues d'explorations précédentes et
de sitemaps fournis par les propriétaires de sites. »
Source :
Comment Google crawle le web ? https://www.google.com/intl/fr/search/howsearchworks/crawling-indexing/
44. 44
Pyramide du crawl
Du contenu potentiel … au clic puis la conversion
Potentiel
Existant
Crawl
Indexé
Actif
Efficace
Conve
rsion
45. 45
Budget Crawl Google
Comment Google fait des économies ?
Google préserve sa bande passante en explorant un nombre fini d’URL pour chaque site via :
• Autorité
• PageRank.
• Complexité du site parcouru
• Fréquence de mise à jour
• etc.
Conséquences pour un site moins efficace ?
• Moins crawlé
• Résultats de recherche pas à jour
• Version non représentative prise en compte
46. 46
Fenêtre de Crawl Google
Comment la calculer ?
• Analytics : Lister les top URL correspondant à la majorité de l’audience.
• Logs : Regarder le temps en jours nécessaire pour que Google parcourt ces URL.
Note : Procéder par catégories de pages pour plus de pertinence
A quoi sert-elle ?
Déterminer tous les combien Google doit venir visiter ma page pour qu’elle génère une visite.
Exemple
Fenêtre de crawl de 7 jours = Les pages avec visites ont été parcourues par Google il y a 7 jours.
47. 47
Taux de Crawl Google
A quoi sert-il ?
Savoir la part des contenus connus par Google en comptant le nombre
d’URL uniques dans les logs
Crawlers du marché
Fenêtre de crawl de 30 jours = au-delà, les pages sont considérées
comme non crawlées vu que Google a besoin d’informations récentes.
Comment le calculer ?
• Crawler le site et déterminer le nombre d’URL crawlables
• Analysez les logs et déterminer le nombre d’URL crawlées par Google
• Taux de Crawl Google = nombre d’URL crawlées par Google divisé par le nombre
d’URL crawlables
48. 48
Efficacité de Crawl
A quoi correspond-elle ?
La capacité des bots de crawler toutes les pages d’un site.
Comment l’améliorer ?
• Une structure de site propre
• Des serveurs fiables
• Des Sitemaps et Robots.txt sans erreur
• Un site rapide à charger au niveau des pages HTML
Note : Faites–le pour les pages actives des contenus clés comme les pages produits
ou la navigation principale.
49. 49
Taux de pages actives
A quoi correspond-il ?
Pourcentage de pages qui génèrent des visites organiques,
par type de page.
Comment l’améliorer ?
• Regarder les pages les plus lentes et celles d’intérêt pour les utilisateurs et les
améliorer
50. 50
Budget rendering
A quoi correspond-il ?
Par analogie au budget crawl, ce concept se réfère aux ressources disponibles pour le
traiter le contenu rendu en JavaScript lors d’un 2ème passage de Googlebot. (cf. Botify)
51. 51
Taux de rendu de pages
A quoi correspond-il ?
Comme le taux de crawl mais comme il faut distinguer les
passages avant rendu et après rendu, on compte les
référents uniques.
53. 53
Redirection.io pour gérer de façon autonome
Quoi ?
Gestionnaire de redirection de trafic Web qui aident à analyser les erreurs HTTP,
à configurer les redirections HTTP et à surveiller efficacement le trafic
• Flexibilité Redirections : Être autonome pour configurer des redirections
• Récupération Logs : Enregistrer / analyser
• Evolution du trafic et des erreurs HTTP
• Tester de nouvelles règles avec le trafic « réel » du site Web
• Corriger les balises meta
Quelques fonctionnalités
55. 55
Swan.tools pour gérer une migration de A à Z
Quoi ?
Assistant migration permettant d’établir un Plan de Redirections sans oublier
d’anciennes URL connues par les moteurs
1. Scrap du domaine d’origine pour récupérer un maximum d’URLs de base
2. Import d’URL manuel ou assisté depuis Ahrefs, Majestic, Google Analytics, Google
Search Console, Semrush.
3. Correspondance d’URL réalisé selon un calcul de proximité sémantique. Cela est
configurable pour éviter que des blocs de contenus dupliqués ne fausse le calcul.
4. Génération d’un .htaccess pour tester sur la préprod
5. Reporting graphique
Etapes
56. 56
Swan.tools pour gérer une migration de A à Z
Les erreurs types lors des migrations
• Aucune redirection
• Redirections mal faites ou que vers la page d’accueil
• URL oubliées
• Plan de redirection non testé
• Correspondances d’URL éloignées sémantiquement.
64. 64
PURL Génération d’URL persistantes
http://purl.org/
par Archive.org
Création du domaine « witamine » Création de l’URL persistante
• Grâce à PURL, les ressources peuvent changer dans le temps sans affecter
négativement les systèmes qui en dépendent.
• Utile quand on migre d'une machine à l'autre pour des raisons commerciales,
sociales ou techniques.
Equivalent https://w3id.org/