Voici les slides de mon intervention auprès des M2 Communication de Sciences-Po Toulouse, le 4 décembre 2020. Retrouvez l'information complète sur https://www.lamandrette.com/blog/linking-interne/
2. 04/12/2020
• Parcours communication/marketing, puis :
• DESS E-Business
• Editeur indépendant
• E-commerçant (Lagon VAD)
• Associé webagency Agoranet
• Enseignant SEO (IEP Toulouse, SupdeWeb Toulouse)
• Consultant SEO
• Formateur SEO (initiation et perfectionnement)
• Directeur marketing/communication Eurécia
Fondateur de l’agence SEO La Mandrette
Laurent Peyrat
3. 04/12/2020
Le linking interne
Ce sont tous les liens qui pointent d’une page du site web vers une autre page du site web.
Un lien :
<a href="https://www.monsiteweb.fr/categorie/article.php">Anchor text</a>
Le linking interne s’optimise !
5. 04/12/2020
Rappel La similarité
La notion de pertinence
Pertinence d'un document : notion abstraite, voire subjective
Moteur de recherche = programme informatique
En aucun cas il ne comprend le contenu des pages web
On pourrait considérer qu'un document est pertinent par rapport à une requête s'il contient la requête.
Mais c'est une approche trop simpliste car elle est ambiguë et n'est pas assez ségrégative au regard
des milliards de documents présent sur le web.
Jérôme Rossignol
6. 04/12/2020
Rappel La similarité
Pertinence et modèle vectoriel
Si un programme informatique ne peut comprendre le sens d'un texte, il sait par contre effectuer des
calculs mathématiques.
Le modèle vectoriel est un modèle mathématique.
On représente un document texte à l'aide d'un vecteur (un tableau) dans lequel chaque élément du
tableau représente le poids d'un terme présent dans le document.
Pour mesurer la similarité entre deux documents
on calcule le cosinus de l'angle formé par les deux vecteurs représentant le document :
c'est le Cosinus de Salton.
Jérôme Rossignol
8. 04/12/2020
Rappel La similarité
Exemple de la loutre
Texte 1 : la loutre est dans la rivière
Texte 2 : la loutre est avec les loutres dans la rivière
Lemmatisation (sans prendre en compte les verbes) :
Texte 1 : loutre, rivière
Texte 2 : loutre, loutre, rivière
Représentation de chacun de ces textes par un vecteur dans l'espace des fréquences des mots
rivière, loutre (dans cet ordre).
Texte 1 : (1/2, 1/2 )
Texte 2 : (1/3, 2/3)
9. 04/12/2020
Rappel La similarité
Exemple de la loutre
Texte 1 : (1/2, 1/2 )
Texte 2 : (1/3, 2/3)
On choisit le texte qui correspond au vecteur
qui a le plus petit cosinus avec le vecteur de requête
Plus l’angle est fermé, plus je suis proche
10. 04/12/2020
Rappel La similarité
Exemple de la loutre
Requête
« Je suis dans la rivière avec les loutres de la rivière »
Vecteur (2/3, 1/3)
Le texte le plus proche est le texte 1
12. 04/12/2020
Rappel le Pagerank
Selon le brevet original, le Pagerank (ou PR) d’une page est fonction :
1. du nombre de liens pointant vers cette page ;
2. du PR des pages sur lesquelles se trouvent ces liens
3. du nombre de liens sortant sur les pages sur lesquelles se trouvent ces liens
Voir aussi :
http://infolab.stanford.edu/~backrub/google.html
https://www.webmaster-hub.com/publications/l-algorithme-du-pagerank-explique/
Le TBPR :
13. 04/12/2020
Rappel le Pagerank
Similarité/popularité fonctionne, mais est très sensible à la triche !
Pour la similarité :
✓ Abus de mots-clés dans la page (keyword stuffing)
✓ Pages satellites
✓ Etc.
Pour la popularité :
✓ Echanges de liens basés sur le PR
✓ Echanges de liens en très grande quantité
✓ Génération de farm-links
http://www.pianobleu.com/populiens.html :)
✓ Spam de forums, de blogs et de tous sites participatifs
✓ Etc.
14. 04/12/2020
Rappel le Pagerank
1. D’autres critères ont pris de l’importance
2. le PR lui-même a évolué. Deux évolutions importantes :
✓ Le promeneur raisonnable remplace le promeneur aléatoire (2012)
✓ Intégration du Pagerank thématique (?)
Indispensable : https://www.abondance.com/20160322-16332-le-pagerank-dhier-a-aujourdhui-video-seo.html
16. 04/12/2020
Ce que transmet un lien
1. Popularité (Pagerank, nombre de domaines)
3. Pertinence (ancre, contexte)
2. Autorité (domaine -> domaine)
17. 04/12/2020
(Ce que transmet un lien Parallèle EAT)
1. Popularité (Pagerank, nombre de domaines)
3. Pertinence (ancre, contexte)
2. Autorité (domaine -> domaine)
Trustworthiness
Expertise
Authority
18. 04/12/2020
Ce que transmet un lien Pénalisation
1. Popularité (Pagerank, nombre de domaines)
3. Pertinence (ancre, contexte)
2. Autorité (domaine -> domaine)
Penguin (ancre)
Achat de liens
Hausse suspecte du nombre de liens
19. 04/12/2020
Ce que transmet un lien Linking interne
1. Popularité (Pagerank, nombre de domaines)
3. Pertinence (ancre, contexte)
2. Autorité (domaine -> domaine)
Sauf très gros abus de liens in text, pas de pénalisation
Pas de pénalisation
20. 04/12/2020
Linking interne Principe général
2 choses à retenir
1. Un lien (réciproque) entre 2 pages ayant un champ lexical proche renforce fortement les 2 pages concernées
2. Un lien entre 2 pages ayant des champs lexicaux éloignés perturbe le robot.
21. 04/12/2020
Le linking interne Préalable
En préalable : la suppression des url/pages inutiles
➢ plan du site
➢ pages de tags
➢ pages auteurs (dans certains cas)
➢ pages générées automatiquement par le CMS
➢ pages d’archives (dans certains cas)
➢ chasse DUST, near duplicate
➢ etc.
+ validation Analytics
22. 04/12/2020
Spécifités : types de liens internes
1. Navigation (automatiques ou semi-automatiques)
o Header (incluant logo toutes pages)
o Mega-menu
o Sous-menus
o Fil d’Ariane
o Widgets automatiques (pages de listes, articles associés...)
o Footer et autres liens toutes pages
2. Liens in text (manuels sauf exception)
25. 04/12/2020
Moyens
La suppression des liens
Axiome : il y a toujours trop de liens internes !
Record de l’année de l’agence :
site web avec une moyenne de 800 liens internes par page...
Exemple standard :
800 url contenant 240 liens internes → 192 000 liens à gérer pour Google !
Les ressources machines employées pour gérer les liens inutiles ne sont
pas consacrées à des tâches plus productives (qualification du contenu)
26. 04/12/2020
Moyens
La suppression des liens
Axiome : il y a toujours trop de liens internes !
Le plus simple est d’en supprimer.
C’est parfois impossible :
✓ techniquement onéreux
✓ liens fonctionnels
✓ UX/Transformation
➢ vérification Analytics de l’utilité du lien considéré.
27. 04/12/2020
Moyens
L’ajout de liens
Axiome : il y a toujours trop de liens internes !
Parfois :
lier entre elles des pages de même thématique, après avoir traité les liens importuns.
28. 04/12/2020
Moyens
L’obfuscation des liens
Il s’agit ici de conserver des liens utiles à la navigation, mais intempestifs quant à la diffusion du PR.
→ Ils restent cliquables, mais ne sont plus vus par le robot.
→ La technique vise à remplacer le lien a href par un appel à un javascript qui a le même effet : envoyer l’internaute sur la page liée.
→ C’est équivalent pour l’internaute, qui ne voit pas la différence.
Exemple 1
Exemple 2
Google ne repère pas de lien ; pour lui c’est comme s’il n’y en avait pas.
29. 04/12/2020
Moyens
L’obfuscation des liens
Cela permet donc de sauvegarder le budget crawl et de conserver le Pagerank.
Les techniques employées sont différentes selon les développeurs. Voir par exemple :
o https://www.google.com/search?q=seo+obfuscation+des+liens
o https://www.google.com/search?q=obfusquer+liens+javascript
→ Validation du code html présent sur la page, ainsi que le codage employé (exemple : il vaut mieux éviter les codages
Base64, utilisé par tout le monde et donc repéré par Google), ainsi que des mentions type « scriptseo » ou « obfuscation »
dans le code.
La seule contrainte est donc que, par mesure de précaution, les liens ne soient pas reconstructibles via les informations présentes
dans le code html de la page
30. 04/12/2020
Moyens
L’ancrage des liens
Si, dans une même page, plusieurs liens pointent vers la même url :
1. seul le premier lien est pris en compte par le robot
2. les autres liens occasionnent une fuite de PR.
Pour que plusieurs liens soient pris en compte dans une page, nous pouvons les « ancrer », à savoir leur ajouter un suffixe qui les fait
pointer vers une ancre inexistante dans la page de destination.
Exemple :
✓ https://www.monsiteweb.com/url-de-la-page#top
✓ https://www.monsiteweb.com/url-de-la-page#fa
Google prend alors en compte les deux liens, en termes de PR et d’anchor text (vous pouvez le tester facilement), mais, dans son
comptage des liens, s’arrête au « # ». Ainsi sur l’exemple précédent, deux liens pointant sur https://www.monsiteweb.com/url-de-la-
page sont bien comptabilisés par l’algorithme.
31. 04/12/2020
Moyens
Preuves d’efficacité de l’obfuscation et de l’ancrage ?
L’efficacité est difficile à déterminer
✓ tests ponctuels
✓ réelle diffusion du PR interne (quantification) impossibles à repérer
✓ actions grandeur nature, mélangées à d’autres actions
le SEO est 100 % empirique
1. Conviction et remise en question
2. Cohérence avec la volonté et le fonctionnement de Google
3. Cohérence avec les politiques marketing et communication de l’entreprise
33. 04/12/2020
Objectifs Circulation du « jus »
1. Correction des problèmes d’indexations (cf cours précédents)
o indexation intempestives
o pages indexables non indexées
• Crawl + Analytics + logs + comparaison Search Console (Couverture de l’index)
2. Détection et correction des liens en erreur
✓ Liens vers des pages non indexables
✓ Liens vers des pages en noindex
✓ Liens vers des url redirigées
✓ Liens vers des pages en 404
✓ Liens vers des pages non canoniques
✓ Liens vers des pages non canoniques : navigation à facettes
✓ Liens vers des pages « privées » (inscription, formulaires, connexions, panier...)
✓ Liens vers des pages avec identifiants dans les paramètres de l’url
➢ détection des pages orphelines + traitement
❑ Application : détection et traitement sur vos exports
34. 04/12/2020
Objectifs Circulation du « jus »
La détection des problèmes se fait à l’aide d’un crawler, c’est à dire un logiciel qui simule le fonctionnement de Google
en passant de page en page en suivant les liens, puis en récoltant et stockant les données des pages crawlées.
Crawler : Xenu (gratuit) - Screaming Frog (gratuit jusqu’à 500 url)...
Crawler en Saas : Oncrawl - Botify - ContentKing...
Visulation du crawl de
le 21/10/2020 à 12 h 46
35. 04/12/2020
Objectifs Circulation du « jus »
Détection des pages orphelines
Par définition, elles ne sont pas repérés par un crawl.
→ Admin du site
→ Analytics
→ Search Console
→ Analyse des logs
→ Analyse des liens externes (url de destination)
→ ...
Tous les moyens sont bons pour dresser une liste de toutes les url « connues » !
puis
1. Comparaison avec la liste des url issues du crawl
2. Examen et actions selon les url concernées.
36. 04/12/2020
Objectifs Circulation du « jus »
Gestion des liens multiples
1. Google ne prend en compte que le premier lien qu’il trouve
(ou le plus important ?)
2. La ressource machine consacrée à la gestion des liens multiples est gaspillée
3. Le « jus » (Pagerank) distribué aux liens identiques est perdu.
37. 04/12/2020
Objectifs Circulation du « jus »
Gestion des liens multiples
Plusieurs liens d’une page vers une autre page (parfois d’une page vers elle-même)
Exemples :
❖ lien mega-menu + lien fil d’Ariane + lien in-text
❖ construction widget
(lien image + lien sur le titre + lien sur un bouton « en savoir plus »)
exemple sur
❖ liens de la home page vers elle-même (logo + footer)
❖ méga-menu en double (version mobile)
38. 04/12/2020
Objectifs Circulation du « jus »
Gestion des liens multiples
Comment les repérer ?
➢ Il n’y a pas d’outil dédié
→ A l’oeil
→ Avec Screaming Frog + Excel
→ Traitement (suppression, obfuscation, ancrage)
39. 04/12/2020
Objectifs Optimisation de la circulation du PR thématique
Liens pertinents et non pertinents
→ Conservation des liens entre pages de même thématique (champs lexicaux proches)
→ Ajout de liens entre pages de même thématique (champs lexicaux proches)
→ Suppression des liens entre pages de thématiques éloignées (champs lexicaux éloignés)
40. 04/12/2020
Objectifs Optimisation de la circulation du PR thématique
Avantage
+ Les liens sont très bien pris en compte par le robot, qui n’est de plus pas perturbé par des liens non pertinents
Inconvénient
o Les pages prioritaires reçoivent moins de liens
La mise en place ne va pas de soi, notamment sur les petits sites.
41. 04/12/2020
Objectifs Optimisation de la circulation du PR thématique
Exemple
Dans le méga-menu, tous les liens non inclus dans l’univers sont obfusqués.
42. 04/12/2020
Objectifs Valorisation des pages importantes
Gestion des pages prioritaires
1. Détermination des pages prioritaires en termes de ranking
o visibilité
o trafic
o transformation (lead, inbound...)
o CA généré
2. Validation du fait que ces pages reçoivent plus de « jus » (plus de liens) que les autres
3. Validation du fait qu’elles ne lient pas de pages dont la thématique est éloignée de la leur
4. Recherche de pages non importantes (SEO) mais très liées (mentions légales...).
43. 04/12/2020
Objectifs Valorisation des pages importantes
Attention, la plupart des visualisations sont mensongères pour cet objectif :
seul le premier lien repéré par une url sert à monter le graphe.
44. 04/12/2020
Application Le silo
Home
Silo 1 Silo 2 Silo 3
Page 11
Page 12
Page 13
Page 21
Page 22
Page 23
Page 31
Page 32
Page 33
Généralement à peu près cohérent avec l’architecture habituelle de l’information, notamment pour un e-commerce.
Ne se prête pas à tous les types de sites web.
45. 04/12/2020
Application Le silo
Home
Silo 1 Silo 2 Silo 3
Page 11
Page 12
Page 13
Page 21
Page 22
Page 23
Page 31
Page 32
Page 33
En réalité : beaucoup d’occasions de créer des liens parasites d’un point de vue SEO
❑ liens entre pages soeurs (têtes de catégories)
❑ fonctionnalité et UX (ajouter au panier, mon compte, produits équivalent,
témoignages clients, qui sommes-nous...)
❑ liens entre des pages équivalentes appartenant à des silos différents
exemple
silo Chat → brosse à dents pour chat brosse à dents pour chien silo Chien
46. 04/12/2020
Application Le silo
Home
Silo 1 Silo 2 Silo 3
Page 11
Page 12
Page 13
Page 21
Page 22
Page 23
Page 31
Page 32
Page 33
→ Sommes-nous certains que les catégories sont thématiques et non fonctionnelles ?
→ Sommes-nous certains que toutes les têtes de silo ont la même importance pour le client ?
→ Sommes-nous certains que la page importante pour le SEO est en haut de la structure ?
47. 04/12/2020
Application Le cocon sémantique
Formalisé par Laurent Bourrelly
A l’origine : les MFA (Made for Adsense), des sites mono-thématiques destinés à accueillir des publicités Google
✓ Un certain nombre de pages autour de la thématique (sites de 5 à 50 pages par exemple)
✓ Linking externe agressif
✓ Résultats excellents !
Exemples de MFA (sites actuellement en ligne, MFA est devenu Made For Amazon) :
▪
▪
▪
48. 04/12/2020
Application Le cocon sémantique
Par la suite, métier de consultant : difficultés à faire appliquer des recommandations SEO ; impossibilité de toucher au site web :
Solution pragmatique en réponse à cette problématique
1. création d’un « site web parallèle », en répertoire (/guide par exemple) calé pour le SEO
2. packaging du « cocon sémantique »
3. communication autour de la méthode et vente de formation
Exemples :
▪
▪
49. 04/12/2020
Application Le cocon sémantique
Méthode facile à marketer et à vendre
1. Recherche de requêtes, des requêtes associées et des intentions de recherche autour de la thématique,
afin de générer autant de pages que de groupes de requêtes/intentions de recherche détectés.
2. Edition d’un mindmap (plan du dossier) page mère / pages enfant
3. Rattachement des pages enfant à la page mère via des paragraphes intégrés au texte + linking in-text entre les pages enfant.
50. 04/12/2020
Application Le cocon sémantique
Intrinsèquement très efficace !
mais
❑ Méthode non déposée ni encadrée : de nombreux prestataires moyennement qualifiés en termes de SEO en produisent et
en vendent, voire l’automatisent
❑ Des clients achètent des cocons sémantiques plutôt qu’un conseil adapté à leur site web
❑ Vendu « packagé », la qualité n’est pas toujours au rendez-vous
❑ Intérêt de la hausse du trafic organique sur ces pages à mesurer
➢ Intégration dans la politique Maketing digital de l’entreprise (acquisition, inbound...)
51. 04/12/2020
Application Les actualités
Hiérarchisation chronologique :
→ Un article récent recueille un grand nombre de liens internes, pas forcément thématisés
→ Un article ancien n’en recueille presque plus, voire pas du tout (page orpheline)
Conséquences
✓ Les articles récents sont très valorisés au yeux du robot
✓ Les articles anciens sont défavorisés et ils ne transmettent plus de « jus ».
52. 04/12/2020
Application Les actualités
DC interne lié aux pages de liste (catégories...)
DC interne lié aux pages Suite
DC lié à d’autres contraintes techniques, type AMP...
Circulation du jus - exemples de recommandations à implémenter :
✓ le moins de pages Suite possible : chaque page de catégorie liste un grand nombre d’articles
(peu d’articles : pas de page Suite pour les pages Catégorie, création de nouvelles catégories)
✓ les pages Suite sont indexables (pas de canonical vers la première, par exemple)
✓ pas de système de tags
✓ chaque article liste les 3 articles suivants et les 3 articles précédents de sa catégorie
53. 04/12/2020
Méthodologie audit linking interne 0. Préalable
Du fait de la diversité des sites web, il n’y a pas de méthode standard, efficace dans tous les cas.
1. Savoir ce que l’on cherche
2. Choix des outils en fonction de ce que l’on cherche
3. Plusieurs passes sont parfois nécessaires.
55. 04/12/2020
Méthodologie audit linking interne 2. Repérage des problèmes
Repérage à l’oeil des éléments récurrents
❑ header
❑ footer
❑ widgets
❑ pages hub
❑ habitudes et expériences selon les CMS
❑ ...
1. Les pages importantes sont-elles celles qui reçoivent le plus de liens ?
2. Les pages peu importantes ne reçoivent-elles pas trop de liens ?
3. Toutes les pages reçoivent-elles suffisamment de liens ?
4. Les liens internes sont-ils pertinents (thématiques) ?
56. 04/12/2020
Méthodologie audit linking interne 3. Visualisation
Une visualisation n’est pas toujours possible.
Méthode
1. Crawl
2. Export des url (noeuds) et des liens
3. Nettoyage
4. Qualification
5. Import dans un outil de visualisation (Gephi)
57. 04/12/2020
Méthodologie audit linking interne 3. Visualisation
juillet 2019 • Chaque disque représente une page indexable
• Sa taille est fonction de son PR interne
• Sa couleur représente une thématique
• Chaque trait représente un lien
Dynamique (Force Atlas)
→ Les disques non liés se repoussent
→ Les disques liés s’attirent
61. 04/12/2020
Méthodologie Récapitulatif
0. Savoir ce que l’on cherche et choix des outils
1. Nettoyage
2. Repérage des problèmes potentiels
3. Visualisation (si possible)
4. Action
5. Vérification
6. Surveillance et résultat
7. ... et on recommence !
62. 04/12/2020
Questions
Un fil d’Ariane est-il pertinent en matière de linking interne ? Pourquoi ?
Les pages Catégorie de sont-elles suffisamment valorisées par le linking interne ?
Quelles améliorations apporteriez-vous ?
En quoi cette question est-elle intéressante dans le cadre d’un audit SEO ?