Les "pièges" dans lesquels les webmasters de sites internationaux et multilingues peuvent tomber sont nombreux.
Mathieu CHAPON (Associé & Directeur métiers) et Camille Thomas (Consultant SEO Senior), vous expliqueront en particulier :
quels sont les meilleurs choix de structure pour les sites internationaux et multilingues : sous domaines, répertoires, ccTLD ..., paramètres
quelle syntaxe d'urls utiliser pour un site international et en particulier pour les langues non européennes
pourquoi et comment implémenter la balise HREFLANG
Actualite des moteurs de recherche et du referencement SEO/SEA - petit déjeun...
Bonnes pratiques SEO pour les sites multilingues et internationaux
1. Page 1Page 1
Best practices SEO pour les sites
multilingues et internationaux
04/12/2013
K_lice
Camille Thomas Mathieu Chapon
Mathieujava
&
2. Page 2Page 2
Au programme
1. Géolocalisation de votre site
2. Langue de votre site
3. Balise href lang
4. Ip locale
5. Splash screen
6. Erreurs à éviter
7. Charset
3. Page 3Page 3
Il faut calquer sa structure de sites sur celle des moteurs
Index pays : Google.be
Option linguistique
4. Page 4Page 4
Conclusion : géolocalisation d’abord, langue ensuite
Aidez Google en utilisant un ccTLD adapté
– ccTLD : Country Code TLD > be, fr, co.uk, de
Si pas possible :
– Géolocalisation à l’aide du compte GWT
Sous domaine : be.domaine.com
Sous répertoire : www.domaine.com/be
5. Page 5Page 5
Ensuite, répertoire langue
Google reconnait les codes de la nomenclature ISO 3166 et 639 identifiant
respectivement les pays et les langues, notamment lorsqu’ils sont utilisés
comme nom d’un répertoire situé à la racine.
– Le premier code à deux lettres correspond au pays, le second à la langue
– Voici deux liens donnant la nomenclature officielle :
http://fr.wikipedia.org/wiki/ISO_3166-1 (codes pays)
http://fr.wikipedia.org/wiki/Liste_des_codes_ISO_639-1 (langues)
Exemples :
– www.domaine.com/uk-en/ est reconnu comme un répertoire destiné aux
habitants du royaume uni avec des pages en anglais.
– www.domaine.com/es-ca/ est reconnu comme un répertoire destiné aux
habitants de l’Espagne parlant catalan (et non des pages en espagnol pour
des canadiens).
– La notation /es/ca/ est également reconnue.
Attention : utiliser cette notation facilite l’identification, mais ne l’assure
pas à elle seule… Il est recommandé de l’utiliser, mais un moteur de
recherche ne se fie pas à cette seule donnée, en particulier pour déterminer
la langue d’une page.
6. Page 6Page 6
Cette balise récemment introduite par Google permet de gérer un cas
fréquent : la création de pages multilingues très similaires entre elles
– Vos pages proposent un contenu globalement fixe dans une langue donnée, à
l'exception de quelques variations liées à la zone géographique (par exemple, un
contenu en français ciblant les internautes de Belgique, de France et de Suisse).
– Le contenu du site est traduit dans son intégralité. Par exemple, chaque page est
disponible en allemand et en français.
La balise pointe vers les urls à indexer dans les versions linguistiques
différentes
Elle peut être placée :
– Dans la section HTML <head>
<link rel="alternate" hreflang="es" href="http://es.example.com/" />
– Dans l’entête HTTP
Link: <http://es.example.com/>; rel="alternate"; hreflang="es“
– Dans le sitemap
<xhtml:link rel="alternate" hreflang="es" href="http:// es.example.com /" />
Utiliser la balise rel="alternate" hreflang="x"
7. Page 7Page 7
Un exemple pour que ce soit plus clair
http://www.example.com/page.html : page d'accueil en anglais. Fournit des
informations sur les frais de port à l'international depuis les États-Unis.
http://en-gb.example.com/page.html : en anglais, indique les prix en livres
sterling.
http://en-us.example.com/page.html : en anglais, indique les prix en dollars
américains.
http://de.example.com/seite.html : version du contenu en allemand.
Supposons que vous souhaitiez demander à Google de diffuser les pages comme
suit : la version allemande auprès des internautes qui utilisent Google en allemand,
la page en-us auprès des internautes qui utilisent google.com en anglais et la version
en-gb auprès des internautes qui utilisent google.co.uk en anglais.
<link rel="alternate" hreflang="en" href="http://www.example.com/page.html" />
<link rel="alternate" hreflang="en-gb" href="http://en-gb.example.com/page.html" />
<link rel="alternate" hreflang="en-us" href="http://en-us.example.com/page.html" />
<link rel="alternate" hreflang="de" href="http://de.example.com/seite.html" />
8. Page 8Page 8
Ip locale ?
"The server location (through the IP address of the server) is frequently near your
users. However, some websites use distributed content delivery networks (CDNs)
or are hosted in a country with better webserver infrastructure, so we try not to
rely on the server location alone.“
Dans le cas des CDNs il faut s’assurer :
– Que les seveurs soient situés dans le pays visé ou au moins proche
géographiquement Vitesse de téléchargement affecte votre SEO
Conclusion : ne pas s’obstiner à obtenir une IP locale
http://googlewebmastercentral.blogspot.com.es/2010/03/working-with-multi-regional-websites.html
9. Page 9Page 9
Traduction, version multipays et duplicate
Deux pages identiques destinées à deux index pays différents ne sont pas
du duplicate content (à condition que la géolocalisation soit correcte)
Deux pages quasi identiques dans deux langues différentes ne sont pas du
duplicate content (à condition que la langue soit correctement reconnue)
Duplicate content ?
10. Page 10Page 10
Le problème du splash screen
Il convient d’éviter absolument de créer un écran d’accueil pour choisir la
langue. Cette pratique est fortement déconseillée pour des raisons
d’ergonomie et cela nuit au référencement.
– Nous préconisons plutôt de détecter le pays d’origine de l’internaute, et la
langue par défaut du navigateur et de :
Définir une version pays et une langue par défaut, qui sera présentée en
cas d’échec de la détection
D’orienter automatiquement l’internaute vers les pages qui lui sont
destinées (détection de la langue du navigateur)
De lui permettre de choisir un autre réglage par défaut, si la redirection
automatique ne lui convient pas
DÉTECTER LE PAYS D’ORIGINE DU VISITEUR
– La détection du pays d’origine du visiteur peut s’effectuer par détection de la
géolocalisation de l’IP du visiteur.
– Il existe différents services payants ou gratuits offrant sous forme de service
SaaS la résolution de la géolocalisation IP.
– La détection est correcte dans 90% des cas
11. Page 11Page 11
Ce n’est pas du cloaking
Modifier les pages présentées en fonction de la langue ne pose pas de
problèmes de référencement.
De même la géolocalisation par l’IP n’est pas du cloaking, mais de l’IP
delivery
12. Page 12Page 12
Quelques erreurs à éviter
Urls inversées :
– Langue d’abord, pays ensuite : www.domaine.com/fr/be
– Pb : La géolocalisation devient impossible
Une langue par ccTLD
– Domaine.fr =>français, et domaine.com =>anglais
– Vous allez le regretter bientôt !
La langue en paramètre
– domaine.com/page.html?lang=es
– Souvent pas bien compris par les moteurs…
14. Page 14Page 14
Les familles de charset
Les charset ISO
– Ex : ISO-8951-1 (occidental latin 1), français complet ISO-8951-15
– Inconvénient : pas compatible avec un site réellement multilingue
UTF-8
– Permet d’encoder la plupart des langues
– Mais attention : n’est pas adapté à toutes les langues, notamment les
langues à idéogrammes
– Pour les langues avec un grand nombre d’idéogrammes, il faut passer à
l’UTF-16 pour des raisons de performances
Attention aux problèmes de transcodage
– Pages encodées en UTF8, contenu chargé en ISO (copier coller) par les
utilisateurs, ou importés
15. Page 15Page 15
Comment déclarer un charset
Comment déclarer le charset ?
Avec l'en-tête HTTP Content-type :
– Via un fichier .htaccess : AddDefaultCharset UTF-8
– En PHP : header('Content-Type: text/html;charset=UTF-8');
En XML et XHTML, avec le prologue : <?xml version="1.0" encoding="UTF-8"?>
Grâce à la balise meta dans le code
– En HTML5 : <meta charset="UTF-8">
– En HTML4 : <meta http-equiv="Content-Type" content="text/html;
charset=utf-8">
– En XHTML 1.1 : <meta http-equiv="Content-Type" content="text/html;
charset=utf-8" />
16. Page 16Page 16
Deux mots sur les caractères asiatiques
Japonais
– Katakana : syllabaire pour les mots
étrangers
– Hiragana : autre syllabaire pour les
mots orthographiés phoniquement
– Kanji : idéogrammes d’origine
chinoise
Chinois
– Pinyin : écriture romanisée
Pékin > Beijing
– Chinois simplifié
– Sinogrammes traditionnels
=> Dans les urls : tout convertir en
pinyin!