1. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 1
École Centrale de Lille
Cité Scientifique - BP 48 F-59651 Villeneuve d’Ascq Cedex
Origine du SEO, historique de
Google
Image : Source
Cours distribué sous licence Creative Commons,
selon les conditions suivantes :
Source des images indiquées au-dessous ou en cliquant sur l’image
Mise à jour du 29 janvier 2015
Rémi Bachelet
Dernière version de ce cours de
cours de référencement / SEO
2. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 2
Comment utiliser ce
cours :
1. Mettre les diapos en format plein écran en cliquant sur
2. Faire défiler l’animation en cliquant sur les diapositives
(attention : cliquer sur une image ou un lien ouvre la page web correspondante)
3. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 3
Origine du SEO
1. Les premiers moteurs de recherche
• Les algorithmes d’indexation
2. Google … et ses concurrents
4. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 4
Histoire du SEO
• Au début du web, pas de moteurs de recherche, mais des engins
spécialisés (the Wanderer mesure la taille du web), Gopher est un
protocole de classement) ou des indexeurs basiques (Archie indexe les
fichiers disponibles en ftp).
• Premier moteur de recherche : Aliweb en 1993, il établi le principe de
fonctionnement qui est toujours d’actualité :
1. On déclare ("to submit") l’adresse d’une page = son URL (Uniform Resource
Locator commencant par http:// )
2. Le moteur envoie un "crawler" (ou “spider”) télécharger la page. La page est
stockée sur le serveur du moteur de recherche…
3. … où elle est traitée par un indexeur pour en extraire les informations (mots-
clés, liens) et les interpréter (importance, répétition…).
4. périodiquement, le "crawler" revient sur la page pour actualiser les informations
(20% du trafic d’internet vient des moteurs de recherche).
• Au milieu des années 1990, le problème de l'indexation des sites web pour
les rendre plus faciles à trouver émerge, car la visibilité d’un site devient un
facteur de plus en plus important : le SEO (« Search Engine
Optimization ») émerge en tant que champ de compétences
– Selon Danny Sullivan, apparition du terme Search Engine Optimization vers
1997
5. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 5
Premiers algorithmes d’indexation
Aliweb requiert des fichiers "index", qui sont placés spécialement par les
webmestres et qui y déclarent l'adresse de leur pages, les mots-clés
associés …
– Mais ensuite les moteurs de recherche se basent sur des mots-clés
insérés dans le code des pages
Ce sont les étiquettes méta ou « meta tag » (meta parce qu’il
s’agit de donner de l’information … sur de l’information).
– Mais on est confrontés aux limites de l’utilisation des meta tags
comme indicateurs de la pertinence des pages :
• Les webmestres y mettent des mots-clés sans rapport avec le contenu
réel du site dans le but d'attirer du trafic = "spamdexing", "black hat"
• .. résultat : à cette époque, trouver la bonne page web est une
aventure…
Les premiers moteurs de recherche sont facilement manipulés et
discrédités mais de nouveaux algorithmes d’indexation, plus difficiles à
tromper sont développés…
La course entre les moteurs de recherche et les
webmasters qui veulent manipuler les résultats de
recherche pour attirer du trafic s'engage…
6. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 6
Google : les débuts
• Des étudiants de Stanford, Larry Page et Sergey Brin développent
"backrub," un moteur de recherche basé sur un algorithme
d’indexation baptisé PageRank
– PageRank = nom de l'inventeur, Larry Page
• L'algorithme calcule un indice basé sur les liens entrants :
– PR(page X) = PR(des pages qui donnent un lien vers X)
• Le principe n'est pas nouveau
– Utilisé en recherche : citation index. On mesure l'importance d'un article
au nombre de fois qu'il est cité dans d'autres articles.
– Le moteur de recherche Inktomi utilise déjà ce principe
– … et déjà des webmestres ont développé des manières de le manipuler
pour tricher (link farms)
• Google est fondé en 1998.
– Le moteur de recherche est :
• Dépouillé (page légère)
• Simple (recherche "et" par défaut)
• Rapide
… et il devient très rapidement populaire (en quelques semaines et aux
dépens d’Alta Vista)
8. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 8
Google, les chiffres :
– Un index de plus de 24 milliards de pages (2007)
– 23 000 employés dans le monde (2010)
– Plus de 110 sites régionaux, de 130 interfaces
linguistiques
– La marque la plus populaire au monde[1]
– Plus de 3 milliards de requêtes et 16 millions de
visiteurs uniques par mois (2007)
– Slogan « Don't be evil »
• Eric E. Schmidt, directeur
• Sergey Brin, directeur technique
• Larry E. Page, directeur produits
9. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 9
Le chiffre d'affaires de Google.
Les bénéfices nets
22 milliards de
dollars de
liquidités au 30
septembre 2009
Source le Monde 16.10.09
10. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 10
Google sur le marché des
recherches
• En mai 2009, dans le monde
– 68,6 %,
– devant Yahoo! (9 %)
– Baidu (8,7% - chinois).
• 85% à 90% de parts de trafic en Europe
• Sur le marché américain 65 %
– 19,6 % pour Yahoo!
– 8,4 % pour Microsoft.
Source : ComScore
11. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 11
Mais Google, c’est plus qu'un
moteur de recherche…
Google Earth, Analytics, Webmasters Tools,
Gmail, Youtube, Picasa …
– Le modèle opposé à celui de Microsoft : on est
prisonnier de MS contre son gré, essentiellement à
travers l’absence d’alternative et la non-
interopérabilité
• En plus, on est obligé de payer ….
– avec Google, on devient dépendant … en choisissant
d’utiliser des applications innovantes ..
• ..et gratuites… (ce « gratuit » ne l’est bien sûr pas réellement, il fait
partie du modèle économique).
12. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 12
Politique d'acquisition de
technologies
• Deja => Google Groups
• Picasa => Picasa
• Keyhole, Inc => Google Earth
• Urchin Software, Measure Map, Trendalyzer => Google Analytics
• Android => Android
• Phatbits => Google Desktop
• YouTube => YouTube (1.6MM$)
• FeedBurner => Google Reader
• Upstartle, Zenter, Tonic Systems, 2Web Technologies => Google
Documents
• JotSpot => Google Sites
• Marratech => Google Talk
Contrairement à MS, qui acheta souvent ses concurrents pour les
éliminer, Google les valorise
Source
13. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 13
Analyse du succès de Google
• Le bon timing
• Une philosophie : « Google attitude », Googleplex
• Rupture technologique : Brin et Page ont des doctorats en en
mathématiques.. et les ont valorisés
• Rapidité, simplicité
• Pages de résultats dépouillées (sans publicité au début)
• Une parfaite compréhension de la culture du Web
– Gratuité
– Affinités avec l'Opensource
– Innovation constante
14. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 14Image : Source
15. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 15
Les concurrents de Google
• Yahoo! Search,
≈ Microsoft Live Search / Bing
• Les outsiders : Exalead, Ask.com
• Les annuaires et moteurs thématiques /
régionaux
– DMOZ
– Une myriade de "micro" moteurs expérimentaux…
• De nouveaux venus ?
– Mais le « ticket d'entrée » n'est-il pas aujourd'hui
devenu énorme ?
16. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 16
Google comme étalon universel
• Dans beaucoup de pays, le référencement
naturel est devenu une « chasse au classement
Google »
17. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 17
Google Universal Search
• Depuis mai 2007, une recherche sur Google propose sur sa search engine
results page (SERP) des résultats mixant :
• Certes
– des Pages web
– Des liens sponsorisés
– Mais aussi
• Actualités,
• Images,
• Livres
• Cartes
• Blogs
• Vidéos
• Définitions (define:)
Avec Universal Search, des contenus auparavant séparés sont présentés
simultanément
Résultat :
- encore plus de candidats à la première page
+ Des stratégies alternatives pour y figurer
• Une évolution incessante : nouvelles versions régulièrement
18. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 18
Google, les vulnérabilités
• Modèle économique = le gratuit + les effets d’échelle
– Un CA dépendant à 99% du marché des liens sponsorisés => fraude aux
clics sur les pubs Adwords
– Rentabilité difficile de Youtube et de nombreux autres services …
– Risque de dispersion, manque de cohérence (Android vs. Chrome OS
etc..)
• Microsoft et Yahoo! ont lancé, en juillet 2009 un partenariat destiné à
concurrencer Google dans la recherche sur Internet.
– Microsoft, avec Bing, fournit la technologie
– Yahoo! la vente d'espaces publicitaires
Questions sur :
– L’abus de monopole (par exemple les pages des filiales de Google sont
souvent fort bien classée dans les SERP.. De Google)
– La privatisation du patrimoine culturel (scannerisation de bibliothèques
entières par Google Books, impact de Google News sur la presse en ligne)
19. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 19
Google, les concurrents de
demain
• Des alternatives à la manière d’accéder au web et à la recherche
« façon Google » se développent à travers le « web social ».
– Facebook, Twitter : les informations « pertinentes » sont proposées par
les « amis », pas par un moteur de recherche.
– Le temps passé sur le net est plus centré sur les interactions sociales
proposées par ces services
• Cette approche consistant à « monétiser le réseau social » pose de
plus en plus de questions sur le respect de la vie privée des
utilisateurs
– Google : Gmail + Google agenda + mémorisation des recherches sous IP pendant
plusieurs mois)
– Facebook : les informations du profil, photos etc … sont cédées à Facebook (cf. le
contrat d’utilisation)
20. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 20
Les thèmes et chapitres du cours
1. Origine du SEO, Google … et ses concurrents
2. La fréquentation d’un site : les fondamentaux
3. Dans la peau d’un moteur de recherche : le
PageRank
4. Web Analytics et liens commerciaux
5. Optimisation du référencement
– “Onpage”
– “Onsite”
– “Offsite”
6. Trouver et optimiser les mots-clés
7. Méthodologie de référencement et avenir du
SEO
21. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 21
Questions ?
22. Utilisation ou copie interdites sans citationRémi Bachelet janvier 15 22
Rémi BACHELET
Enseignant-chercheur,
Ecole Centrale de Lille
Mes principaux cours à Centrale
Gestion de projet, sociologie des organisations, recueil, analyse et traitement de données,
prévention du plagiat, module de marchés financiers, cours de qualité et méthodes de
résolution de problèmes, établir des cartes conceptuelles, utiliser Wikipédia et CentraleWiki,
formation au coaching pédagogique et à l'encadrement, référencement et SEO