Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to the smx conference
1. 11
SMX PARIS – 6 ET 7 JUIN 2013
Web Semantique et SEO
gilles Delaporte, Mondeca
2. 22
SMX PARIS – 6 ET 7 JUIN 2013
PRÉSENTATION
• Gilles Delaporte: Directeur Marketing et Commercial
• Plus 15 ans expérience autour de la gestion de l’information et des
connaissances
• A assister à la naissance et l’émergence du Web Sémantique
• L’accompagne depuis 10 ans chez Mondeca
• Organisation, structuration et enrichissement des contenus
3. 33
SMX PARIS – 6 ET 7 JUIN 2013
QUELQUES MOTS SUR LE WEB SEMANTIQUE
Un ensemble de technologies, d’outils et de standards
Pour une information plus accessible, compréhensible, partageable
Construire des solutions interopérables et automatisables
Du Web 1.0 au WEB 3.0 …. Ou de la page à la « donnée »
Data
4. 44
SMX PARIS – 6 ET 7 JUIN 2013
STANDARDS ET POINTS IMPORTANTS
Standards portés par le W3C
• OWL pour les ontologies et modèles
• RDF pour la description des ressources et objets d’informations
• SKOS pour la gestion de référentiels ou métadonnées
• SparQL pour l’interrogation
Notions importantes:
• Multilingue : Unicode
• Identification unique : URI
• Des Vocabulaires partagés
• Des terminologies de description
• Un langage proche de l’humain
Information est décomposée en: sujet , prédicat , objet
doc.html a pour auteur Fabien , doc.html a pour thème Musique
Elles forment un graphe
5. 55
SMX PARIS – 6 ET 7 JUIN 2013
DES POSTULATS
Le savoir est ce qui me permet de rendre une donnée utile
• Transforme la donnée en information et l’information en savoir
Un savoir utile devient encore plus utile s’il est partagé
• Une donnée inutile ou incomplète l’est encore plus en étant partagée
Le contenu sémantique des données est plus durable que tout format,
tout mode de stockage et toute application qui les utilise
Ce qui est durable:
• Les sujets, les entités, les objets dont on parle
Ce qui l’est moins:
• Les phrases, les morceaux de textes, certains contenus…
Le durable mérite l’investissement…
6. 66
SMX PARIS – 6 ET 7 JUIN 2013
POUR CRÉER DE LA VALEUR AVEC LE WEB SÉMANTIQUE
1
2
3
De l’intelligence, des ressources:
pour décrire, comprendre, organiser
Des outils, des traitements, de l’automatisme:
• pour traiter les contenus, assister les utilisateurs
Des moyens d’exposition de la richesse des contenus
• Recherche, exploration dynamique, classification, publication
7. 77
SMX PARIS – 6 ET 7 JUIN 2013
LE LINKED OPEN DATA
Un ensemble d’initiatives, de
données, de vocabulaires, de
langages disponibles… mais
aussi le mouvement Open data
Dublin Core
Basic Geo
8. 88
SMX PARIS – 6 ET 7 JUIN 2013
ET POUR LE SEO?
Être visible : présent sur les moteurs de recherche en bonne place
Etre compris: améliorer le taux de transformation
Etre accessible: par différents points d’entrées , par le jeu des relations
Savoir Retenir : richesse des contenus, des services, de la personnalisation
Le Web sémantique va aider sur ces différents axes. Il va constituer un cadre
pour l’intelligence métier, offrir les moyens de doper les services et de
pouvoir constituer des « contenus intelligents »
9. 99
SMX PARIS – 6 ET 7 JUIN 2013
ET DE LA METHODE
Enrichir les contenus par de la sémantique:
• Structuration et organisation
• Identification des «entités», des sujets, des «POI»
• Repérage de concept
• Mise en relation
• Agrégation
Des métadonnées, des liens, de nouveaux contenus, de l’exploration
intelligente
10. 1010
SMX PARIS – 6 ET 7 JUIN 2013
CHAINE DE TRAITEMENT
Inférence
Ajout
métadonnées
Contrôle Qualite
Content
Annotation
Pilotage du Workflow
linguistique
référentiels
pose metadatas
Content
Classification
Classification basée
sur des règles métier
publication
dynamique
Ontologie et référentiels
Alimente les composants
Serialisationflux
Rules Editor
11. 1111
SMX PARIS – 6 ET 7 JUIN 2013
ET ENSUITE?
Vocabulaire pour les métadonnées, définit les attributs ou propriétés
utilisables pour décrire une « chose »
1) Les métadonnées traduites dans le formalisme Schema.org (autres aussi)
2) Ajoutées aux contenus entre des balises de type /div
➤ Pour être « comprises » et « utilisées » par les moteurs de recherche web
Conduit à améliorer l’identification du contenu
Permet une meilleure exposition des résultats
Améliore le taux de transformation via les rich Snippets
Différents tests annoncent de 15 % à 30% de plus en CTR
13. 1313
SMX PARIS – 6 ET 7 JUIN 2013
ET LA GRANDE QUESTION
Est-ce que l’utilisation de schema.org améliore le ranking!
Google dit qu’il n’utilise pas les « meta » pour son algo de ranking… mais:
Le contenu est mieux identifié
Une page avec dans le texte paris et dans les metas «PARIS» ne pourra faire
qu’améliorer la réponse, d’autant si le PARIS est un identifiant connu!
Aussi:
It would be better to ask “will schema.org metadata help people find my
pages using Google”, to which the answer is yes (phil barker)
14. 1414
SMX PARIS – 6 ET 7 JUIN 2013
MAIS ENCORE PLUS LOIN
RDF est un langage formel, il autorise la mise en œuvre de raisonnements
Des règles pourront être appliquées sur les contenus pour:
• Classifier automatiquement ces contenus
• Compléter l’information
• Poser des liens entre contenus
Exemple de règle: si doc A porte la métadonnée « ville » des « usa » et nom d’un
« joueur » de basket ou d’une « équipe » de basket et le terme « basket », alors
affecter la catégorie IPTC, sport, basket, NBA
La classification permet d’affecter le contenu à une catégorie, un thème, un
profil client etc… utilisée pour:
• la recherche à facettes ( filtrage dynamique des résultats de recherche)
• La navigation dynamique dans un portail
17. 1717
SMX PARIS – 6 ET 7 JUIN 2013
ET DANS UN MONDE IDEAL
La recherche sur Google ramène en tête une page « hub » sur le sujet
➤ Pérenne, durable, qu’on peut garder dans ses favoris
De cette page « hub » on peut naviguer vers
➤ Une fiche descriptive style dictionnaire
➤ Des dossiers pour approfondir
➤ Des sujets reliés : liens vers d’autres pages « hub »
➤ Des articles, des discussions sur les forums
➤ Eventuellement des pages de référence hors site
De toute page on peut naviguer vers les pages « hubs » des sujets dont
traite la page, les pages « hub » sont donc une cible prioritaire du SEO
Elles sont produites automatiquement à partir des métadonnées, règles et
classification depuis un TripleStore
18. 1818
SMX PARIS – 6 ET 7 JUIN 2013
PAGES HUB
Produites à partir du graphe formé par les différentes assertions générées
Organisés autour d’index ou de taxonomies ( plans de classements)
19. 1919
SMX PARIS – 6 ET 7 JUIN 2013
PAGE HUB OU TOPIC PAGE
By jean delahousse
24. 2424
SMX PARIS – 6 ET 7 JUIN 2013
AUTOUR DES SUJETS, CONCEPTS ET TERMINOLOGIES
Poser des métadonnées c’est bien… mais encore faut il que celles-ci
répondent aux sujets et thèmes traités, qu’elles soient réutilisables,
reconnues, organisées…
La constitution d’un référentiel constitue la première opération et se
poursuit tout au long de la vie des contenus et productions.
Ce référentiel va servir aux rédacteurs comme aux outils pour « traiter » et
enrichir les textes.
Le processus est dit d’annotation et consiste en la pose automatique de
métadonnées pour des textes en s’appuyant sur ces référentiels. Une
révision peut être faite ou non…
25. 2525
SMX PARIS – 6 ET 7 JUIN 2013
EXEMPLE TOURISME
Constitues à partir des
différentes études,
publications de la
destination, ainsi que
des blogs et des pages
facebook.
"L'identité du Territoire" repose
sur une écoute et une analyse
fine du territoire. Il s'agit de
recueillir et analyser les images et
valeurs identitaires du Territoire
véhiculées par les acteurs culturels
et touristiques. Puis de les relier
aux mots des gens, de la marque
et du territoire. à partir d'un
corpus fourni par la Destination et
ajustée par des entretiens terrain
mots métiers sont à la fois
disponibles auprès de
différents producteurs de
données du LOD (
thésaurus, listes autorités…)
mais aussi constitués par les
producteurs de contenus