SlideShare una empresa de Scribd logo
1 de 32
1
Les enjeux du moteur de recherche
de votre site Web
2
Core-Techs – Nos métiers
Formation &
coaching
ConseilIntégration,
développement,
expertise
technique
Web et UX
design
3
Les solutions de search intégrées
4
Aujourd’hui les internautes veulent :
5
Et souvent, pour trouver quelque chose sur votre site, ils
utilisent ça :
Google a ses limites dans bien des cas.
Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le
contexte du site Internet ou selon les besoins des utilisateurs.
Il a une présentation générique pour tous les utilisateurs, sans prendre en
compte les spécificités du site Web.
6
OBESITE DE
L’INFORMATION
Nous faisons face à une croissance exponentielle des contenus sur le Web.
Face cette obésité de l’information, nous sommes tous différents dans notre
recherche d’information.
Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les
mêmes démarches, pas les mêmes habitudes. La pertinence n’est pas la
même pour tout le monde. Un même résultat peut satisfaire une personne,
mais pas l’autre.
7
Visuel Big Data BIG DATA
(données massives)
Nous produisons un nombre incommensurable de
données (personnelles, publiées sur le web ou non, …) .
Toutes ces données sont stockées quelque part et tant
qu’elles ne sont pas exploitées, elles ne servent à rien.
Ici l’enjeu des moteurs de recherche est d’être capable
d’analyser notre comportement sur le Web et ainsi
d’identifier nos habitudes, nos besoins.
8
HETEROGENEÏTE DES SOLUTIONS
• Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv,
document, ….
• Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie,
documents multi-médoa…
Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la
labéliser, la rechercher…
9
BESOIN DE SENS
Le travail principal du moteur est de donner du sens au contenu,
au produit, aux dépendances entre les contenus; il va réduire le
bruit, donner de la pertinence à une recherche, …
10
UN MOTEUR CA FAIT QUOI ?
11
Indexe Transforme
Restitue Expose
12
Bases de données,
sites web, référentiels
documentaires, fichiers,
données structurées,
non structurées, …
Transforme
Restitue Expose
Un moteur indexe, c’est-à-dire qu’il est
capable de récupérer des contenus quel
que soit leur format de stockage.
13
Indexe
Alignement,
structuration,
pondération,
dédoublonnage,
scoring, matching,
enrichissement, …
Restitue Expose
En indexant les données, le
moteur va les transformer.
14
Indexe Transforme
Facettes,
suggestions, auto-
complétion, aides
à la recherche, …
Expose
Il restitue le contenu. Il peut
proposer des alternatives,
suggestions ou encore analyser
une requête.
15
Indexe Transforme
Restitue
RDF,
moissonnage,
Sparql, open
data, …
Toutes les données doivent être
capables de « parler » les unes
aux autres. Le moteur doit donc
enrichir ce qu’on appelle le web
des données.
16
16/12
Un bon moteur indexe tout type de contenu
17
17/12
Un bon moteur propose différentes logiques d’autocomplétion
18
18/12
• Facettes de valeurs
• Facettes de date
• Facette par arbre / pivot
• Facette par intervalle
• Facette par catégorie / type
Un bon moteur gère des facettes variables
19
19/12
Multilinguisme
20
Un bon moteur optimise la pertinence
Optimisations
linguistiques
• Racinisation
• Synonymie
• Stop words
• Orthographe
Optimisations
statistiques
• Scoring et
pondération
• Text mining
• Proximité
21
Un bon moteur suggère d’après le corpus
22
Contextualisation des résultats
23
Moteur de recommandations & cross-content
24
Un outil de gestion de campagnes promotionnelles
25
Recherche
géospatiale
26
Recherche multi-
site, multi-source
Le moteur de recherche est capable de
parcourir toutes ces sources et de restituer
les données via une seule interface.
27
Optimisation des performances
La capacité technique du moteur à monter en charge
et à répondre au volume de consultation, de réponse.
28
Un back-office de suivi statistique
Utile afin de s’améliorer. On a accès au:
• Nombre de requêtes,
• Requêtes les plus fréquentes,
• Requêtes n’ayant abouti à
aucun résultat,
• Temps moyen de réponse,
• …
29
Un outil d’alignement des données
CAPTER TRANSFORMER ENRICHIR ANALYSER
30
Un outil dédié au Web sémantique
• Structuration RDF & URI
• Mise à disposition de Sparql End Point
• Intégration de thésaurus et d’ontologies
• …
31
Nos recommandations pour réussir un projet de search
RECHERCHER LA SIMPLICITE !
Quels sont les
besoins métiers ?
Quels sont les
contenus et leur
structuration ?
Quelles sont les
attentes utilisateur
?
Travailler sur une
logique itérative
avec des
utilisateurs métier
Suivre les
statistiques de
fonctionnement
32

Más contenido relacionado

La actualidad más candente

Quelle solution technique pour un projet web ?
Quelle solution technique pour un projet web ?Quelle solution technique pour un projet web ?
Quelle solution technique pour un projet web ?Core-Techs
 
Ecriture web et ergonomie éditoriale
Ecriture web et ergonomie éditorialeEcriture web et ergonomie éditoriale
Ecriture web et ergonomie éditorialeWearethewords
 
Cms ecosystème etat des lieux et tendances
Cms ecosystème   etat des lieux et tendancesCms ecosystème   etat des lieux et tendances
Cms ecosystème etat des lieux et tendancesCore-Techs
 
2015 Projet Web Collaborartif, Introduction au cours
2015 Projet Web Collaborartif, Introduction au cours2015 Projet Web Collaborartif, Introduction au cours
2015 Projet Web Collaborartif, Introduction au coursEric Giraudin
 
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEOEric Giraudin
 
Strategie de contenu et marketing éditorial
Strategie de contenu et marketing éditorialStrategie de contenu et marketing éditorial
Strategie de contenu et marketing éditorialWearethewords
 
2015 cours-projet web-infonum-part2
2015 cours-projet web-infonum-part22015 cours-projet web-infonum-part2
2015 cours-projet web-infonum-part2Eric Giraudin
 
Le Contenu, pilier principal du Référencement Naturel
Le Contenu, pilier principal du Référencement NaturelLe Contenu, pilier principal du Référencement Naturel
Le Contenu, pilier principal du Référencement NaturelNicolas Richer
 
8 optimisations sites e-commerce on-site
8 optimisations sites e-commerce on-site8 optimisations sites e-commerce on-site
8 optimisations sites e-commerce on-siteSemrush France
 
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...Eric Giraudin
 
La charte éditoriale, essentielle pour donner du sens à votre site web !
La charte éditoriale, essentielle pour donner du sens à votre site web !La charte éditoriale, essentielle pour donner du sens à votre site web !
La charte éditoriale, essentielle pour donner du sens à votre site web !quel progrès ! - NETCO GROUP
 
3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce
3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce
3 Outils et Méthodes pour faire le bon choix de votre solution EcommerceCore-Techs
 
Les moteurs de recherche pour Drupal
Les moteurs de recherche pour DrupalLes moteurs de recherche pour Drupal
Les moteurs de recherche pour DrupalCore-Techs
 
Cours projet web collaboratif - partie 1 : Introduction, version 2019
Cours projet web collaboratif - partie 1 : Introduction, version 2019Cours projet web collaboratif - partie 1 : Introduction, version 2019
Cours projet web collaboratif - partie 1 : Introduction, version 2019Eric Giraudin
 
Placez votre site Internet en pôle position
Placez votre site Internet en pôle positionPlacez votre site Internet en pôle position
Placez votre site Internet en pôle positionSylvie de Meeûs
 
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Eric Giraudin
 
10 bénéfices d'une bonne architecture d'information - Webinar Yellow Dolphin...
10 bénéfices d'une bonne architecture d'information -  Webinar Yellow Dolphin...10 bénéfices d'une bonne architecture d'information -  Webinar Yellow Dolphin...
10 bénéfices d'une bonne architecture d'information - Webinar Yellow Dolphin...Yellow Dolphins
 
Créer un site internet efficace aujourd'hui !
Créer un site internet efficace aujourd'hui !Créer un site internet efficace aujourd'hui !
Créer un site internet efficace aujourd'hui !Odomia
 
Contenus Web En Cure Idemm2010
Contenus Web En Cure Idemm2010Contenus Web En Cure Idemm2010
Contenus Web En Cure Idemm2010Wearethewords
 
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...COMPETITIC
 

La actualidad más candente (20)

Quelle solution technique pour un projet web ?
Quelle solution technique pour un projet web ?Quelle solution technique pour un projet web ?
Quelle solution technique pour un projet web ?
 
Ecriture web et ergonomie éditoriale
Ecriture web et ergonomie éditorialeEcriture web et ergonomie éditoriale
Ecriture web et ergonomie éditoriale
 
Cms ecosystème etat des lieux et tendances
Cms ecosystème   etat des lieux et tendancesCms ecosystème   etat des lieux et tendances
Cms ecosystème etat des lieux et tendances
 
2015 Projet Web Collaborartif, Introduction au cours
2015 Projet Web Collaborartif, Introduction au cours2015 Projet Web Collaborartif, Introduction au cours
2015 Projet Web Collaborartif, Introduction au cours
 
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO
2015 Cours projet web collaboratif - Partie 3 : écriture web et SEO
 
Strategie de contenu et marketing éditorial
Strategie de contenu et marketing éditorialStrategie de contenu et marketing éditorial
Strategie de contenu et marketing éditorial
 
2015 cours-projet web-infonum-part2
2015 cours-projet web-infonum-part22015 cours-projet web-infonum-part2
2015 cours-projet web-infonum-part2
 
Le Contenu, pilier principal du Référencement Naturel
Le Contenu, pilier principal du Référencement NaturelLe Contenu, pilier principal du Référencement Naturel
Le Contenu, pilier principal du Référencement Naturel
 
8 optimisations sites e-commerce on-site
8 optimisations sites e-commerce on-site8 optimisations sites e-commerce on-site
8 optimisations sites e-commerce on-site
 
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...
Cours projet web collaboratif - partie 3 : Les contenus : optimisation & diff...
 
La charte éditoriale, essentielle pour donner du sens à votre site web !
La charte éditoriale, essentielle pour donner du sens à votre site web !La charte éditoriale, essentielle pour donner du sens à votre site web !
La charte éditoriale, essentielle pour donner du sens à votre site web !
 
3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce
3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce
3 Outils et Méthodes pour faire le bon choix de votre solution Ecommerce
 
Les moteurs de recherche pour Drupal
Les moteurs de recherche pour DrupalLes moteurs de recherche pour Drupal
Les moteurs de recherche pour Drupal
 
Cours projet web collaboratif - partie 1 : Introduction, version 2019
Cours projet web collaboratif - partie 1 : Introduction, version 2019Cours projet web collaboratif - partie 1 : Introduction, version 2019
Cours projet web collaboratif - partie 1 : Introduction, version 2019
 
Placez votre site Internet en pôle position
Placez votre site Internet en pôle positionPlacez votre site Internet en pôle position
Placez votre site Internet en pôle position
 
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
Cours projet web collaboratif - partie 2 : Stratégie éditoriale, version 2019
 
10 bénéfices d'une bonne architecture d'information - Webinar Yellow Dolphin...
10 bénéfices d'une bonne architecture d'information -  Webinar Yellow Dolphin...10 bénéfices d'une bonne architecture d'information -  Webinar Yellow Dolphin...
10 bénéfices d'une bonne architecture d'information - Webinar Yellow Dolphin...
 
Créer un site internet efficace aujourd'hui !
Créer un site internet efficace aujourd'hui !Créer un site internet efficace aujourd'hui !
Créer un site internet efficace aujourd'hui !
 
Contenus Web En Cure Idemm2010
Contenus Web En Cure Idemm2010Contenus Web En Cure Idemm2010
Contenus Web En Cure Idemm2010
 
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...
2011 03 07 Convaincre et fidéliser la clientèle en optimisant son site web - ...
 

Similar a Webinar : Les enjeux du moteur de recherche

Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Antidot
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSDesjardins
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifiquelazoumi ouarfli
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebChristophe Charmetton
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...mondeca
 
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...Antidot
 
Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3cspirin
 
Séminaire Communication web - partie 1
Séminaire Communication web - partie 1Séminaire Communication web - partie 1
Séminaire Communication web - partie 1Noémie Toledano
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Aref Jdey
 
Comment concevoir un site web performant
Comment concevoir un site web performantComment concevoir un site web performant
Comment concevoir un site web performantThierry Picard
 
Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0Equipe RENARD
 
Les 10 commandements du référencement durable - Mêlée Numérique 2015
Les 10 commandements du référencement durable - Mêlée Numérique 2015Les 10 commandements du référencement durable - Mêlée Numérique 2015
Les 10 commandements du référencement durable - Mêlée Numérique 2015Objectif Papillon
 
Livre blanc Rubedo - Plateforme digitale open-source
Livre blanc Rubedo - Plateforme digitale open-sourceLivre blanc Rubedo - Plateforme digitale open-source
Livre blanc Rubedo - Plateforme digitale open-sourceRubedo, a WebTales solution
 
Stratégie de contenu SEO et Web-marketing - Meetup SEO
Stratégie de contenu SEO et Web-marketing - Meetup SEOStratégie de contenu SEO et Web-marketing - Meetup SEO
Stratégie de contenu SEO et Web-marketing - Meetup SEOOne Clic Conseil
 

Similar a Webinar : Les enjeux du moteur de recherche (20)

Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
Linked Enterprise Data : disposer d’une vue consolidée des données de l'entre...
 
Concepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSSConcepts de Recherche dans un environnement WSS et MOSS
Concepts de Recherche dans un environnement WSS et MOSS
 
Tic recherche-scientifique
Tic recherche-scientifiqueTic recherche-scientifique
Tic recherche-scientifique
 
Offre Search
Offre SearchOffre Search
Offre Search
 
Du bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le WebDu bon usage de google : la recherche d'information sur le Web
Du bon usage de google : la recherche d'information sur le Web
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
 
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
i-expo 2013 : présentation du Linked Enterprise Data par Antidot avec témoign...
 
Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3Accompagner le lecteur aux usages du numérique 3/3
Accompagner le lecteur aux usages du numérique 3/3
 
Séminaire Communication web - partie 1
Séminaire Communication web - partie 1Séminaire Communication web - partie 1
Séminaire Communication web - partie 1
 
Création ou refonte de site Internet
Création ou refonte de site InternetCréation ou refonte de site Internet
Création ou refonte de site Internet
 
Sem info system_2012
Sem info system_2012Sem info system_2012
Sem info system_2012
 
Cms big data Rubedo, au delà des performances
Cms big data Rubedo, au delà des performancesCms big data Rubedo, au delà des performances
Cms big data Rubedo, au delà des performances
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?Chercher mieux pour mieux trouver ?
Chercher mieux pour mieux trouver ?
 
Comment concevoir un site web performant
Comment concevoir un site web performantComment concevoir un site web performant
Comment concevoir un site web performant
 
Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0Transfert de connaissances et web 2.0
Transfert de connaissances et web 2.0
 
Les 10 commandements du référencement durable - Mêlée Numérique 2015
Les 10 commandements du référencement durable - Mêlée Numérique 2015Les 10 commandements du référencement durable - Mêlée Numérique 2015
Les 10 commandements du référencement durable - Mêlée Numérique 2015
 
Big data
Big dataBig data
Big data
 
Livre blanc Rubedo - Plateforme digitale open-source
Livre blanc Rubedo - Plateforme digitale open-sourceLivre blanc Rubedo - Plateforme digitale open-source
Livre blanc Rubedo - Plateforme digitale open-source
 
Stratégie de contenu SEO et Web-marketing - Meetup SEO
Stratégie de contenu SEO et Web-marketing - Meetup SEOStratégie de contenu SEO et Web-marketing - Meetup SEO
Stratégie de contenu SEO et Web-marketing - Meetup SEO
 

Más de Core-Techs

10 méthodes UX appliquées à votre projet Web
10 méthodes UX appliquées à votre projet Web10 méthodes UX appliquées à votre projet Web
10 méthodes UX appliquées à votre projet WebCore-Techs
 
Retour d'experience sur drupal 8
Retour d'experience sur drupal 8Retour d'experience sur drupal 8
Retour d'experience sur drupal 8Core-Techs
 
Trucs & astuces drupal
Trucs & astuces drupalTrucs & astuces drupal
Trucs & astuces drupalCore-Techs
 
Keynote drupagora 2015 7
Keynote drupagora 2015 7Keynote drupagora 2015 7
Keynote drupagora 2015 7Core-Techs
 
Cahier des charges avril 2015
Cahier des charges   avril 2015Cahier des charges   avril 2015
Cahier des charges avril 2015Core-Techs
 
Les 10 erreurs d'un projet web déc 2014
Les 10 erreurs d'un projet web   déc 2014Les 10 erreurs d'un projet web   déc 2014
Les 10 erreurs d'un projet web déc 2014Core-Techs
 
Conférence Gestion de projet digital
Conférence Gestion de projet digitalConférence Gestion de projet digital
Conférence Gestion de projet digitalCore-Techs
 
Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...
Drupagora 2014 :  Reprendre un projet avec Drupal quand on a des centaines de...Drupagora 2014 :  Reprendre un projet avec Drupal quand on a des centaines de...
Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...Core-Techs
 
Introduction à Drupal 8
Introduction à Drupal 8Introduction à Drupal 8
Introduction à Drupal 8Core-Techs
 
Reprise projet Drupal Drupagora2013
Reprise projet Drupal Drupagora2013Reprise projet Drupal Drupagora2013
Reprise projet Drupal Drupagora2013Core-Techs
 
Drupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atoutsDrupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atoutsCore-Techs
 
Démonstration Drupal Commons !
Démonstration Drupal Commons ! Démonstration Drupal Commons !
Démonstration Drupal Commons ! Core-Techs
 
Wordpress Ecommerce - Core-Techs
Wordpress Ecommerce - Core-TechsWordpress Ecommerce - Core-Techs
Wordpress Ecommerce - Core-TechsCore-Techs
 
Drupagora 2012 - Votre application cartographique avec Drupal
Drupagora 2012 - Votre application cartographique avec DrupalDrupagora 2012 - Votre application cartographique avec Drupal
Drupagora 2012 - Votre application cartographique avec DrupalCore-Techs
 
Drupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet DrupalDrupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet DrupalCore-Techs
 
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...Core-Techs
 
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...Core-Techs
 
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.Core-Techs
 
A chaque besoin sa distribution
A chaque besoin sa distributionA chaque besoin sa distribution
A chaque besoin sa distributionCore-Techs
 
Panorama des solutions Ecommerce pour Drupal
Panorama des solutions Ecommerce pour DrupalPanorama des solutions Ecommerce pour Drupal
Panorama des solutions Ecommerce pour DrupalCore-Techs
 

Más de Core-Techs (20)

10 méthodes UX appliquées à votre projet Web
10 méthodes UX appliquées à votre projet Web10 méthodes UX appliquées à votre projet Web
10 méthodes UX appliquées à votre projet Web
 
Retour d'experience sur drupal 8
Retour d'experience sur drupal 8Retour d'experience sur drupal 8
Retour d'experience sur drupal 8
 
Trucs & astuces drupal
Trucs & astuces drupalTrucs & astuces drupal
Trucs & astuces drupal
 
Keynote drupagora 2015 7
Keynote drupagora 2015 7Keynote drupagora 2015 7
Keynote drupagora 2015 7
 
Cahier des charges avril 2015
Cahier des charges   avril 2015Cahier des charges   avril 2015
Cahier des charges avril 2015
 
Les 10 erreurs d'un projet web déc 2014
Les 10 erreurs d'un projet web   déc 2014Les 10 erreurs d'un projet web   déc 2014
Les 10 erreurs d'un projet web déc 2014
 
Conférence Gestion de projet digital
Conférence Gestion de projet digitalConférence Gestion de projet digital
Conférence Gestion de projet digital
 
Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...
Drupagora 2014 :  Reprendre un projet avec Drupal quand on a des centaines de...Drupagora 2014 :  Reprendre un projet avec Drupal quand on a des centaines de...
Drupagora 2014 : Reprendre un projet avec Drupal quand on a des centaines de...
 
Introduction à Drupal 8
Introduction à Drupal 8Introduction à Drupal 8
Introduction à Drupal 8
 
Reprise projet Drupal Drupagora2013
Reprise projet Drupal Drupagora2013Reprise projet Drupal Drupagora2013
Reprise projet Drupal Drupagora2013
 
Drupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atoutsDrupal Ecommerce - fonctionnalités et atouts
Drupal Ecommerce - fonctionnalités et atouts
 
Démonstration Drupal Commons !
Démonstration Drupal Commons ! Démonstration Drupal Commons !
Démonstration Drupal Commons !
 
Wordpress Ecommerce - Core-Techs
Wordpress Ecommerce - Core-TechsWordpress Ecommerce - Core-Techs
Wordpress Ecommerce - Core-Techs
 
Drupagora 2012 - Votre application cartographique avec Drupal
Drupagora 2012 - Votre application cartographique avec DrupalDrupagora 2012 - Votre application cartographique avec Drupal
Drupagora 2012 - Votre application cartographique avec Drupal
 
Drupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet DrupalDrupagora - Les clés de la réussite d'un projet Drupal
Drupagora - Les clés de la réussite d'un projet Drupal
 
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...
Drupal Commerce / Wordpress Commerce - Les nouvelles alternatives...
 
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...
Salon Solutions Linux 2012 - Etat de l'art sur les Frameworks et CMS Open Sou...
 
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.
Salon Solutions Linux 2012 - Etat de l'art des solutions E-commerce.
 
A chaque besoin sa distribution
A chaque besoin sa distributionA chaque besoin sa distribution
A chaque besoin sa distribution
 
Panorama des solutions Ecommerce pour Drupal
Panorama des solutions Ecommerce pour DrupalPanorama des solutions Ecommerce pour Drupal
Panorama des solutions Ecommerce pour Drupal
 

Webinar : Les enjeux du moteur de recherche

  • 1. 1 Les enjeux du moteur de recherche de votre site Web
  • 2. 2 Core-Techs – Nos métiers Formation & coaching ConseilIntégration, développement, expertise technique Web et UX design
  • 3. 3 Les solutions de search intégrées
  • 5. 5 Et souvent, pour trouver quelque chose sur votre site, ils utilisent ça : Google a ses limites dans bien des cas. Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le contexte du site Internet ou selon les besoins des utilisateurs. Il a une présentation générique pour tous les utilisateurs, sans prendre en compte les spécificités du site Web.
  • 6. 6 OBESITE DE L’INFORMATION Nous faisons face à une croissance exponentielle des contenus sur le Web. Face cette obésité de l’information, nous sommes tous différents dans notre recherche d’information. Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les mêmes démarches, pas les mêmes habitudes. La pertinence n’est pas la même pour tout le monde. Un même résultat peut satisfaire une personne, mais pas l’autre.
  • 7. 7 Visuel Big Data BIG DATA (données massives) Nous produisons un nombre incommensurable de données (personnelles, publiées sur le web ou non, …) . Toutes ces données sont stockées quelque part et tant qu’elles ne sont pas exploitées, elles ne servent à rien. Ici l’enjeu des moteurs de recherche est d’être capable d’analyser notre comportement sur le Web et ainsi d’identifier nos habitudes, nos besoins.
  • 8. 8 HETEROGENEÏTE DES SOLUTIONS • Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv, document, …. • Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie, documents multi-médoa… Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la labéliser, la rechercher…
  • 9. 9 BESOIN DE SENS Le travail principal du moteur est de donner du sens au contenu, au produit, aux dépendances entre les contenus; il va réduire le bruit, donner de la pertinence à une recherche, …
  • 10. 10 UN MOTEUR CA FAIT QUOI ?
  • 12. 12 Bases de données, sites web, référentiels documentaires, fichiers, données structurées, non structurées, … Transforme Restitue Expose Un moteur indexe, c’est-à-dire qu’il est capable de récupérer des contenus quel que soit leur format de stockage.
  • 14. 14 Indexe Transforme Facettes, suggestions, auto- complétion, aides à la recherche, … Expose Il restitue le contenu. Il peut proposer des alternatives, suggestions ou encore analyser une requête.
  • 15. 15 Indexe Transforme Restitue RDF, moissonnage, Sparql, open data, … Toutes les données doivent être capables de « parler » les unes aux autres. Le moteur doit donc enrichir ce qu’on appelle le web des données.
  • 16. 16 16/12 Un bon moteur indexe tout type de contenu
  • 17. 17 17/12 Un bon moteur propose différentes logiques d’autocomplétion
  • 18. 18 18/12 • Facettes de valeurs • Facettes de date • Facette par arbre / pivot • Facette par intervalle • Facette par catégorie / type Un bon moteur gère des facettes variables
  • 20. 20 Un bon moteur optimise la pertinence Optimisations linguistiques • Racinisation • Synonymie • Stop words • Orthographe Optimisations statistiques • Scoring et pondération • Text mining • Proximité
  • 21. 21 Un bon moteur suggère d’après le corpus
  • 23. 23 Moteur de recommandations & cross-content
  • 24. 24 Un outil de gestion de campagnes promotionnelles
  • 26. 26 Recherche multi- site, multi-source Le moteur de recherche est capable de parcourir toutes ces sources et de restituer les données via une seule interface.
  • 27. 27 Optimisation des performances La capacité technique du moteur à monter en charge et à répondre au volume de consultation, de réponse.
  • 28. 28 Un back-office de suivi statistique Utile afin de s’améliorer. On a accès au: • Nombre de requêtes, • Requêtes les plus fréquentes, • Requêtes n’ayant abouti à aucun résultat, • Temps moyen de réponse, • …
  • 29. 29 Un outil d’alignement des données CAPTER TRANSFORMER ENRICHIR ANALYSER
  • 30. 30 Un outil dédié au Web sémantique • Structuration RDF & URI • Mise à disposition de Sparql End Point • Intégration de thésaurus et d’ontologies • …
  • 31. 31 Nos recommandations pour réussir un projet de search RECHERCHER LA SIMPLICITE ! Quels sont les besoins métiers ? Quels sont les contenus et leur structuration ? Quelles sont les attentes utilisateur ? Travailler sur une logique itérative avec des utilisateurs métier Suivre les statistiques de fonctionnement
  • 32. 32

Notas del editor

  1. 1
  2. 2
  3. 3
  4. Google est LE moteur de recherche de référence. Il est réputé pour son efficacité, sa rapidité, l’exhaustivité des résultats… C’est pourquoi lorsque l’on pose la question: « Que souhaitez-vous comme moteur de recherche ? », la réponse est souvent « Google ».
  5. On remarque très souvent que les utilisateurs préfèrent utiliser Google plutôt que le moteur de recherche interne du site Internet, celui-ci étant trop lent ou inefficace. Cette méthode de recherche fonctionne, mais Google a ses limites dans bien des cas. Il ne propose pas de réponse personnalisée, adaptée ou pertinente selon le contexte du site Internet ou selon les besoins des utilisateurs. En effet, il a une présentation générique pour tous les utilisateurs, sans prendre en compte les spécificités du site Web.
  6. Aujourd’hui, nous sommes confrontés à une grande problématique: l’obésité de l’information. Nous faisons face à une croissance exponentielle des contenus sur le Web. Face cette obésité de l’information, nous sommes tous différents dans notre recherche d’information. Nous n’avons pas les mêmes méthodes (mots-clés, expressions…), pas les mêmes démarches, pas les mêmes habitudes. La pertinence n’est pas la même pour tout le monde. Un même résultat peut satisfaire une personne, mais pas l’autre.
  7. A l’obésité de l’information s’ajoute ce qu’on appelle le Big Data (données massives). Tous les jours, nous produisons un nombre incommensurable de données (personnelles, publiées sur le web ou non, …). Toutes ces données sont stockées quelque part et tant qu’elles ne sont pas exploitées, elles ne servent à rien. Ici l’enjeu des moteurs de recherche est d’être capable d’analyser notre comportement sur le Web et ainsi d’identifier nos habitudes, nos besoins.
  8. Hétérogénéité croissante des solutions: Hétérogénéité technique : bases de données, serveurs de fichiers, noSQL, RDF, .csv, document, …. Hétérogénéité de structure : gabarits, documents non structurés, thésaurus, taxonomie, documents multi-médoa… Au final, pour une même donnée, il y a plusieurs manières de la gérer, la stocker, la labéliser, la rechercher…
  9. Toutes ces problématiques, nous montrent qu’aujourd’hui dans notre univers Web, on a besoin de sens. C’est le travail principal du moteur, il est censé donner du sens au contenu, au produit, aux dépendances entre les contenus; il va réduire le bruit, donner de la pertinence à une recherche, …
  10. Un moteur a 4 principales fonctions: Il indexe, Il transforme, Il restitue, Il expose.
  11. Un moteur indexe, c’est-à-dire qu’il est capable de récupérer des contenus quel que soit leur format de stockage (contenu sur des bases de données, des GED, des serveurs de fichiers, des données structurées, non structurées).
  12. En indexant les données, le moteur va les transformer. Les données vont alors être : Structurées, Pondérées, Dédoublonnées, Matchées, Enrichies, …
  13. Un moteur de recherche est capable également de restituer le contenu. Il va proposer des résultats d’après des correspondances sémantiques, linguistiques, statistiques, mathématiques… Il peut proposer des alternatives, suggestions ou encore analyser une requête.
  14. Dernières fonctions du moteur, l’exposition. Aujourd’hui dans notre monde connecté, toutes les données doivent être capables de « parler » les unes aux autres. Le moteur doit donc enrichir ce qu’on appelle le web des données.
  15. Comme nous l’avons vu précédemment, un moteur de recherche doit pouvoir indexer des données quel que soit le format de stockage. Un bon moteur peut également indexer tout type de contenu.
  16. Un bon moteur de recherche propose une/des logique(s) d’autocomplétion: Suggestion triée, Suggestion d’après les requêtes les plus fréquentes, Suggestion d’après une logique de racinisation, Suggestion d’après des expressions rattachées, rajouter des indications et des explications, Suggestion de termes surpondérés, Mise en avant de suggestions de recherche. La logique d’autocomplétion est définie par rapport aux besoins de l’internaute sur le site. Ce n’est pas toujours évident, chaque moteur est différent. Il faut faire attention à proposer un nombre restreint de résultats, à mettre en avant les différences par rapport au contenu saisi (mise en gras) ou encore montrer l’historique de recherche avant que l’utilisateur ne commence à taper une requête. Les meilleurs moteurs d’autocomplétion actuellement sont ceux des sites e-commerce (Amazon).
  17. Là encore, lors du choix du moteur de recherche, il faut prêter attention à ce qu’est capable de faire le moteur. Tous les moteurs ne gèrent pas de la même manière les facettes.
  18. Un bon moteur de recherche gère le multilinguisme (analyseurs de langues). Souvent les moteurs Open Source ont une longueur d’avance grâce à leur communauté.
  19. Les optimisations linguistiques et statistiques sont à prendre en compte. Optimisations linguistiques (analyse de la langue): Racinisation (capacité du moteur à extraire la racine d’un terme et à diriger sa recherche à partir de cette racine), Synonymie (capacité du moteur à proposer des réponses avec le mot « auto » lorsqu’on a taper « voiture » par exemple), Stop words (capacité du moteur à éliminer les articles (le, la, les…)), Orthographe (capacité du moteur à gérer les fautes d’orthographe des utilisateurs). Optimisations statistiques: Scoring et pondération (Densité d’un mot par rapport à un document. Poids d’un mot en fonction de sa place dans le document) Text minding ou fouille de texte (on parle d’intelligence artificielle) = extrait des connaissances d’après l’analyse des contenus soumis au moteur. Text minding est beaucoup utilisé dans les moteurs de spam. Proximité (capacité du moteur à trouver la similarité entre 2 termes. Correspondance d’expression).
  20. Grâce à l’analyse linguistique vu précédemment, le moteur de recherche va suggérer des mots-clés ou expressions. Exemple: on tape « recette gâteau framboise », le moteur va afficher les résultats et proposer des suggestions associées « recette glace framboise »… On peut gérer, personnaliser les réponses selon le corpus du texte ou selon le comportement des internautes.
  21. Un bon moteur va mettre en avant la recherche et extraire la phrase recherchée (highlight).
  22. Le moteur de recherche ne sert pas seulement à donner des résultats de recherche. Un moteur de recommandations va enrichir le « surf » de l’internaute. Il peut ainsi constituer les zones de rebond. Par exemple, vous êtes sur un article de réalité virtuelle, dans la colonne de gauche se trouvera des suggestions associées à votre recherche initiale sous forme de « pour en savoir plus », « pour approfondir »... Le moteur aura généré automatiquement des articles en fonction de l’analyse sémantique, lexical du contenu que vous êtes en train de lire. Lorsque l’on a un site avec beaucoup de contenu, un moteur de recommandations / cross-content est particulièrement intéressant. Cela permet de s’éviter un travail fastidieux de catégorisation. Il est également possible de gérer ces suggestions: proposer le contenu le plus pertinent, le plus récent…, adapter le contenu selon l’historique de recherche, proposer des contenus promotionnels (e-commerce), …
  23. Un bon moteur de recherche vous permet de gérer les campagnes promotionnelles. Cela est très utile pour les sites e-commerce, mais aussi pour les sites avec beaucoup de contenu. Dans l’exemple, ci-dessus, lorsque l’on tape « Samsung Galaxy S6 », le moteur a mis automatiquement en avant la bannière promotionnelle « Accessoires Samsung Galaxy S6 ». La Fnac a paramétré son moteur pour que celui-ci affiche cette bannière promotionnelle à chaque recherche de Galaxy S6. Cela permet de répondre au besoin de déstockage, d’orienter la navigation…
  24. Un bon moteur peut faire une recherche géospatiale. Lorsque l’on entre une adresse, celle-ci va être géoréférencée (ou transformée en coordonnées) et être localisée sur une carte. Ce besoin de géolocalisation est un point essentiel depuis quelques années surtout pour les applications mobiles. Elle est utile pour les approximations (recherche de la station service la plus proche…).
  25. Si on a un parc de plusieurs sites, un bon moteur de recherche est capable de parcourir toutes ces sources et de restituer les données via une seule interface. Le moteur fait donc le pont entre chacune des applications.
  26. Un bon moteur est capable d’optimiser ses performances. Un moteur de recherche qui mettra trop de temps à donner un résultat à l’internaute fera perdre des visiteurs, des commandes… Il sera donc capable de gérer les temps d’indexation (à chaud, incrémentale), réindexation, d’optimiser les temps de réponse. Il faut prêter attention aux capacités technique du moteur à monter en charge et à répondre à mon volume de consultation, de réponse actuel.
  27. Un bon moteur vous fournit un back-office de suivi statistique. Les back-office sont minimalistes dans les moteurs traditionnellement implantés. C’est pourtant utile afin de s’améliorer. On a accès au: Nombre de requêtes, Requêtes les plus fréquentes, Requêtes n’ayant abouti à aucun résultat, Temps moyen de réponse, …
  28. Comme vu précédemment, un moteur de recherche a beaucoup de fonctions. C’est aussi un outil d’alignement des données. Il permet de: Récupérer les données contenues dans les différents silos internes ou externes à votre organisation : XML, crawl web, serveurs de fichiers, entrepôts, GED, CMS, … Transformer ces données : nettoyage, normalisation, conversion vers un format cible ; validation, transformation, fusion, découpage, dédoublonage, normalisation de champs (numéros de tél, noms, codes, …) anonymisation, … Enrichir ces données en les catégorisant selon des plans de classement, en les annotant automatiquement et en les alignant avec des référentiels métier ; en les mettant en relation avec des données métiers par analyse sémantique Analyser et relier ces données afin de les mettre en synergie et de faire émerger l’information pertinente pour votre métier ;
  29. Un bon moteur de recherche va être capable d’ouvrir vos données vers l’extérieur. C’est ce qu’on appelle le Web des données, le Web 3.0, le Web sémantique. Le moteur peut structurer les données pour les exposer dans un format universel (RDF). Les identifier avec une URI (adresse unique, non modifiable et pérenne dans le temps). Il va mettre à disposition ces données (Sparql End Point) et les catégoriser, classifier, afin de donner du sens à l’information.
  30. Lorsqu’on se lance dans un projet de moteur de recherche, souvent les besoins initiaux sont mal exprimés, car on n’est pas connaisseur du domaine. Il faut se poser des questions : Quels sont les besoins métier ? (grand public ou recherche spécialisée), Quels sont les contenus et leur structuration ? (très structuré ou non ), Quelles sont les attentes des utilisateurs ? (besoin Google ou plus spécifique). Les suivis statistiques et les retours des utilisateurs permettent d’optimiser la pertinence du moteur de recherche.
  31. 32