SlideShare una empresa de Scribd logo
1 de 30
Descargar para leer sin conexión
www.infodocenligne.wordpress.com
01/03/2013
Dossier thématique
Les moteurs de
recherche
d’entreprise
Aurélie Gilabert
Dossier réalisé par Aurélie Gilabert
Mars 2013
www.infodocenligne.wordpress.com
Ce document est mis à disposition selon les termes de la Licence Creative Commons
Attribution - Pas d’Utilisation Commerciale - Pas de Modification 3.0 non transposé.
INTRODUCTION 1
PREMIERE PARTIE – UN MOTEUR DE RECHERCHE D’ENTREPRISE, QU’EST-CE QUE
C’EST ? 2
Moteur de recherche : de quoi parle-t-on ? 2
Moteur de recherche web ou entreprise : quelles différences ? 8
DEUXIEME PARTIE – UN MOTEUR DE RECHERCHE D’ENTREPRISE POUR QUOI
FAIRE ? 10
Quel est l’intérêt d’utiliser un moteur de recherche dans l’entreprise ? 10
Quels sont les usages possibles d’un moteur de recherche d’entreprise ? 13
MOTEUR DE RECHERCHE D’ENTREPRISE, COMMENT CHOISIR ? 16
Les questions à se poser avant de choisir un moteur de recherche 16
Panorama de l’offre 20
POUR CONCLURE 25
SOURCES 26
1
Introduction
Voici un dossier consacré à la recherche d’information en entreprise, une notion aussi appelée
enterprise search ou business search, avec ses outils dédiés : les moteurs de recherche d’entreprise.
Pourquoi un tel sujet ? Car ce sont des outils de plus en plus adoptés par les entreprises et qui
présentent de réels intérêts pour la gestion de l’information.
J’ai d’ailleurs rencontré plusieurs cas d’entreprises qui souhaitaient mettre en place un moteur de
recherche interne.
En octobre 2012, l’ADBS a organisé une formation intitulée « Mettre en place un moteur de
recherche d’entreprise », qui est reconduite pour l’année 2013. L’ADBS, toujours, a aussi organisé à
Lyon une journée d’étude, en partenariat avec Collaboratif Info, sur le thème : « Le moteur de
recherche interne, élément clé de l’accès à l’information dans l’entreprise ». Cet intitulé reflète bien
la principale fonction des moteurs de recherche d’entreprise.
Ce sont des outils qui ont toute leur place dans la stratégie de gestion et d’accès à l’information
d’une entreprise ou d’une organisation. Dans un univers informationnel en croissance exponentielle,
il est nécessaire de mettre en place des outils pour s’y retrouver. Les moteurs de recherche
d’entreprise permettent de répondre à ce besoin et de faire plus encore.
Ce dossier est construit autour de trois axes, répondant aux questions : quoi, pourquoi et comment.
 Qu’est-ce qu’un moteur de recherche d’entreprise ? Comment le définir ? Comment
fonctionne-t-il ?
 Qu’est-ce que l’utilisation d’un moteur de recherche peut apporter à l’entreprise ?
 Comment choisir un moteur de recherche ? Quelles sont les questions à se poser ? Quels
sont les critères de choix ?
Les objectifs de ce dossier sont :
 De fournir une première approche des moteurs de recherche d’entreprise à ceux qui veulent
en savoir plus sur le sujet,
 De montrer l’intérêt qu’il peut y avoir à utiliser ces outils,
 De fournir des pistes pour les personnes qui souhaiteraient mettre en place un moteur de
recherche d’entreprise.
2
Première partie – Un moteur de recherche d’entreprise, qu’est-ce que
c’est ?
Pour bien comprendre les enjeux des moteurs de recherche d’entreprise commençons par définir de
quoi il s’agit et comment ils fonctionnent. Attardons-nous ensuite sur ses particularités.
Moteur de recherche : de quoi parle-t-on ?
Avant de définir un moteur de recherche d’entreprise,
commençons par définir ce qu’est un moteur de recherche en
général, ainsi que son principe de fonctionnement.
La principale fonction d’un moteur de recherche est de signaler
l’existence et la localisation de ressources répondant à la
demande de l’utilisateur – demande formulée via des mots-clés
choisis librement.
Sur le site de l’ADBS, on trouve la définition suivante1
:
« Robot de recherche : logiciel permettant la construction automatique d’index de mots contenus
dans les pages d’informations sur des sites web ou autres ressources sur l’internet et leur
interrogation à travers des interfaces dédiées ; la construction automatique d’un index suppose un
module de collecte automatique des données qui opère sur les sites serveurs (spider ou crawler) et
un module d’indexation qui construit automatiquement l’index à partir des résultats de l’étape
précédente ; l’interrogation suppose un module de recherche spécifique sur les index ainsi créés
(moteur de recherche). »
Pour sa part, l’Encyclopédie Wikipédia2
définit un moteur de recherche comme :
« Une application web permettant de retrouver des ressources (pages web, articles de forums
Usenet, images, vidéos, fichiers, etc.) associées à des mots quelconques. Certains sites offrent un
moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site
lui-même. »
Comme le montre la définition de l’ADBS, un moteur de recherche est composé de trois éléments
essentiels. Ces trois éléments correspondent aux trois étapes du fonctionnement d’un moteur de
recherche.
 Un module de collecte automatique des informations (appelé aussi crawler ou spider)
 Un module d’indexation
 Un module de classement automatisé des informations
1
http://www.adbs.fr/robot-de-recherche-18537.htm?RH=OUTILS_VOC
2
http://fr.wikipedia.org/wiki/Moteur_de_recherche
3
Les trois étapes de fonctionnement d’un moteur de recherche
Le robot crawler parcourt tous les contenus qui doivent être indexés par le moteur de recherche. Il
« lit » les informations contenues dans les ressources, en extrait les plus importantes et les stocke sur
des serveurs afin de s’en servir pour constituer un index.
Le module d’indexation permet l’indexation automatique du contenu récolté à l’étape précédente.
Selon le Dictionnaire de l’information publié aux éditions Armand Colin, la forme basique de
l’indexation automatique « est le traitement du texte intégral (full text) et la constitution de fichiers
inversés par élimination des mots vides et sélection de toutes les chaînes de caractères situées entre
deux séparateurs. »
Le moteur de recherche construit deux index :
 Un index contenant le corpus d’informations capturées par le robot crawler ;
 Un index inversé contenant la liste de tous les mots-clés relevés lors de l’indexation et
associé aux ressources qui les contiennent avec leur adresse.
C’est cet index inversé que le moteur de recherche interroge lors d’une requête. Grâce à lui, il n’a pas
à parcourir tous les documents indexés pour déterminer lesquels sont intéressants. C’est ce qui lui
permet de faire remonter des résultats en quelques millièmes de secondes3
.
On constate d’ailleurs qu’il est plus rapide de faire une recherche dans un corpus aussi étendu que le
web que de faire une recherche dans un document PDF assez long, qui lui ne dispose pas d’index.
3
http://www.christian-faure.net/2006/09/23/quelques-vidences-sur-le-moteur-de-recherche/
4
Le classement des résultats identifiés lors d’une requête se fait grâce au module de classement.
Pour les moteurs de recherche sur le web, c’est
lors de cette étape que se joue la concurrence.
L’algorithme de classement est ce qui fait la
différence entre les différents moteurs de
recherche. En effet, un moteur de recherche qui
ne fait pas remonter des résultats pertinents pour
l’utilisateur en haut de liste ne va pas être utilisé
bien longtemps.
Pour classer ses contenus, le moteur de
recherche se base sur la fréquence des mots-clés
et sur leur répartition dans le document. Cela permet de faire des calculs de pondération et de
mesurer l’importance d’un mot par rapport à son poids dans l’ensemble de la ressource. Plus un mot-
clé est présent, plus il est important. Et la place du mot joue aussi : un mot présent dans le titre est
plus important que s’il se trouve dans le corps du texte. C’est ce que l’on appelle le tri par pertinence
et c’est la base du classement automatisé de documents.
Mais cette méthode montre des limites et il est facile de la détourner. Les moteurs de recherche ont
donc cherché d’autres moyens pour classer leurs résultats.
Le tri par popularité prend en compte la valeur des liens hypertextes pointant vers la page
considérée. C’est sur cette méthode qu’est basé le PageRank de Google.
Le tri par mesure d’audience se base sur le nombre d’internautes qui ont visité la page et sur le
temps qu’ils y ont passé. Plus le nombre d’internaute ayant visité une page est élevé et plus ils y ont
passé de temps, plus cette page sera placée haut par rapport à une autre avec les mêmes mots-clés.
Il existe plusieurs catégories de moteurs de recherche. Leurs principales différences tiennent surtout
au périmètre dans lequel la recherche est effectuée. Mais le fonctionnement en trois étapes4
(crawl,
indexation, classement) est le même pour tous.
On trouve plusieurs grands types de moteurs de recherche :
 Les moteurs de recherche sur internet qui permettent d’interroger le web avec pour le plus
connu d’entre eux Google. Citons aussi Bing, Duckduckgo ou Ixquick Search.
4
http://www.google.com/insidesearch/howsearchworks/thestory/
5
 Les moteurs de recherche internes à un site web, comme par exemple ceux permettant de
trouver un produit sur un site marchand. C’est une catégorie de moteur de recherche
d’entreprise mais tourné vers l’extérieur.
Capture d’écran du site Fnac.com et utilisation de son moteur de recherche
 Les moteurs de recherche installés sur un ordinateur personnel (desktop search5
) qui
permettent de rechercher en local sur l’ordinateur comme Copernic Desktop Search ou
Spolight sous MacOS.
5
http://jean-ferre.blogspot.fr/2009/02/desktop-search-et-moteur-de-recherche.html
6
 Les moteurs de recherche intégrés dans des logiciels comme les CRM, les GED ou autres
applications métiers.
Interface de recherche avancée du système de gestion de contenu Alfresco
 Les moteurs de recherche d’entreprise proprement dit. Ce sont ces derniers qui nous
intéressent ici.
Les moteurs de recherche d’entreprise sont des outils qui indexent les contenus situés dans plusieurs
entrepôts d’informations de l’entreprise (c’est-à-dire les serveurs et applications où sont stockées les
données).
Leur fonctionnement est le même que celui décrit précédemment pour les moteurs web, mais il
rajoute un élément en plus : les connecteurs6
. Il s’agit d’un adaptateur qui va permettre au moteur
de recherche de se connecter aux différentes sources d’information à indexer pour aller les crawler.
Ces informations sont ensuite mises en communs et des traitements peuvent leur être appliqués
(enrichissement sémantique, mise en relation de données, repérage des doublons…). La recherche
s’effectue via une interface qui ressemble de plus en plus à celles des moteurs web.
6
http://www.christian-faure.net/2006/09/10/choisir-un-moteur-de-recherche-pour-lentreprise/
7
Schéma représentant le fonctionnement d’un moteur de recherche d’entreprise
Un moteur de recherche d’entreprise ne fonctionne donc pas tout à fait pareil qu’un moteur de
recherche sur le web. Il s’adapte aux spécificités du contexte dans lequel il s’inscrit. En effet, les
problématiques de recherche en entreprise ne sont pas les mêmes que sur le web.
CONNECTEURS
Indexation et traitement des données
Présentation des résultats
Interface utilisateur
8
Moteur de recherche web ou entreprise : quelles différences ?
Les paragraphes suivant s’inspirent notamment de l’article d’Eric Debonne, Moteur de recherche
Internet versus Entreprise7
.
Volumétrie et sélection de l’information
Même si les volumes d’information produits par les entreprises ont une croissance exponentielle, ils
sont encore loin d’atteindre ceux du web.
Sur la toile, les moteurs de recherche procèdent à une sélection des pages qu’ils indexent, alors que
dans l’entreprise tous les documents doivent être indexés. A part quelques documents exclus pour
des raisons de confidentialité ou des documents privés par exemple, les utilisateurs doivent pouvoir
retrouver tout document intégré dans le système d’information via le moteur de recherche.
Sécurité et droit d’accès
Sur le web, les documents sont publics et tout document indexé peut être consulté par n’importe
quel internaute. Dans l’entreprise, l’accès aux documents est soumis à des droits. Le moteur de
recherche doit intégrer ces règles de sécurité afin de ne pas permettre à un utilisateur d’accéder à un
document qu’il n’a pas le droit de consulter.
Hétérogénéité de l’information
Les documents indexés sur le web sont
généralement au format HTML ou à la rigueur
dans des formats bureautiques classiques
(format traitement de texte, PDF…). Dans
l’entreprise, le moteur de recherche doit être
capable d’indexer de nombreux formats
différents, dont certains provenant
d’applications métier spécifiques.
Métadonnées
Sur le web, les moteurs de recherche
accordent peu d’importance aux métadonnées et privilégient plutôt le contenu des pages. Or, dans
l’entreprise ces métadonnées sont porteuses d’informations essentielles (auteur, date de création,
type de document, langue…). Il est important que le moteur les indexe et les traite pour faciliter la
recherche de l’utilisateur. De plus, dans le cas de certains formats de documents pour lesquels l’outil
ne peut pas indexer le contenu (fichiers son ou vidéo, formats propriétaires fermés), les
métadonnées sont les seuls éléments sur lesquels l’outil peut s’appuyer lors d’une recherche.
7
http://www.solaci.com/blog/2007/11/moteur-de-recherche-internet-versus.html
9
Pertinence de la recherche
Sur le web, la pertinence des documents est en grande partie fondée sur les liens qui pointent vers
une page. Ce système ne peut pas être reproduit en entreprise pour la bonne et simple raison que les
documents de l’entreprise ne sont pas reliés entre eux par des liens hypertexte. Le calcul de la
pertinence d’un document sera plutôt basé sur les occurrences de mots, leur place et leur poids dans
le document. Par ailleurs, dans l’entreprise, l’administrateur de l’outil de recherche peut influer
manuellement sur la pertinence en donnant plus d’importance à certains critères afin d’offrir aux
utilisateurs des résultats plus pertinents selon le contexte.
Avec cette comparaison, on voit bien que la recherche sur le web et la recherche en entreprise, bien
qu’ayant des points communs, ont des problématiques différentes.
Si, pour le web, tout le monde voit clairement quels peuvent être les avantages d’un moteur de
recherche pour trouver des informations, cette utilité apparaît moins clairement pour les moteurs
d’entreprise.
Pourquoi utiliser un moteur de recherche dans le système d’information de l’entreprise ? C’est à
cette question que la deuxième partie de ce dossier va s’efforcer de répondre.
10
Deuxième partie – Un moteur de recherche d’entreprise pour quoi
faire ?
A quoi peut bien servir un moteur de recherche dans une entreprise ? Pour répondre à cette
question, nous allons d’abord voir les avantages que peut apporter un moteur de recherche
d’entreprise, puis nous regarderons les différents usages qu’il peut en être fait un peu plus en détail
avec des scénarii d’utilisation.
Quel est l’intérêt d’utiliser un moteur de recherche dans l’entreprise ?
La fonction de recherche sur un ordinateur personnel est rarement utilisée. D’une part, parce que le
volume d’information qui y est stocké est relativement peu important et, d’autre part, parce que
l’utilisateur de l’ordinateur sait généralement où il a rangé tel document et sait s’y retrouver dans
son organisation, aussi obscure soit-elle pour un tiers.
En entreprise la situation est différente.
Les salariés savent généralement où sont rangés les documents qu’ils ont produits, les informations
avec lesquelles ils travaillent tous les jours. Mais pour le reste c’est un peu plus compliqué.
Imaginons. Votre collègue a créé un document pour la réunion de vendredi prochain que vous voulez
lire. Vous savez qu’il est stocké sur le serveur de fichiers partagé de l’entreprise mais vous ne savez
pas où précisément et votre collègue n’utilise pas le même système de classement que vous. Suivant
le nombre de fichiers, de dossiers et sous-dossiers sur ce serveur, vous pouvez perdre pas mal de
temps à retrouver ce document.
Il y a quelques années, pour tenter d’organiser ce fouillis de document que peut devenir un serveur
partagé, on mettait en place le plus souvent une GED (Gestion Electronique de Documents), qui
disposait de son propre moteur de recherche interne. Certes, cette méthode présente des avantages
comme celui de mettre en place des règles de gestion des documents, de leur adjoindre des
métadonnées (si tout le monde prend le temps de les renseigner). Mais c’est une solution lourde à
mettre en place et à utiliser. Se doter d’une GED juste pour bénéficier de ses fonctions de recherche
de document est un peu disproportionné. De plus, la recherche ne porte que sur les documents
rentrés dans la GED et ne prend pas en compte d’autres entrepôts d’information.
11
Par exemple, les boîtes mails contiennent souvent des informations importantes (dans les courriels
et les pièces jointes) mais dont le volume est important et qui sont donc parfois difficile à trouver.
Certains ont essayé de quantifier le temps passé par un salarié à rechercher une information ou un
document dans le système d’information de son entreprise. Même si ces chiffres sont assez imprécis,
cela permet de se faire une idée du temps que cette tâche peut prendre et de l’intérêt de bénéficier
d’outils adaptés. Selon les sources, nous passons entre 20 et 30% de notre temps de travail à
chercher des documents ou des informations.
Cela peut être d’autant plus inacceptable pour les salariés que, sur le web, ils disposent d’outils
puissants, rapides et relativement efficaces pour trouver des informations. L’utilisation des moteurs
de recherche pour trouver ou consulter quelque chose sur le web est devenue un automatisme. Les
internautes ne retiennent plus les adresses URL, n’utilisent plus énormément les favoris, ils se
contentent de taper le nom du site dans la barre de recherche de leur moteur préféré. Il est donc
normal qu’ils souhaitent retrouver le même système et la même simplicité quand ils cherchent une
information interne à l’entreprise.
Il est donc légitime qu’ils se posent la question : « Pourquoi ne peut-on pas avoir la même chose que
Google pour rechercher des informations et documents dans l’entreprise ? »
Même si rechercher sur le web et rechercher dans l’entreprise ne sont pas tout à fait les mêmes
choses, un moteur de recherche d’entreprise peut effectivement résoudre ce problème d’accès à
l’information. (Voir dans la première partie Moteur de recherche web ou entreprise : quelles
différentes ?)
Les moteurs de recherche permettent d’accéder plus facilement aux documents et informations mais
ils permettent aussi de les trier plus facilement. Même si les salariés sont censés les éviter, de
nombreux doublons existent. Il n’est pas rare de trouver plusieurs versions de travail rangées au
même endroit ou plusieurs documents identiques disséminés dans plusieurs entrepôts de stockage.
Le moteur de recherche permet de visualiser ces doublons. Il permet aussi de les trier. En effet, le
moteur de recherche, en plus du contenu du document, indexe aussi ses métadonnées (date de
création, auteur…). Cela permet de faire le tri plus facilement et d’éviter d’ouvrir chaque document
pour vérifier lequel est le bon.
Le moteur de recherche permet donc de retrouver des
informations si on ne sait pas où elles sont rangées. Mais
il permet aussi d’accéder plus facilement aux documents
dont on connaît l’emplacement. Plutôt que de devoir
ouvrir cinq ou six sous-dossiers avant de pouvoir accéder
au document que l’on désire, il est plus rapide d’ouvrir le
moteur de recherche, de taper sa demande et d’accéder
au document directement depuis l’interface de résultats.
12
Aujourd’hui, le système d’information de l’entreprise comprend plusieurs entrepôts de stockage : le
ou les serveurs de fichiers partagés, le serveur de messagerie, des applications métiers spécifiques,
des bases de données…
Un moteur de recherche permet un accès unique à tous ces éléments du système d’information de
l’entreprise. C’est un des principaux enjeux de ces outils à l’heure actuelle.
D’ailleurs, plutôt que de parler de recherche d’information, certains préfèrent parler d’Accès Unifié à
l’Information (en anglais UIA pour Unified Information Access). L’accès unifié à l’information vise à
améliorer l’efficacité, la pertinence et la catégorisation de l’information lors des requêtes émises au
sein d’une organisation.
En plus d’un accès unique, les moteurs de recherche permettent aussi de mutualiser toutes ces
informations. « Sortir l’information des silos » est une expression que l’on entend souvent à propos
des moteurs de recherche. Il s’agit de retrouver automatiquement des liens entre les différentes
informations stockées dans différents conteneurs.
Voici un exemple de mise en relation d’information : je fais
une recherche sur un client de mon entreprise en tapant
son nom. Bien sûr le moteur de recherche me remonte tous
les documents qui portent son nom. Mais ce client est aussi
identifié sous un numéro client dans d’autres documents. Le
moteur de recherche, qui a repéré la correspondance entre
le nom et ce numéro client dans une base de données me
remonte aussi les documents où apparaît le numéro de ce
client.
Les moteurs de recherche mettent donc en relation des données structurées et des données non
structurées et peuvent leur donner du sens et même de les analyser pour en tirer ensuite des
tableaux de bord ou des graphiques.
Les données structurées sont des données organisées selon une structure qui facilite leur traitement
automatique. Elles sont contenues entre autre dans les bases de données relationnelles. Les données
structurées ne sont pas forcément accessibles aux humains.
Les données non structurées sont les données provenant de documents texte, d’images, de sons…
Elles peuvent être facilement analysées par des humains mais les machines ont du mal à les traiter.
On constate donc qu’un moteur de recherche permet bien plus de choses que simplement indiquer
où se trouvent informations et documents.
13
Quels sont les usages possibles d’un moteur de recherche d’entreprise ?
La principale fonctionnalité d’un moteur de recherche est de permettre de retrouver de
l’information. Mais ils peuvent faire plus que cela. Suivant la stratégie dans laquelle ils s’intègrent et
suivant les fonctionnalités déployées, ils peuvent permettre de mettre en place différents scénarii
d’utilisation.
Rechercher de l’information
L’utilisation la plus simple d’un moteur de recherche est de permettre de retrouver facilement et
rapidement des informations dans un espace de stockage unique. Il s’agit de mettre en place un outil
pour rechercher sur le serveur partagé de l’entreprise. C’est assez
rapide et facile à mettre en œuvre.
Dans le cas où plusieurs sources de données différentes doivent être
indexées par le moteur, il faut s’assurer que l’on dispose bien des
connecteurs nécessaires.
Mettre en relation et enrichir les données
Le projet est un cran au-dessus s’il s’agit de mettre en relation des données contenues dans
différents entrepôts de stockage et de leur donner du sens les unes par rapports aux autres.
Pour enrichir les données indexées, les moteurs de recherche se basent sur des vocabulaires métiers,
des listes d’autorités, des thésaurus et autres référentiels terminologiques préexistants.
Ces vocabulaires sont une aide à la recherche. L’utilisateur effectue sa recherche en langage naturel
comme il en a l’habitude et l’outil réalise une correspondance avec les termes du vocabulaire pour
ressortir les résultats correspondants.
Ils permettent aussi d’établir des correspondances entres les données. J’ai cité un peu plus haut
l’exemple de la mise en relation du nom du client et de son numéro d’identification. Les moteurs de
recherche peuvent aussi établir des liens entre les concepts contenus dans les documents du
moment que ces liens sont représentés dans les thésaurus et autres vocabulaires.
Ils peuvent simplement servir à relier des acronymes avec leur forme développée. Par exemple, si
j’indique au moteur de recherche que MSI veut dire management des systèmes d’information, que je
tape comme requête une forme ou l’autre, il me remontera indifféremment les documents où figure
l’un ou l’autre des termes.
Plus élaboré : mon référentiel terminologique indique au moteur de recherche que le concept de
bassin de vie est lié au concept bassin d’emploi. Si je fais une recherche pour remonter les
documents traitant du concept de bassin de vie, l’outil est alors en mesure de me suggérer des
documents parlant de bassin d’emploi.
Pour ces deux exemples, si l’outil n’avais pas été en mesure d’établir des liens, il aurait fallu que je
fasse deux recherches, pour autant qu’au préalable j’ai moi-même fait ces liens.
14
L’analyse sémantique, qui est de plus en plus intégrée à la recherche d’information, permet aussi
d’enrichir les données et de faire remonter des résultats plus précis. Elle se base sur des cartouches
de connaissances qui répertorient les principaux concepts d’un domaine de connaissance et les
relations qu’il y a entre eux. Cela permet de donner au moteur de recherche les clés pour
comprendre les documents, leur donner du sens et ainsi améliorer la recherche.
Surveiller son environnement
Les moteurs de recherche d’entreprise peuvent également être utilisés pour faire de la veille.
Pour la veille, on pense surtout que les informations recherchées se trouvent en dehors de
l’entreprise. Mais pas seulement. Eric Debonne estime que 50% de l’information utile à la veille est
déjà disponible dans l’entreprise8
. On voit donc que faire de la veille c’est aussi explorer les sources
de données de l’entreprise, tâche pour laquelle le moteur de recherche interne est tout à fait
indiqué.
Par ailleurs, certains moteurs de recherche offrent des services pour accéder à l’information en mode
push, où l’information est transmise à l’utilisateur sous forme d’alerte automatique, sans qu’il ait
besoin d’effectuer la requête. C’est par exemple le cas du moteur Polyspot qui propose de se créer
des alertes mails pour une ou plusieurs requêtes. Cela permet vous permet d’être alerté
automatiquement si un de vos collègue fait rentrer de nouvelles informations sur votre sujet de veille
dans le système d’information de l’entreprise.
Prendre des décisions
Un autre domaine où un moteur de recherche a une carte à jouer est la Business Intelligence ou
informatique décisionnelle.
La Business Intelligence permet l’aide à la décision9
. Il s’agit d’analyser, à l’aide de solutions
informatiques, de gros volumes de données afin d’en dégager des informations nouvelles sur
lesquelles les décideurs peuvent s’appuyer pour prendre des décisions.
8
Eric Debonne, « Solutions dans la course à l’innovation » in Veille et recherche d’information sur le web –
Guide pratique Archimag n°37, 2009.
9
http://www.christian-faure.net/2007/06/07/quand-le-search-bouscule-la-bi/
15
Les outils décisionnels regroupent les différentes sources de données de l’entreprise dans un
« datawarehouse » afin de pouvoir y appliquer des traitements automatiques qui permettent ensuite
de ressortir ces informations sous forme de rapports ou de graphiques ou autres outils de reporting.
Les outils de Business Intelligence présentent plusieurs inconvénients :
 Ils ont tendance à ne prendre en compte que les données structurées, alors que les données
non structurées peuvent être plus nombreuses en volume et contenir également des
informations intéressantes ;
 Ils sont lourds à mettre en place ;
 Ils nécessitent une phase d’apprentissage importante du fait des nombreux paramètres à
prendre en compte dans la génération des rapports.
Les moteurs de recherches sont prévus pour traiter des volumes de données de plus en plus
importants. Mais ils ne sont pas seulement capables de ressortir des listes de résultats à partir d’une
requête. Ils peuvent aussi analyser ces données et en ressortir des représentations.
Par rapports aux outils de Business Intelligence traditionnels, ils présentent les avantages de prendre
en compte les données non structurées et d’être facilement pris en main par les utilisateurs, grâce à
leur interface simplifiée et intuitive.
Même s’ils s’avèrent moins puissants que les outils dédiés10
Business Intelligence, ils sont de bons
compléments à ces types d’outils et permettent de valoriser les informations de l’entreprise.
Les moteurs de recherche d’Exalead et Sinequa proposent entre autres des fonctionnalités d’analyse
de données de type décisionnel.
10
http://www.cio-online.com/contributions/lire-le-moteur-de-recherche-d-entreprise-quelles-cibles-320.html
16
Moteur de recherche d’entreprise, comment choisir ?
Il existe des dizaines de moteurs de recherche d’entreprise. A première vue ce n’est pas toujours
facile de déterminer l’outil qui nous conviendra le mieux. C’est pourtant un choix important à faire si
on veut que l’outil soit utilisé. Et ce d’autant plus que l’on acquiert généralement un moteur de
recherche pour plusieurs années.
Les questions à se poser avant de choisir un moteur de recherche
Voici un éventail des questions à se poser avant de choisir un moteur de recherche d’entreprise et
des points à examiner. Bien sûr ces éléments sont génériques. Ils peuvent être complétés ou adaptés
suivant le contexte.
L’identification des besoins
La première chose à faire est de se poser les questions : Qu’est-ce que je veux faire avec un moteur
de recherche d’entreprise ? Pourquoi en ai-je besoin ? (Il faut d’ailleurs se poser ces questions pour
toute mise en place d’un nouvel outil informatique.)
Les scénarii d’utilisations dans la partie précédente peuvent aider à clarifier certains besoins.
Impliquer les futurs utilisateurs en leur demandant de formaliser leurs besoins, comment ils
voudraient pouvoir avoir accès à l’information peut être très intéressant. Cela peut permettre de
mettre à jour des besoins auxquels personne n’avait pensé. Et les impliquer les rendra plus intéressés
lorsque l’outil sera disponible.
Une fois que l’on a cerné ses besoins, cela aide à choisir le type d’outil que l’on souhaite et les
fonctionnalités nécessaires. Ce n’est pas la peine d’acheter un outil qui permet de créer des
applications de recherche si on a seulement besoin de retrouver des documents dans un serveur de
fichiers.
17
Faire l’inventaire des informations à indexer
Il s’agit principalement de :
 Savoir où les informations sont stockées : sur des serveurs de fichiers, dans des bases de
données, dans des applications métiers, sur le web…
 Déterminer leur volumétrie. Combien de giga ou de terra octets ces informations
représentent-elles ? Dans certains cas, cela peut avoir un impact sur le prix de la solution.
C’est également utile pour déterminer les caractéristiques techniques de l’infrastructure de
recherche à mettre en place.
 Connaître les caractéristiques de ces informations. Quels sont les formats (.doc, .htm, .ppt,
.pptx, .docx, .xls, .xlsx, .odt, .psd, .indd, .ai…) ? Suivant les formats, les moteurs de recherche
peuvent en indexer le contenu. Pour les documents bureautiques ou html, les moteurs de
recherche peuvent généralement en indexer le contenu plein texte. Pour d’autres formats
propriétaires, comme ceux de la suite Adobe Créative par exemple, c’est plus compliqué et
les moteurs de recherche ne peuvent généralement pas indexer le contenu du document.
Dans ce cas, il faut se tourner vers les métadonnées. Quelles sont les métadonnées
disponibles ? Est-il pertinent de toutes les indexer ?
 Se poser la question de la structuration des données et informations. Cela joue-t-il un rôle
dans la recherche ? Les données sont-elles à mettre en relations les unes avec les autres ?
Sont-elles à enrichir ? Si oui, existe-t-il déjà un ou plusieurs vocabulaires d’autorité ?
Comment est-il possible de les intégrer dans l’outil ?
Le multilinguisme
Si les informations à indexer sont en différentes langues, il est intéressant de voir comment le
moteur traite la question du multilinguisme.
Le moteur de recherche est-il capable de différencier les langues des documents (dans le contenu ou
les métadonnées) ? La plupart des moteurs de recherche d’entreprise en sont capables.
La langue du document peut-elle être un critère de recherche ?
Pour une requête en français le moteur de recherche est-il capable de faire remonter des
informations correspondantes en anglais par exemple ?
Les connecteurs disponibles
Pour rappel, les connecteurs permettent au moteur de recherche de se brancher sur les différentes
sources d’information à indexer. Les éditeurs disposent généralement d’un catalogue standard de
connecteurs pour les sources les plus courantes (serveurs de fichiers, SharePoint, Lotus Note…). Plus
le catalogue de connecteurs est étendu, plus il y a de chances pour que ceux correspondants à vos
applications soient disponibles. Il faut néanmoins s’assurer que ces connecteurs peuvent gérer les
18
spécificités de votre système d’information. Sinon, l’éditeur pourra probablement développer des
connecteurs sur mesure mais cela risque d’être du temps et du budget supplémentaires.
Les différentes possibilités de recherche
Les moteurs de recherche d’entreprise présentent tous les mêmes fonctionnalités principales au
niveau de la recherche. Certaines sont néanmoins plus mises en avant que d’autres selon les outils.
En ce qui concerne la recherche et l’affinage des résultats, un certain nombre de points peuvent être
pris en compte.
Les possibilités de recherche avancées. Quelles sont-elles ? Y-a-t-il un formulaire pour guider la
recherche avancée ? Le moteur de recherche prend-il en compte les opérateurs de recherche
avancée classique comme les opérateurs booléens (ET, OU, SAUF) ou de proximité (NEAR), la
troncature, les parenthèses pour construire des équations de recherche ? Lesquelles de ces
possibilités sont à privilégier, selon les utilisateurs (voir paragraphe suivant).
Il y a aussi ce que j’appelle les facilitateurs de requêtes. Ce sont des fonctionnalités qui facilitent
l’écriture de la requête par l’utilisateur : insensibilité à la casse, aux accents, aux pluriels, élimination
des mots vides, correction orthographique, lemmatisation (action de regrouper les différentes
formes que peut prendre un mot : nom, pluriel, verbe conjugué, infinitif…), auto-complétion...
Capture d’écran du moteur de recherche Google avec la fonctionnalité d’auto-complétion
La navigation par facettes. Une facette permet à l’utilisateur d’affiner successivement sa recherche
en lui permettant de sélectionner directement sur la page de résultats du moteur des sous-
catégories plus précises. Ces facettes peuvent être construites grâce à l’analyse des métadonnées ou
bien par analyse sémantique ou extraction d’entités nommées. L’analyse sémantique permet
d’extraire des concepts évoqués dans les documents. L’extraction d’entités nommées permet
d’extraire des résultats les noms propres y figurant. Cette extraction peut être personnalisée selon
les contextes.
19
Le moteur de recherche Exalead a été l’un des premiers moteurs web à proposer une navigation par
facette à ses utilisateurs.
Les utilisateurs de l’outil
Qui seront les utilisateurs finaux de l’outil ? Sont-ils des professionnels
de la recherche d’information ou des novices ? Les fonctionnalités à
privilégier ne sont pas les même dans les deux cas. Si les utilisateurs
sont des professionnels de la recherche d’information, ils peuvent
utiliser des fonctions de recherche avancée directement dans la barre
de recherche. S’il s’agit d’utilisateurs novices, on privilégiera plutôt des
modes de recherche guidée avec formulaires, des fonctions visuelles
comme les facettes et surtout la plus grande simplicité d’utilisation et
la similarité avec les moteurs de recherche web.
La gestion de la sécurité
Tous les utilisateurs n’ont pas les mêmes droits d’accès selon les sources de données ou les types
d’informations. Les moteurs de recherche d’entreprise intègrent une reconnaissance des utilisateurs
par identifiant et mot de passe ce qui permet ensuite de déterminer à quelles informations ils auront
le droit d’accéder ou non.
Le moteur de recherche doit être capable de prendre en compte les différents droits des utilisateurs
pour chaque source indexée et de les unifier pour un même utilisateur.
Il y a deux méthodes pour assurer la sécurité des accès :
 Soit le moteur récupère les droits de l’annuaire de l’entreprise
 Soit il gère le schéma de contrôle en interne.
L’une ou l’autre est à privilégier suivant le contexte d’utilisation.
20
En ce qui concerne la visibilité des documents selon les droits des utilisateurs, deux possibilités
existent. Soit, quand il fait une recherche, l’utilisateur ne voit que les documents auxquels il a accès.
Soit, il voit également les documents auxquels il n’a pas accès dans la liste des résultats mais cela n’a
pas les possibilités d’y accéder. Cette deuxième solution peut présenter l’avantage d’élargir la
circulation de l’information dans l’entreprise. Des droits d’accès ont été définis à l’arrivé du salarié
dans l’entreprise, celui-ci a évolué dans son poste mais personne n’a pensé à modifier ses droits
d’accès aux informations. Le fait que le salarié puisse voir ces informations et savoir qu’elles existent
peut lui permettre de demander à ce qu’on lui élargisse ses droits d’accès.
Quelles que soit les solutions choisies pour la gestion de la sécurité, il ne faudra pas oublier de faire
des tests avec les profils de différents utilisateurs pour s’assurer que tout fonctionne correctement
avant le déploiement complet de l’outil. Vérifier régulièrement que les droits d’accès sont toujours
bien paramétrer peut aussi être nécessaire. Il peut arriver que cela bouge.
Les possibilités de personnalisation
Les éditeurs de solutions de recherche proposent des outils standardisés, avec plus ou moins de
possibilités de personnalisation. Il convient d’abord de s’assurer que l’outil choisi pourra s’intégrer
dans le système d’information de l’entreprise.
Quels sont les possibilités de personnalisation de l’outil ? Elles sont à examiner aussi bien au niveau
de l’apparence de l’outil, de l’ergonomie, de l’apparence graphique, que des possibilités
d’administration et d’ajout d’applications.
Panorama de l’offre
Quelle est l’offre des éditeurs en matière de moteur de recherche ?
Le marché des logiciels de recherche d’entreprise est assez mouvant. Si vous vous basez sur un
panorama de l’offre de plus de deux ans, vérifiez bien que les éditeurs existent encore et qu’ils
proposent bien toujours les mêmes types d’outils. Ils peuvent avoir évolués ou s’être fait racheter.
Voici une liste d’éditeurs d’outils de recherche et une brève présentation de leurs solutions.
Cette liste n’est pas exhaustive et les présentations sont principalement issues des sites web des
éditeurs. Il ne s’agit pas de faire de la pub à tel ou tel éditeur mais de donner des pistes.
21
Polyspot
Editeur français
L’éditeur Polyspot propose des solutions propriétaires basées sur les solutions de recherche open
source Lucene et Solr, deux projets de la fondation Apache.
Via son produit Polyspot Enterprise Search, Polyspot offre un accès unifié aux données de
l’entreprise via des vues informationnelles, interfaces correspondants à différentes applications de
recherche. Cela permet de proposer aux utilisateurs des accès aux informations suivant différents
aspects de leur activité.
Polyspot Enterprise Search intègre les fonctionnalités classiques de recherche d’information
(suggestion orthographique, auto-complétion, recherche par facette…), ainsi que des fonctionnalités
d’alertes et de collaboration.
Pour en savoir plus11
Exalead
Editeur français
Les produits d’Exalead reposent sur une technologie propriétaire.
Exalead CloudView est une infrastructure de recherche qui permet qui permet de créer des
applications orientées recherche (SBA – Search Based Applications). Le développement d’applications
se fait par glisser-déposer et est accessible sans avoir besoin de notions de programmation.
Exalead CloudView dispose de fonctionnalités de recherche plein texte, d’affichage dynamique des
résultats, de recherche par facettes et de Business Intelligence.
Pour en savoir plus 12
11
http://www.polyspot.com/produits/polyspot-enterprise-search.html
12
http://www.3ds.com/fr/products/exalead/products/exalead-cloudview/overview/
22
Doculibre
Editeur canadien
Doculibre propose un moteur de recherche entièrement open source, basé sur Lucene et Solr.
L’outil Constellio propose les fonctionnalités de recherche classiques et permet de fédérer toutes les
sources d’informations de l’entreprise via une seule interface de recherche.
Constellio présente les avantages des produits open sources, à savoir pas de frais de licence, pas de
limites d’utilisateurs, ni de documents indexés et une personnalisation illimitée par le biais de
développement supplémentaires.
Il existe un intégrateur français de Constellio : France Labs.
Pour en savoir plus13
Sinequa
Editeur français
Sinequa propose des solutions de recherche qui permettent l’accès unifié à l’information et la prise
en compte du Big Data avec des possibilités d’analyse de données.
Sinequa récupère les informations de différentes sources et y applique des traitements statistiques,
sémantiques et linguistiques pour permettre d’enrichir les données et de les analyser.
La plateforme Sinequa permet également de créer ses propres applications orientées recherche
(SBA).
Pour en savoir plus14
Google Enterprise
Editeur américain
Google propose une solution de recherche d’entreprise clé en main : Google Enterprise search.
Il s’agit d’une appliance reposant sur la technologie de Google en matière de recherche
d’information.
13
http://constellio.com/
14
http://www.sinequa.com/fr/page/produit/produit.aspx
23
Cet outil permet de rechercher dans plusieurs sources d’informations et dispose de plusieurs
fonctionnalités de recherche comme l’exploitation des métadonnées, la gestion du multilinguisme,
des alertes, des suggestions de recherche, prise en compte des problématiques du cloud et de la
mobilité…
Il permet en outre de bénéficier de la simplicité d’utilisation des produits Google.
Par contre, il ne dispose pas de fonctionnalités d’enrichissement et d’analyse des données, ni de
possibilités de personnalisation.
Pour en savoir plus15
Antidot
Editeur français
Antidot propose plusieurs outils de recherche, pour sites web et e-commerce ou pour l’entreprise.
ASF@Enterprise est une plateforme qui permet un accès unifié à l’information de l’entreprise et
propose aussi des fonctions collaboratives.
Les solutions Antidot disposent également de briques technologiques permettant l’enrichissement
des données.
Pour en savoir plus16
Autonomy
Filliale de Hewlett-Packard
Autonomy propose des produits permettant la recherche dans les contenus structurés et non
structurés, ainsi que la prise en compte du Big Data. Leurs outils disposent de fonctions de recherche
avancées, de fonctionnalités d’analyse des données grâces à des taxonomies ou de l’analyse et de la
classification des données et des possibilités de
personnalisation et de collaboration.
Pour en savoir plus17
15
http://www.google.fr/enterprise/search/campaigns/gsa7.html
16
http://www.antidot.net/fr/Solutions
17
http://www.autonomy.com/content/Functionality/administration/index.en.html
24
Arisem
Editeur français
Arisem propose des solutions de veille et de moteur de recherche.
En matière de moteur de recherche, Arisem ne fournit pas de solution de recherche à proprement
parler mais propose des composants logiciels d’analyse et enrichissement de données à associer à
d’autres outils pour leur faire bénéficier de fonctionnalités de text-minnig et d’analyse sémantique.
Arisem est, entre autre, partenaire de Polyspot.
Pour en savoir plus18
18
http://www.arisem.com/?q=fr/solutions/suite-eidon
25
Pour conclure
Les systèmes d’information des entreprises regorgent d’informations et de données peu exploitées,
faute de pouvoir y accéder facilement. Les moteurs de recherche d’entreprise se présentent comme
LA solution pour mettre en valeur ces données et gagner en efficacité.
C’est vrai, ils peuvent rendre de bons services, surtout quand ils disposent de fonctionnalités
adaptées aux besoins des utilisateurs.
Mais il ne faut pas perdre de vue que les moteurs de recherche sont avant tout des outils et que leur
efficacité dépend en grande partie de l’utilisation qui en est faite.
Aussi simple d’utilisation soient-ils, il ne faut pas négliger la formation des utilisateurs, ne serait-ce
que pour leur présenter l’outil.
Les moteurs de recherche permettent d’accéder à des informations, mais ils ne s’occupent pas de la
gestion de ces informations. Nettoyer les entrepôts d’informations pour en retirer les documents
arrivés en fin de vie, éliminer les doublons, renseigner les métadonnées pour qualifier les
informations… Un moteur de recherche ne dispense pas de toutes ces tâches, même s’il peut, dans
certains cas, les faciliter.
Pour conclure, je dirais que les moteurs de recherche peuvent s’avérer très utiles mais qu’ils ne sont
pas la panacée à tous les problèmes informationnels de l’entreprise. Comme tous les outils
informatiques, ils ont des limites19
.
19
http://pro.01net.com/editorial/541266/le-moteur-de-recherche-dentreprise/
26
Sources
Voici les sources que j’ai utilisées pour ce dossier. N’hésitez pas à les consulter pour approfondir
certains points.
BREBION Patrick. La recherche en entreprise se professionnalise.2006. [en ligne] Disponible sur <
http://pro.01net.com/editorial/331269/la-recherche-en-entreprise-se-professionnalise/> (Dernière
consultation le 10/03/2013).
DARDANT Frédéric. Le moteur de recherche d’entreprise, quelles cibles ? 2009. [en ligne] Disponible
sur < http://www.cio-online.com/contributions/lire-le-moteur-de-recherche-d-entreprise-quelles-
cibles-320.html> (Dernière consultation le 10/03/2013).
DEBONNE Eric. Moteur de recherche versus entreprise : Quelles sont les différences des moteurs de
recherche Internet et en entreprise ? 2007. [en ligne] Disponible sur <
http://www.solaci.com/blog/2007/11/moteur-de-recherche-internet-versus.html> (Dernière
consultation le 10/03/2013).
DEBONNE Eric, « Solutions dans la course à l’innovation » in Veille et recherche d’information sur le
web – Guide pratique Archimag n°37, 2009.
FAURE Christian. Choisir un moteur de recherche pour l’entreprise. 2006. [en ligne] Disponible sur <
http://www.christian-faure.net/2006/09/10/choisir-un-moteur-de-recherche-pour-lentreprise/>
(Dernière consultation le 10/03/2013).
FAURE Christian. Quand le « Search » bouscule la « Business Intelligence ». 2007. [en ligne] Disponible
sur < http://www.christian-faure.net/2007/06/07/quand-le-search-bouscule-la-bi/> (Dernière
consultation le 10/03/2013).
FAURE Christian. Quelques évidences sur le moteur de recherche. 2006. [en ligne] Disponible sur <
http://www.christian-faure.net/2006/09/23/quelques-vidences-sur-le-moteur-de-recherche/>
(Dernière consultation le 10/03/2013).
FERRE Jean. Desktop search et Moteur de Recherche d’Entreprise : à ne pas mélanger. 2009. [en ligne]
Disponible sur < http://jean-ferre.blogspot.fr/2009/02/desktop-search-et-moteur-de-
recherche.html> (Dernière consultation le 10/03/2013).
FREYERMUTH Jérôme, GUIZIOU Erwan. Le moteur de recherche : Clé de voûte du système
d’information. VOIRIN Consultants & Conseils ATELYA, 2012. [en ligne] Disponible sur <
http://www.voirin-consultants.com/fr/management/actualites/publications/livres-blancs/le-moteur-
de-recherche> (Dernière consultation le 10/03/2013).
JUNQ Marie. Bien choisir un moteur de recherche d’entreprise. 2009. [en ligne] Disponible sur <
http://pro.01net.com/editorial/402884/bien-choisir-un-moteur-de-recherche-dentreprise/>
(Dernière consultation le 10/03/2013).
27
JUNQ Marie. Le moteur de recherche d’entreprise. 2011. [en ligne] Disponible sur <
http://pro.01net.com/editorial/541266/le-moteur-de-recherche-dentreprise/> (Dernière
consultation le 10/03/2013).
LEFASSY Olivier. Moteur de recherche transverse d’entreprise : pour plus de pertinence, croisez les
référentiels ! 2011. [en ligne] Disponible sur < http://lecercle.lesechos.fr/entreprises-marches/high-
tech-medias/internet/221136539/moteur-recherche-transverse-entreprise-plus-> (Dernière
consultation le 10/03/2013).
PREVERAUD Jean-François. Sémantique : choisir le bon moteur de recherche pour son
entreprise.2013. [en ligne] Disponible sur < http://www.industrie-techno.com/semantique-choisir-le-
bon-moteur-de-recherche-pour-son-entreprise.22866> (Dernière consultation le 10/03/2013).
STEPHAN Thibaut. Les 7 critères de choix d’un moteur de recherche. 2013. [en ligne] Disponible sur <
http://www.serdalab.com/article/2013/2/25/les-7-criteres-de-choix-dun-moteur-de-recherche-de/>
(Dernière consultation le 10/03/2013).
VANNESTE Xavier. Le moteur de recherche dans l’entreprise. 2011. [en ligne] Disponible sur <
http://blog.xvanneste.com/Lists/Billets/Post.aspx?ID=81> (Dernière consultation le 10/03/2013).
La web TV du salon Documation a mis en ligne des conférences thématiques enregistrées lors des
différents salons. Certaines étaient consacrées à la recherche en entreprise. Elles présentent des cas
d’utilisations concrets d’outils de recherche en entreprise.
L’Accès unifié à l’Information : le nouveau marché du Search en entreprise avec Sinequa et
Locarchives. 21/03/2012
Disponible sur < http://www.documation.tv/ct-2012-sinequa-et-locarchives-29.html >
Organiser l’accessibilité de l’information dans l’entreprise avec Polyspot et Magillem. 21/03/2012
Disponible sur < http://www.documation.tv/ct-2012-polyspot-et-magillem-30.html>
Un moteur de recherche au centre du poste de travail. Créer une vue à 360° d’un sujet. 24/03/2011
Disponible sur < http://www.documation.tv/ct-2011-3-moteur-de-recherche-20.html>

Más contenido relacionado

La actualidad más candente

integrated library system
integrated library systemintegrated library system
integrated library systemSeerat Chishti
 
New library management system slide
New library management system slideNew library management system slide
New library management system slideEnzo Ivan
 
Cognitive Retrieval Model
Cognitive Retrieval ModelCognitive Retrieval Model
Cognitive Retrieval ModelFirdaus Rahaman
 
British library documentation service center
British  library  documentation service centerBritish  library  documentation service center
British library documentation service centerRupam Hazarika
 
Web 2.0 and Information Literacy
Web 2.0 and Information LiteracyWeb 2.0 and Information Literacy
Web 2.0 and Information LiteracyJane Secker
 
Academic social networking sites
Academic social networking sitesAcademic social networking sites
Academic social networking sitesKaty Jordan
 
The Changing Library Environment of Technical Services
The Changing Library Environment of Technical ServicesThe Changing Library Environment of Technical Services
The Changing Library Environment of Technical ServicesFe Angela Verzosa
 
Information policy sunil sir
Information policy sunil sirInformation policy sunil sir
Information policy sunil sirbgshalini
 
Co operative cataloguing
Co operative cataloguingCo operative cataloguing
Co operative cataloguingshashimgl
 
Web scale discovery service
Web scale discovery serviceWeb scale discovery service
Web scale discovery serviceKankana Baishya
 
Different Bibliographic Form Standards
Different Bibliographic Form StandardsDifferent Bibliographic Form Standards
Different Bibliographic Form StandardsDaryl Superio
 
Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Bohyun Kim
 
Need, steps and challenges of library automation
Need, steps and challenges of library automationNeed, steps and challenges of library automation
Need, steps and challenges of library automationpardeeprattan
 

La actualidad más candente (20)

Opac search
Opac searchOpac search
Opac search
 
integrated library system
integrated library systemintegrated library system
integrated library system
 
New library management system slide
New library management system slideNew library management system slide
New library management system slide
 
Cognitive Retrieval Model
Cognitive Retrieval ModelCognitive Retrieval Model
Cognitive Retrieval Model
 
British library documentation service center
British  library  documentation service centerBritish  library  documentation service center
British library documentation service center
 
Web 2.0 and Information Literacy
Web 2.0 and Information LiteracyWeb 2.0 and Information Literacy
Web 2.0 and Information Literacy
 
Semantic web
Semantic webSemantic web
Semantic web
 
Inis ppt
Inis pptInis ppt
Inis ppt
 
Webometrics
WebometricsWebometrics
Webometrics
 
Academic social networking sites
Academic social networking sitesAcademic social networking sites
Academic social networking sites
 
The Changing Library Environment of Technical Services
The Changing Library Environment of Technical ServicesThe Changing Library Environment of Technical Services
The Changing Library Environment of Technical Services
 
New techniques and tools in the library
New techniques and tools in the libraryNew techniques and tools in the library
New techniques and tools in the library
 
Information policy sunil sir
Information policy sunil sirInformation policy sunil sir
Information policy sunil sir
 
Bibliometrics law
Bibliometrics lawBibliometrics law
Bibliometrics law
 
Co operative cataloguing
Co operative cataloguingCo operative cataloguing
Co operative cataloguing
 
Soul
Soul Soul
Soul
 
Web scale discovery service
Web scale discovery serviceWeb scale discovery service
Web scale discovery service
 
Different Bibliographic Form Standards
Different Bibliographic Form StandardsDifferent Bibliographic Form Standards
Different Bibliographic Form Standards
 
Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries Impact of Artificial Intelligence (AI) on Libraries
Impact of Artificial Intelligence (AI) on Libraries
 
Need, steps and challenges of library automation
Need, steps and challenges of library automationNeed, steps and challenges of library automation
Need, steps and challenges of library automation
 

Destacado

Introduction à ElasticSearch
Introduction à ElasticSearchIntroduction à ElasticSearch
Introduction à ElasticSearchFadel Chafai
 
Le moteur de recherche, opportunité pour bâtir une application documentaire
Le moteur de recherche, opportunité pour bâtir une application documentaireLe moteur de recherche, opportunité pour bâtir une application documentaire
Le moteur de recherche, opportunité pour bâtir une application documentairePascaleBOUTON
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heuresSaïd Radhouani
 
Diseño investigación _2014 (1)
Diseño investigación _2014 (1)Diseño investigación _2014 (1)
Diseño investigación _2014 (1)amparito65
 
Carfully & L'authentisme
Carfully & L'authentismeCarfully & L'authentisme
Carfully & L'authentismeCarfully
 
Presentación Faja Alta & Faja Plus
Presentación Faja Alta & Faja PlusPresentación Faja Alta & Faja Plus
Presentación Faja Alta & Faja PlusArdyss Colombia
 
Presentación Lumbowoman
Presentación LumbowomanPresentación Lumbowoman
Presentación LumbowomanArdyss Colombia
 
Presentación Faja Postparto
Presentación Faja PostpartoPresentación Faja Postparto
Presentación Faja PostpartoArdyss Colombia
 
L'émergence des nouveaux métiers du web en Tunisie : le community management.
L'émergence des nouveaux métiers du web en Tunisie : le community management.L'émergence des nouveaux métiers du web en Tunisie : le community management.
L'émergence des nouveaux métiers du web en Tunisie : le community management.MBM Tunisie
 
Power de angie
Power de angiePower de angie
Power de angieaedojudo
 
Educación a distancia
Educación a distanciaEducación a distancia
Educación a distanciadumarmontoya
 
Le Zapping (Lettre d'information de la ville de Pia)
Le Zapping  (Lettre d'information de la ville de Pia)Le Zapping  (Lettre d'information de la ville de Pia)
Le Zapping (Lettre d'information de la ville de Pia)Francis Renault
 
Objetos tecnologicos diego tinjaca
Objetos tecnologicos diego tinjacaObjetos tecnologicos diego tinjaca
Objetos tecnologicos diego tinjacadiego532
 

Destacado (20)

Introduction à ElasticSearch
Introduction à ElasticSearchIntroduction à ElasticSearch
Introduction à ElasticSearch
 
Le moteur de recherche, opportunité pour bâtir une application documentaire
Le moteur de recherche, opportunité pour bâtir une application documentaireLe moteur de recherche, opportunité pour bâtir une application documentaire
Le moteur de recherche, opportunité pour bâtir une application documentaire
 
Apprendre Solr en deux heures
Apprendre Solr en deux heuresApprendre Solr en deux heures
Apprendre Solr en deux heures
 
Diseño investigación _2014 (1)
Diseño investigación _2014 (1)Diseño investigación _2014 (1)
Diseño investigación _2014 (1)
 
Carfully & L'authentisme
Carfully & L'authentismeCarfully & L'authentisme
Carfully & L'authentisme
 
Practica vistas
Practica vistasPractica vistas
Practica vistas
 
Presentación Lumbomen
Presentación LumbomenPresentación Lumbomen
Presentación Lumbomen
 
Presentación Faja Alta & Faja Plus
Presentación Faja Alta & Faja PlusPresentación Faja Alta & Faja Plus
Presentación Faja Alta & Faja Plus
 
Presentación Lumbowoman
Presentación LumbowomanPresentación Lumbowoman
Presentación Lumbowoman
 
Presentación Faja Postparto
Presentación Faja PostpartoPresentación Faja Postparto
Presentación Faja Postparto
 
How to install gwt and maven
How to install gwt and maven How to install gwt and maven
How to install gwt and maven
 
¿Qué haría Google?
¿Qué haría Google?¿Qué haría Google?
¿Qué haría Google?
 
I.v.a.
I.v.a.I.v.a.
I.v.a.
 
L'émergence des nouveaux métiers du web en Tunisie : le community management.
L'émergence des nouveaux métiers du web en Tunisie : le community management.L'émergence des nouveaux métiers du web en Tunisie : le community management.
L'émergence des nouveaux métiers du web en Tunisie : le community management.
 
Power de angie
Power de angiePower de angie
Power de angie
 
Présentation Facebook bellac
Présentation Facebook bellacPrésentation Facebook bellac
Présentation Facebook bellac
 
Educación a distancia
Educación a distanciaEducación a distancia
Educación a distancia
 
Netiqueta
NetiquetaNetiqueta
Netiqueta
 
Le Zapping (Lettre d'information de la ville de Pia)
Le Zapping  (Lettre d'information de la ville de Pia)Le Zapping  (Lettre d'information de la ville de Pia)
Le Zapping (Lettre d'information de la ville de Pia)
 
Objetos tecnologicos diego tinjaca
Objetos tecnologicos diego tinjacaObjetos tecnologicos diego tinjaca
Objetos tecnologicos diego tinjaca
 

Similar a Moteurs de-recherche-dentreprise-aurelie gilabert-infodocenligne

Etat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneEtat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneGeliMeng
 
Etat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En LigneEtat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En Lignemenggeli
 
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"Olivier kra kouassi
 
Workshop/referencement naturel
Workshop/referencement naturelWorkshop/referencement naturel
Workshop/referencement naturelJean-Louis Kalala
 
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEO
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEOATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEO
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEOLaurent P. PRO
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...juriconnexion
 
Dossier de référencement - DU communication
Dossier de référencement -  DU communicationDossier de référencement -  DU communication
Dossier de référencement - DU communicationPierre-Marie Poirier
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Philippe YONNET
 
Guide HubSpot pour la recherche de mots-clés.pptx
Guide HubSpot pour la recherche de mots-clés.pptxGuide HubSpot pour la recherche de mots-clés.pptx
Guide HubSpot pour la recherche de mots-clés.pptxtanokouakouludovic
 
Référencement Naturel (SEO)
Référencement Naturel (SEO)Référencement Naturel (SEO)
Référencement Naturel (SEO)soufiane1993
 
Les bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelLes bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelClaire WIBAILLE
 
Du marketing d'hier au marketing de demain - Le SEO
Du marketing d'hier au marketing de demain - Le SEODu marketing d'hier au marketing de demain - Le SEO
Du marketing d'hier au marketing de demain - Le SEOPim-Bim - The Inbound Suite
 
Comment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEOComment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEOSemrush France
 
Café Didactique #4 Référencement
Café Didactique #4 RéférencementCafé Didactique #4 Référencement
Café Didactique #4 Référencement31eme Arrondissement
 
Webschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute CréationWebschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute Créationmariejura
 

Similar a Moteurs de-recherche-dentreprise-aurelie gilabert-infodocenligne (20)

Tout trouver sur le web : les bonnes techniques de recherche !
Tout trouver sur le web : les bonnes techniques de recherche !Tout trouver sur le web : les bonnes techniques de recherche !
Tout trouver sur le web : les bonnes techniques de recherche !
 
Etat de l'art de la recherche en Ligne
Etat de l'art de la recherche en LigneEtat de l'art de la recherche en Ligne
Etat de l'art de la recherche en Ligne
 
Etat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En LigneEtat De Lart De La Recherche En Ligne
Etat De Lart De La Recherche En Ligne
 
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"Maîtriser les bases du Référencement  Naturel (SEO) " Première partie"
Maîtriser les bases du Référencement Naturel (SEO) " Première partie"
 
Se faire connaitre sur le web
Se faire connaitre sur le webSe faire connaitre sur le web
Se faire connaitre sur le web
 
Workshop/referencement naturel
Workshop/referencement naturelWorkshop/referencement naturel
Workshop/referencement naturel
 
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEO
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEOATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEO
ATELIER ANT N°8 - RÉFÉRENCEMENT NATUREL - SEO
 
Guide referencement
Guide referencementGuide referencement
Guide referencement
 
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
Les modes de recherche sur le web 2.0. Par Guiraude Lame Secrétaire général -...
 
Dossier de référencement - DU communication
Dossier de référencement -  DU communicationDossier de référencement -  DU communication
Dossier de référencement - DU communication
 
Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015Utilisation avancée d'un crawler - SEO Camp'us 2015
Utilisation avancée d'un crawler - SEO Camp'us 2015
 
Guide HubSpot pour la recherche de mots-clés.pptx
Guide HubSpot pour la recherche de mots-clés.pptxGuide HubSpot pour la recherche de mots-clés.pptx
Guide HubSpot pour la recherche de mots-clés.pptx
 
Le Searchdexing
Le SearchdexingLe Searchdexing
Le Searchdexing
 
Référencement Naturel (SEO)
Référencement Naturel (SEO)Référencement Naturel (SEO)
Référencement Naturel (SEO)
 
Referencement metz
Referencement metzReferencement metz
Referencement metz
 
Les bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturelLes bases du seo : comment réussir votre référencement naturel
Les bases du seo : comment réussir votre référencement naturel
 
Du marketing d'hier au marketing de demain - Le SEO
Du marketing d'hier au marketing de demain - Le SEODu marketing d'hier au marketing de demain - Le SEO
Du marketing d'hier au marketing de demain - Le SEO
 
Comment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEOComment réussir sa stratégie de contenu grâce à la data SEO
Comment réussir sa stratégie de contenu grâce à la data SEO
 
Café Didactique #4 Référencement
Café Didactique #4 RéférencementCafé Didactique #4 Référencement
Café Didactique #4 Référencement
 
Webschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute CréationWebschool du Jura - Le référencement par Absolute Création
Webschool du Jura - Le référencement par Absolute Création
 

Moteurs de-recherche-dentreprise-aurelie gilabert-infodocenligne

  • 2. Dossier réalisé par Aurélie Gilabert Mars 2013 www.infodocenligne.wordpress.com Ce document est mis à disposition selon les termes de la Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Pas de Modification 3.0 non transposé.
  • 3. INTRODUCTION 1 PREMIERE PARTIE – UN MOTEUR DE RECHERCHE D’ENTREPRISE, QU’EST-CE QUE C’EST ? 2 Moteur de recherche : de quoi parle-t-on ? 2 Moteur de recherche web ou entreprise : quelles différences ? 8 DEUXIEME PARTIE – UN MOTEUR DE RECHERCHE D’ENTREPRISE POUR QUOI FAIRE ? 10 Quel est l’intérêt d’utiliser un moteur de recherche dans l’entreprise ? 10 Quels sont les usages possibles d’un moteur de recherche d’entreprise ? 13 MOTEUR DE RECHERCHE D’ENTREPRISE, COMMENT CHOISIR ? 16 Les questions à se poser avant de choisir un moteur de recherche 16 Panorama de l’offre 20 POUR CONCLURE 25 SOURCES 26
  • 4. 1 Introduction Voici un dossier consacré à la recherche d’information en entreprise, une notion aussi appelée enterprise search ou business search, avec ses outils dédiés : les moteurs de recherche d’entreprise. Pourquoi un tel sujet ? Car ce sont des outils de plus en plus adoptés par les entreprises et qui présentent de réels intérêts pour la gestion de l’information. J’ai d’ailleurs rencontré plusieurs cas d’entreprises qui souhaitaient mettre en place un moteur de recherche interne. En octobre 2012, l’ADBS a organisé une formation intitulée « Mettre en place un moteur de recherche d’entreprise », qui est reconduite pour l’année 2013. L’ADBS, toujours, a aussi organisé à Lyon une journée d’étude, en partenariat avec Collaboratif Info, sur le thème : « Le moteur de recherche interne, élément clé de l’accès à l’information dans l’entreprise ». Cet intitulé reflète bien la principale fonction des moteurs de recherche d’entreprise. Ce sont des outils qui ont toute leur place dans la stratégie de gestion et d’accès à l’information d’une entreprise ou d’une organisation. Dans un univers informationnel en croissance exponentielle, il est nécessaire de mettre en place des outils pour s’y retrouver. Les moteurs de recherche d’entreprise permettent de répondre à ce besoin et de faire plus encore. Ce dossier est construit autour de trois axes, répondant aux questions : quoi, pourquoi et comment.  Qu’est-ce qu’un moteur de recherche d’entreprise ? Comment le définir ? Comment fonctionne-t-il ?  Qu’est-ce que l’utilisation d’un moteur de recherche peut apporter à l’entreprise ?  Comment choisir un moteur de recherche ? Quelles sont les questions à se poser ? Quels sont les critères de choix ? Les objectifs de ce dossier sont :  De fournir une première approche des moteurs de recherche d’entreprise à ceux qui veulent en savoir plus sur le sujet,  De montrer l’intérêt qu’il peut y avoir à utiliser ces outils,  De fournir des pistes pour les personnes qui souhaiteraient mettre en place un moteur de recherche d’entreprise.
  • 5. 2 Première partie – Un moteur de recherche d’entreprise, qu’est-ce que c’est ? Pour bien comprendre les enjeux des moteurs de recherche d’entreprise commençons par définir de quoi il s’agit et comment ils fonctionnent. Attardons-nous ensuite sur ses particularités. Moteur de recherche : de quoi parle-t-on ? Avant de définir un moteur de recherche d’entreprise, commençons par définir ce qu’est un moteur de recherche en général, ainsi que son principe de fonctionnement. La principale fonction d’un moteur de recherche est de signaler l’existence et la localisation de ressources répondant à la demande de l’utilisateur – demande formulée via des mots-clés choisis librement. Sur le site de l’ADBS, on trouve la définition suivante1 : « Robot de recherche : logiciel permettant la construction automatique d’index de mots contenus dans les pages d’informations sur des sites web ou autres ressources sur l’internet et leur interrogation à travers des interfaces dédiées ; la construction automatique d’un index suppose un module de collecte automatique des données qui opère sur les sites serveurs (spider ou crawler) et un module d’indexation qui construit automatiquement l’index à partir des résultats de l’étape précédente ; l’interrogation suppose un module de recherche spécifique sur les index ainsi créés (moteur de recherche). » Pour sa part, l’Encyclopédie Wikipédia2 définit un moteur de recherche comme : « Une application web permettant de retrouver des ressources (pages web, articles de forums Usenet, images, vidéos, fichiers, etc.) associées à des mots quelconques. Certains sites offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors moteur de recherche le site lui-même. » Comme le montre la définition de l’ADBS, un moteur de recherche est composé de trois éléments essentiels. Ces trois éléments correspondent aux trois étapes du fonctionnement d’un moteur de recherche.  Un module de collecte automatique des informations (appelé aussi crawler ou spider)  Un module d’indexation  Un module de classement automatisé des informations 1 http://www.adbs.fr/robot-de-recherche-18537.htm?RH=OUTILS_VOC 2 http://fr.wikipedia.org/wiki/Moteur_de_recherche
  • 6. 3 Les trois étapes de fonctionnement d’un moteur de recherche Le robot crawler parcourt tous les contenus qui doivent être indexés par le moteur de recherche. Il « lit » les informations contenues dans les ressources, en extrait les plus importantes et les stocke sur des serveurs afin de s’en servir pour constituer un index. Le module d’indexation permet l’indexation automatique du contenu récolté à l’étape précédente. Selon le Dictionnaire de l’information publié aux éditions Armand Colin, la forme basique de l’indexation automatique « est le traitement du texte intégral (full text) et la constitution de fichiers inversés par élimination des mots vides et sélection de toutes les chaînes de caractères situées entre deux séparateurs. » Le moteur de recherche construit deux index :  Un index contenant le corpus d’informations capturées par le robot crawler ;  Un index inversé contenant la liste de tous les mots-clés relevés lors de l’indexation et associé aux ressources qui les contiennent avec leur adresse. C’est cet index inversé que le moteur de recherche interroge lors d’une requête. Grâce à lui, il n’a pas à parcourir tous les documents indexés pour déterminer lesquels sont intéressants. C’est ce qui lui permet de faire remonter des résultats en quelques millièmes de secondes3 . On constate d’ailleurs qu’il est plus rapide de faire une recherche dans un corpus aussi étendu que le web que de faire une recherche dans un document PDF assez long, qui lui ne dispose pas d’index. 3 http://www.christian-faure.net/2006/09/23/quelques-vidences-sur-le-moteur-de-recherche/
  • 7. 4 Le classement des résultats identifiés lors d’une requête se fait grâce au module de classement. Pour les moteurs de recherche sur le web, c’est lors de cette étape que se joue la concurrence. L’algorithme de classement est ce qui fait la différence entre les différents moteurs de recherche. En effet, un moteur de recherche qui ne fait pas remonter des résultats pertinents pour l’utilisateur en haut de liste ne va pas être utilisé bien longtemps. Pour classer ses contenus, le moteur de recherche se base sur la fréquence des mots-clés et sur leur répartition dans le document. Cela permet de faire des calculs de pondération et de mesurer l’importance d’un mot par rapport à son poids dans l’ensemble de la ressource. Plus un mot- clé est présent, plus il est important. Et la place du mot joue aussi : un mot présent dans le titre est plus important que s’il se trouve dans le corps du texte. C’est ce que l’on appelle le tri par pertinence et c’est la base du classement automatisé de documents. Mais cette méthode montre des limites et il est facile de la détourner. Les moteurs de recherche ont donc cherché d’autres moyens pour classer leurs résultats. Le tri par popularité prend en compte la valeur des liens hypertextes pointant vers la page considérée. C’est sur cette méthode qu’est basé le PageRank de Google. Le tri par mesure d’audience se base sur le nombre d’internautes qui ont visité la page et sur le temps qu’ils y ont passé. Plus le nombre d’internaute ayant visité une page est élevé et plus ils y ont passé de temps, plus cette page sera placée haut par rapport à une autre avec les mêmes mots-clés. Il existe plusieurs catégories de moteurs de recherche. Leurs principales différences tiennent surtout au périmètre dans lequel la recherche est effectuée. Mais le fonctionnement en trois étapes4 (crawl, indexation, classement) est le même pour tous. On trouve plusieurs grands types de moteurs de recherche :  Les moteurs de recherche sur internet qui permettent d’interroger le web avec pour le plus connu d’entre eux Google. Citons aussi Bing, Duckduckgo ou Ixquick Search. 4 http://www.google.com/insidesearch/howsearchworks/thestory/
  • 8. 5  Les moteurs de recherche internes à un site web, comme par exemple ceux permettant de trouver un produit sur un site marchand. C’est une catégorie de moteur de recherche d’entreprise mais tourné vers l’extérieur. Capture d’écran du site Fnac.com et utilisation de son moteur de recherche  Les moteurs de recherche installés sur un ordinateur personnel (desktop search5 ) qui permettent de rechercher en local sur l’ordinateur comme Copernic Desktop Search ou Spolight sous MacOS. 5 http://jean-ferre.blogspot.fr/2009/02/desktop-search-et-moteur-de-recherche.html
  • 9. 6  Les moteurs de recherche intégrés dans des logiciels comme les CRM, les GED ou autres applications métiers. Interface de recherche avancée du système de gestion de contenu Alfresco  Les moteurs de recherche d’entreprise proprement dit. Ce sont ces derniers qui nous intéressent ici. Les moteurs de recherche d’entreprise sont des outils qui indexent les contenus situés dans plusieurs entrepôts d’informations de l’entreprise (c’est-à-dire les serveurs et applications où sont stockées les données). Leur fonctionnement est le même que celui décrit précédemment pour les moteurs web, mais il rajoute un élément en plus : les connecteurs6 . Il s’agit d’un adaptateur qui va permettre au moteur de recherche de se connecter aux différentes sources d’information à indexer pour aller les crawler. Ces informations sont ensuite mises en communs et des traitements peuvent leur être appliqués (enrichissement sémantique, mise en relation de données, repérage des doublons…). La recherche s’effectue via une interface qui ressemble de plus en plus à celles des moteurs web. 6 http://www.christian-faure.net/2006/09/10/choisir-un-moteur-de-recherche-pour-lentreprise/
  • 10. 7 Schéma représentant le fonctionnement d’un moteur de recherche d’entreprise Un moteur de recherche d’entreprise ne fonctionne donc pas tout à fait pareil qu’un moteur de recherche sur le web. Il s’adapte aux spécificités du contexte dans lequel il s’inscrit. En effet, les problématiques de recherche en entreprise ne sont pas les mêmes que sur le web. CONNECTEURS Indexation et traitement des données Présentation des résultats Interface utilisateur
  • 11. 8 Moteur de recherche web ou entreprise : quelles différences ? Les paragraphes suivant s’inspirent notamment de l’article d’Eric Debonne, Moteur de recherche Internet versus Entreprise7 . Volumétrie et sélection de l’information Même si les volumes d’information produits par les entreprises ont une croissance exponentielle, ils sont encore loin d’atteindre ceux du web. Sur la toile, les moteurs de recherche procèdent à une sélection des pages qu’ils indexent, alors que dans l’entreprise tous les documents doivent être indexés. A part quelques documents exclus pour des raisons de confidentialité ou des documents privés par exemple, les utilisateurs doivent pouvoir retrouver tout document intégré dans le système d’information via le moteur de recherche. Sécurité et droit d’accès Sur le web, les documents sont publics et tout document indexé peut être consulté par n’importe quel internaute. Dans l’entreprise, l’accès aux documents est soumis à des droits. Le moteur de recherche doit intégrer ces règles de sécurité afin de ne pas permettre à un utilisateur d’accéder à un document qu’il n’a pas le droit de consulter. Hétérogénéité de l’information Les documents indexés sur le web sont généralement au format HTML ou à la rigueur dans des formats bureautiques classiques (format traitement de texte, PDF…). Dans l’entreprise, le moteur de recherche doit être capable d’indexer de nombreux formats différents, dont certains provenant d’applications métier spécifiques. Métadonnées Sur le web, les moteurs de recherche accordent peu d’importance aux métadonnées et privilégient plutôt le contenu des pages. Or, dans l’entreprise ces métadonnées sont porteuses d’informations essentielles (auteur, date de création, type de document, langue…). Il est important que le moteur les indexe et les traite pour faciliter la recherche de l’utilisateur. De plus, dans le cas de certains formats de documents pour lesquels l’outil ne peut pas indexer le contenu (fichiers son ou vidéo, formats propriétaires fermés), les métadonnées sont les seuls éléments sur lesquels l’outil peut s’appuyer lors d’une recherche. 7 http://www.solaci.com/blog/2007/11/moteur-de-recherche-internet-versus.html
  • 12. 9 Pertinence de la recherche Sur le web, la pertinence des documents est en grande partie fondée sur les liens qui pointent vers une page. Ce système ne peut pas être reproduit en entreprise pour la bonne et simple raison que les documents de l’entreprise ne sont pas reliés entre eux par des liens hypertexte. Le calcul de la pertinence d’un document sera plutôt basé sur les occurrences de mots, leur place et leur poids dans le document. Par ailleurs, dans l’entreprise, l’administrateur de l’outil de recherche peut influer manuellement sur la pertinence en donnant plus d’importance à certains critères afin d’offrir aux utilisateurs des résultats plus pertinents selon le contexte. Avec cette comparaison, on voit bien que la recherche sur le web et la recherche en entreprise, bien qu’ayant des points communs, ont des problématiques différentes. Si, pour le web, tout le monde voit clairement quels peuvent être les avantages d’un moteur de recherche pour trouver des informations, cette utilité apparaît moins clairement pour les moteurs d’entreprise. Pourquoi utiliser un moteur de recherche dans le système d’information de l’entreprise ? C’est à cette question que la deuxième partie de ce dossier va s’efforcer de répondre.
  • 13. 10 Deuxième partie – Un moteur de recherche d’entreprise pour quoi faire ? A quoi peut bien servir un moteur de recherche dans une entreprise ? Pour répondre à cette question, nous allons d’abord voir les avantages que peut apporter un moteur de recherche d’entreprise, puis nous regarderons les différents usages qu’il peut en être fait un peu plus en détail avec des scénarii d’utilisation. Quel est l’intérêt d’utiliser un moteur de recherche dans l’entreprise ? La fonction de recherche sur un ordinateur personnel est rarement utilisée. D’une part, parce que le volume d’information qui y est stocké est relativement peu important et, d’autre part, parce que l’utilisateur de l’ordinateur sait généralement où il a rangé tel document et sait s’y retrouver dans son organisation, aussi obscure soit-elle pour un tiers. En entreprise la situation est différente. Les salariés savent généralement où sont rangés les documents qu’ils ont produits, les informations avec lesquelles ils travaillent tous les jours. Mais pour le reste c’est un peu plus compliqué. Imaginons. Votre collègue a créé un document pour la réunion de vendredi prochain que vous voulez lire. Vous savez qu’il est stocké sur le serveur de fichiers partagé de l’entreprise mais vous ne savez pas où précisément et votre collègue n’utilise pas le même système de classement que vous. Suivant le nombre de fichiers, de dossiers et sous-dossiers sur ce serveur, vous pouvez perdre pas mal de temps à retrouver ce document. Il y a quelques années, pour tenter d’organiser ce fouillis de document que peut devenir un serveur partagé, on mettait en place le plus souvent une GED (Gestion Electronique de Documents), qui disposait de son propre moteur de recherche interne. Certes, cette méthode présente des avantages comme celui de mettre en place des règles de gestion des documents, de leur adjoindre des métadonnées (si tout le monde prend le temps de les renseigner). Mais c’est une solution lourde à mettre en place et à utiliser. Se doter d’une GED juste pour bénéficier de ses fonctions de recherche de document est un peu disproportionné. De plus, la recherche ne porte que sur les documents rentrés dans la GED et ne prend pas en compte d’autres entrepôts d’information.
  • 14. 11 Par exemple, les boîtes mails contiennent souvent des informations importantes (dans les courriels et les pièces jointes) mais dont le volume est important et qui sont donc parfois difficile à trouver. Certains ont essayé de quantifier le temps passé par un salarié à rechercher une information ou un document dans le système d’information de son entreprise. Même si ces chiffres sont assez imprécis, cela permet de se faire une idée du temps que cette tâche peut prendre et de l’intérêt de bénéficier d’outils adaptés. Selon les sources, nous passons entre 20 et 30% de notre temps de travail à chercher des documents ou des informations. Cela peut être d’autant plus inacceptable pour les salariés que, sur le web, ils disposent d’outils puissants, rapides et relativement efficaces pour trouver des informations. L’utilisation des moteurs de recherche pour trouver ou consulter quelque chose sur le web est devenue un automatisme. Les internautes ne retiennent plus les adresses URL, n’utilisent plus énormément les favoris, ils se contentent de taper le nom du site dans la barre de recherche de leur moteur préféré. Il est donc normal qu’ils souhaitent retrouver le même système et la même simplicité quand ils cherchent une information interne à l’entreprise. Il est donc légitime qu’ils se posent la question : « Pourquoi ne peut-on pas avoir la même chose que Google pour rechercher des informations et documents dans l’entreprise ? » Même si rechercher sur le web et rechercher dans l’entreprise ne sont pas tout à fait les mêmes choses, un moteur de recherche d’entreprise peut effectivement résoudre ce problème d’accès à l’information. (Voir dans la première partie Moteur de recherche web ou entreprise : quelles différentes ?) Les moteurs de recherche permettent d’accéder plus facilement aux documents et informations mais ils permettent aussi de les trier plus facilement. Même si les salariés sont censés les éviter, de nombreux doublons existent. Il n’est pas rare de trouver plusieurs versions de travail rangées au même endroit ou plusieurs documents identiques disséminés dans plusieurs entrepôts de stockage. Le moteur de recherche permet de visualiser ces doublons. Il permet aussi de les trier. En effet, le moteur de recherche, en plus du contenu du document, indexe aussi ses métadonnées (date de création, auteur…). Cela permet de faire le tri plus facilement et d’éviter d’ouvrir chaque document pour vérifier lequel est le bon. Le moteur de recherche permet donc de retrouver des informations si on ne sait pas où elles sont rangées. Mais il permet aussi d’accéder plus facilement aux documents dont on connaît l’emplacement. Plutôt que de devoir ouvrir cinq ou six sous-dossiers avant de pouvoir accéder au document que l’on désire, il est plus rapide d’ouvrir le moteur de recherche, de taper sa demande et d’accéder au document directement depuis l’interface de résultats.
  • 15. 12 Aujourd’hui, le système d’information de l’entreprise comprend plusieurs entrepôts de stockage : le ou les serveurs de fichiers partagés, le serveur de messagerie, des applications métiers spécifiques, des bases de données… Un moteur de recherche permet un accès unique à tous ces éléments du système d’information de l’entreprise. C’est un des principaux enjeux de ces outils à l’heure actuelle. D’ailleurs, plutôt que de parler de recherche d’information, certains préfèrent parler d’Accès Unifié à l’Information (en anglais UIA pour Unified Information Access). L’accès unifié à l’information vise à améliorer l’efficacité, la pertinence et la catégorisation de l’information lors des requêtes émises au sein d’une organisation. En plus d’un accès unique, les moteurs de recherche permettent aussi de mutualiser toutes ces informations. « Sortir l’information des silos » est une expression que l’on entend souvent à propos des moteurs de recherche. Il s’agit de retrouver automatiquement des liens entre les différentes informations stockées dans différents conteneurs. Voici un exemple de mise en relation d’information : je fais une recherche sur un client de mon entreprise en tapant son nom. Bien sûr le moteur de recherche me remonte tous les documents qui portent son nom. Mais ce client est aussi identifié sous un numéro client dans d’autres documents. Le moteur de recherche, qui a repéré la correspondance entre le nom et ce numéro client dans une base de données me remonte aussi les documents où apparaît le numéro de ce client. Les moteurs de recherche mettent donc en relation des données structurées et des données non structurées et peuvent leur donner du sens et même de les analyser pour en tirer ensuite des tableaux de bord ou des graphiques. Les données structurées sont des données organisées selon une structure qui facilite leur traitement automatique. Elles sont contenues entre autre dans les bases de données relationnelles. Les données structurées ne sont pas forcément accessibles aux humains. Les données non structurées sont les données provenant de documents texte, d’images, de sons… Elles peuvent être facilement analysées par des humains mais les machines ont du mal à les traiter. On constate donc qu’un moteur de recherche permet bien plus de choses que simplement indiquer où se trouvent informations et documents.
  • 16. 13 Quels sont les usages possibles d’un moteur de recherche d’entreprise ? La principale fonctionnalité d’un moteur de recherche est de permettre de retrouver de l’information. Mais ils peuvent faire plus que cela. Suivant la stratégie dans laquelle ils s’intègrent et suivant les fonctionnalités déployées, ils peuvent permettre de mettre en place différents scénarii d’utilisation. Rechercher de l’information L’utilisation la plus simple d’un moteur de recherche est de permettre de retrouver facilement et rapidement des informations dans un espace de stockage unique. Il s’agit de mettre en place un outil pour rechercher sur le serveur partagé de l’entreprise. C’est assez rapide et facile à mettre en œuvre. Dans le cas où plusieurs sources de données différentes doivent être indexées par le moteur, il faut s’assurer que l’on dispose bien des connecteurs nécessaires. Mettre en relation et enrichir les données Le projet est un cran au-dessus s’il s’agit de mettre en relation des données contenues dans différents entrepôts de stockage et de leur donner du sens les unes par rapports aux autres. Pour enrichir les données indexées, les moteurs de recherche se basent sur des vocabulaires métiers, des listes d’autorités, des thésaurus et autres référentiels terminologiques préexistants. Ces vocabulaires sont une aide à la recherche. L’utilisateur effectue sa recherche en langage naturel comme il en a l’habitude et l’outil réalise une correspondance avec les termes du vocabulaire pour ressortir les résultats correspondants. Ils permettent aussi d’établir des correspondances entres les données. J’ai cité un peu plus haut l’exemple de la mise en relation du nom du client et de son numéro d’identification. Les moteurs de recherche peuvent aussi établir des liens entre les concepts contenus dans les documents du moment que ces liens sont représentés dans les thésaurus et autres vocabulaires. Ils peuvent simplement servir à relier des acronymes avec leur forme développée. Par exemple, si j’indique au moteur de recherche que MSI veut dire management des systèmes d’information, que je tape comme requête une forme ou l’autre, il me remontera indifféremment les documents où figure l’un ou l’autre des termes. Plus élaboré : mon référentiel terminologique indique au moteur de recherche que le concept de bassin de vie est lié au concept bassin d’emploi. Si je fais une recherche pour remonter les documents traitant du concept de bassin de vie, l’outil est alors en mesure de me suggérer des documents parlant de bassin d’emploi. Pour ces deux exemples, si l’outil n’avais pas été en mesure d’établir des liens, il aurait fallu que je fasse deux recherches, pour autant qu’au préalable j’ai moi-même fait ces liens.
  • 17. 14 L’analyse sémantique, qui est de plus en plus intégrée à la recherche d’information, permet aussi d’enrichir les données et de faire remonter des résultats plus précis. Elle se base sur des cartouches de connaissances qui répertorient les principaux concepts d’un domaine de connaissance et les relations qu’il y a entre eux. Cela permet de donner au moteur de recherche les clés pour comprendre les documents, leur donner du sens et ainsi améliorer la recherche. Surveiller son environnement Les moteurs de recherche d’entreprise peuvent également être utilisés pour faire de la veille. Pour la veille, on pense surtout que les informations recherchées se trouvent en dehors de l’entreprise. Mais pas seulement. Eric Debonne estime que 50% de l’information utile à la veille est déjà disponible dans l’entreprise8 . On voit donc que faire de la veille c’est aussi explorer les sources de données de l’entreprise, tâche pour laquelle le moteur de recherche interne est tout à fait indiqué. Par ailleurs, certains moteurs de recherche offrent des services pour accéder à l’information en mode push, où l’information est transmise à l’utilisateur sous forme d’alerte automatique, sans qu’il ait besoin d’effectuer la requête. C’est par exemple le cas du moteur Polyspot qui propose de se créer des alertes mails pour une ou plusieurs requêtes. Cela permet vous permet d’être alerté automatiquement si un de vos collègue fait rentrer de nouvelles informations sur votre sujet de veille dans le système d’information de l’entreprise. Prendre des décisions Un autre domaine où un moteur de recherche a une carte à jouer est la Business Intelligence ou informatique décisionnelle. La Business Intelligence permet l’aide à la décision9 . Il s’agit d’analyser, à l’aide de solutions informatiques, de gros volumes de données afin d’en dégager des informations nouvelles sur lesquelles les décideurs peuvent s’appuyer pour prendre des décisions. 8 Eric Debonne, « Solutions dans la course à l’innovation » in Veille et recherche d’information sur le web – Guide pratique Archimag n°37, 2009. 9 http://www.christian-faure.net/2007/06/07/quand-le-search-bouscule-la-bi/
  • 18. 15 Les outils décisionnels regroupent les différentes sources de données de l’entreprise dans un « datawarehouse » afin de pouvoir y appliquer des traitements automatiques qui permettent ensuite de ressortir ces informations sous forme de rapports ou de graphiques ou autres outils de reporting. Les outils de Business Intelligence présentent plusieurs inconvénients :  Ils ont tendance à ne prendre en compte que les données structurées, alors que les données non structurées peuvent être plus nombreuses en volume et contenir également des informations intéressantes ;  Ils sont lourds à mettre en place ;  Ils nécessitent une phase d’apprentissage importante du fait des nombreux paramètres à prendre en compte dans la génération des rapports. Les moteurs de recherches sont prévus pour traiter des volumes de données de plus en plus importants. Mais ils ne sont pas seulement capables de ressortir des listes de résultats à partir d’une requête. Ils peuvent aussi analyser ces données et en ressortir des représentations. Par rapports aux outils de Business Intelligence traditionnels, ils présentent les avantages de prendre en compte les données non structurées et d’être facilement pris en main par les utilisateurs, grâce à leur interface simplifiée et intuitive. Même s’ils s’avèrent moins puissants que les outils dédiés10 Business Intelligence, ils sont de bons compléments à ces types d’outils et permettent de valoriser les informations de l’entreprise. Les moteurs de recherche d’Exalead et Sinequa proposent entre autres des fonctionnalités d’analyse de données de type décisionnel. 10 http://www.cio-online.com/contributions/lire-le-moteur-de-recherche-d-entreprise-quelles-cibles-320.html
  • 19. 16 Moteur de recherche d’entreprise, comment choisir ? Il existe des dizaines de moteurs de recherche d’entreprise. A première vue ce n’est pas toujours facile de déterminer l’outil qui nous conviendra le mieux. C’est pourtant un choix important à faire si on veut que l’outil soit utilisé. Et ce d’autant plus que l’on acquiert généralement un moteur de recherche pour plusieurs années. Les questions à se poser avant de choisir un moteur de recherche Voici un éventail des questions à se poser avant de choisir un moteur de recherche d’entreprise et des points à examiner. Bien sûr ces éléments sont génériques. Ils peuvent être complétés ou adaptés suivant le contexte. L’identification des besoins La première chose à faire est de se poser les questions : Qu’est-ce que je veux faire avec un moteur de recherche d’entreprise ? Pourquoi en ai-je besoin ? (Il faut d’ailleurs se poser ces questions pour toute mise en place d’un nouvel outil informatique.) Les scénarii d’utilisations dans la partie précédente peuvent aider à clarifier certains besoins. Impliquer les futurs utilisateurs en leur demandant de formaliser leurs besoins, comment ils voudraient pouvoir avoir accès à l’information peut être très intéressant. Cela peut permettre de mettre à jour des besoins auxquels personne n’avait pensé. Et les impliquer les rendra plus intéressés lorsque l’outil sera disponible. Une fois que l’on a cerné ses besoins, cela aide à choisir le type d’outil que l’on souhaite et les fonctionnalités nécessaires. Ce n’est pas la peine d’acheter un outil qui permet de créer des applications de recherche si on a seulement besoin de retrouver des documents dans un serveur de fichiers.
  • 20. 17 Faire l’inventaire des informations à indexer Il s’agit principalement de :  Savoir où les informations sont stockées : sur des serveurs de fichiers, dans des bases de données, dans des applications métiers, sur le web…  Déterminer leur volumétrie. Combien de giga ou de terra octets ces informations représentent-elles ? Dans certains cas, cela peut avoir un impact sur le prix de la solution. C’est également utile pour déterminer les caractéristiques techniques de l’infrastructure de recherche à mettre en place.  Connaître les caractéristiques de ces informations. Quels sont les formats (.doc, .htm, .ppt, .pptx, .docx, .xls, .xlsx, .odt, .psd, .indd, .ai…) ? Suivant les formats, les moteurs de recherche peuvent en indexer le contenu. Pour les documents bureautiques ou html, les moteurs de recherche peuvent généralement en indexer le contenu plein texte. Pour d’autres formats propriétaires, comme ceux de la suite Adobe Créative par exemple, c’est plus compliqué et les moteurs de recherche ne peuvent généralement pas indexer le contenu du document. Dans ce cas, il faut se tourner vers les métadonnées. Quelles sont les métadonnées disponibles ? Est-il pertinent de toutes les indexer ?  Se poser la question de la structuration des données et informations. Cela joue-t-il un rôle dans la recherche ? Les données sont-elles à mettre en relations les unes avec les autres ? Sont-elles à enrichir ? Si oui, existe-t-il déjà un ou plusieurs vocabulaires d’autorité ? Comment est-il possible de les intégrer dans l’outil ? Le multilinguisme Si les informations à indexer sont en différentes langues, il est intéressant de voir comment le moteur traite la question du multilinguisme. Le moteur de recherche est-il capable de différencier les langues des documents (dans le contenu ou les métadonnées) ? La plupart des moteurs de recherche d’entreprise en sont capables. La langue du document peut-elle être un critère de recherche ? Pour une requête en français le moteur de recherche est-il capable de faire remonter des informations correspondantes en anglais par exemple ? Les connecteurs disponibles Pour rappel, les connecteurs permettent au moteur de recherche de se brancher sur les différentes sources d’information à indexer. Les éditeurs disposent généralement d’un catalogue standard de connecteurs pour les sources les plus courantes (serveurs de fichiers, SharePoint, Lotus Note…). Plus le catalogue de connecteurs est étendu, plus il y a de chances pour que ceux correspondants à vos applications soient disponibles. Il faut néanmoins s’assurer que ces connecteurs peuvent gérer les
  • 21. 18 spécificités de votre système d’information. Sinon, l’éditeur pourra probablement développer des connecteurs sur mesure mais cela risque d’être du temps et du budget supplémentaires. Les différentes possibilités de recherche Les moteurs de recherche d’entreprise présentent tous les mêmes fonctionnalités principales au niveau de la recherche. Certaines sont néanmoins plus mises en avant que d’autres selon les outils. En ce qui concerne la recherche et l’affinage des résultats, un certain nombre de points peuvent être pris en compte. Les possibilités de recherche avancées. Quelles sont-elles ? Y-a-t-il un formulaire pour guider la recherche avancée ? Le moteur de recherche prend-il en compte les opérateurs de recherche avancée classique comme les opérateurs booléens (ET, OU, SAUF) ou de proximité (NEAR), la troncature, les parenthèses pour construire des équations de recherche ? Lesquelles de ces possibilités sont à privilégier, selon les utilisateurs (voir paragraphe suivant). Il y a aussi ce que j’appelle les facilitateurs de requêtes. Ce sont des fonctionnalités qui facilitent l’écriture de la requête par l’utilisateur : insensibilité à la casse, aux accents, aux pluriels, élimination des mots vides, correction orthographique, lemmatisation (action de regrouper les différentes formes que peut prendre un mot : nom, pluriel, verbe conjugué, infinitif…), auto-complétion... Capture d’écran du moteur de recherche Google avec la fonctionnalité d’auto-complétion La navigation par facettes. Une facette permet à l’utilisateur d’affiner successivement sa recherche en lui permettant de sélectionner directement sur la page de résultats du moteur des sous- catégories plus précises. Ces facettes peuvent être construites grâce à l’analyse des métadonnées ou bien par analyse sémantique ou extraction d’entités nommées. L’analyse sémantique permet d’extraire des concepts évoqués dans les documents. L’extraction d’entités nommées permet d’extraire des résultats les noms propres y figurant. Cette extraction peut être personnalisée selon les contextes.
  • 22. 19 Le moteur de recherche Exalead a été l’un des premiers moteurs web à proposer une navigation par facette à ses utilisateurs. Les utilisateurs de l’outil Qui seront les utilisateurs finaux de l’outil ? Sont-ils des professionnels de la recherche d’information ou des novices ? Les fonctionnalités à privilégier ne sont pas les même dans les deux cas. Si les utilisateurs sont des professionnels de la recherche d’information, ils peuvent utiliser des fonctions de recherche avancée directement dans la barre de recherche. S’il s’agit d’utilisateurs novices, on privilégiera plutôt des modes de recherche guidée avec formulaires, des fonctions visuelles comme les facettes et surtout la plus grande simplicité d’utilisation et la similarité avec les moteurs de recherche web. La gestion de la sécurité Tous les utilisateurs n’ont pas les mêmes droits d’accès selon les sources de données ou les types d’informations. Les moteurs de recherche d’entreprise intègrent une reconnaissance des utilisateurs par identifiant et mot de passe ce qui permet ensuite de déterminer à quelles informations ils auront le droit d’accéder ou non. Le moteur de recherche doit être capable de prendre en compte les différents droits des utilisateurs pour chaque source indexée et de les unifier pour un même utilisateur. Il y a deux méthodes pour assurer la sécurité des accès :  Soit le moteur récupère les droits de l’annuaire de l’entreprise  Soit il gère le schéma de contrôle en interne. L’une ou l’autre est à privilégier suivant le contexte d’utilisation.
  • 23. 20 En ce qui concerne la visibilité des documents selon les droits des utilisateurs, deux possibilités existent. Soit, quand il fait une recherche, l’utilisateur ne voit que les documents auxquels il a accès. Soit, il voit également les documents auxquels il n’a pas accès dans la liste des résultats mais cela n’a pas les possibilités d’y accéder. Cette deuxième solution peut présenter l’avantage d’élargir la circulation de l’information dans l’entreprise. Des droits d’accès ont été définis à l’arrivé du salarié dans l’entreprise, celui-ci a évolué dans son poste mais personne n’a pensé à modifier ses droits d’accès aux informations. Le fait que le salarié puisse voir ces informations et savoir qu’elles existent peut lui permettre de demander à ce qu’on lui élargisse ses droits d’accès. Quelles que soit les solutions choisies pour la gestion de la sécurité, il ne faudra pas oublier de faire des tests avec les profils de différents utilisateurs pour s’assurer que tout fonctionne correctement avant le déploiement complet de l’outil. Vérifier régulièrement que les droits d’accès sont toujours bien paramétrer peut aussi être nécessaire. Il peut arriver que cela bouge. Les possibilités de personnalisation Les éditeurs de solutions de recherche proposent des outils standardisés, avec plus ou moins de possibilités de personnalisation. Il convient d’abord de s’assurer que l’outil choisi pourra s’intégrer dans le système d’information de l’entreprise. Quels sont les possibilités de personnalisation de l’outil ? Elles sont à examiner aussi bien au niveau de l’apparence de l’outil, de l’ergonomie, de l’apparence graphique, que des possibilités d’administration et d’ajout d’applications. Panorama de l’offre Quelle est l’offre des éditeurs en matière de moteur de recherche ? Le marché des logiciels de recherche d’entreprise est assez mouvant. Si vous vous basez sur un panorama de l’offre de plus de deux ans, vérifiez bien que les éditeurs existent encore et qu’ils proposent bien toujours les mêmes types d’outils. Ils peuvent avoir évolués ou s’être fait racheter. Voici une liste d’éditeurs d’outils de recherche et une brève présentation de leurs solutions. Cette liste n’est pas exhaustive et les présentations sont principalement issues des sites web des éditeurs. Il ne s’agit pas de faire de la pub à tel ou tel éditeur mais de donner des pistes.
  • 24. 21 Polyspot Editeur français L’éditeur Polyspot propose des solutions propriétaires basées sur les solutions de recherche open source Lucene et Solr, deux projets de la fondation Apache. Via son produit Polyspot Enterprise Search, Polyspot offre un accès unifié aux données de l’entreprise via des vues informationnelles, interfaces correspondants à différentes applications de recherche. Cela permet de proposer aux utilisateurs des accès aux informations suivant différents aspects de leur activité. Polyspot Enterprise Search intègre les fonctionnalités classiques de recherche d’information (suggestion orthographique, auto-complétion, recherche par facette…), ainsi que des fonctionnalités d’alertes et de collaboration. Pour en savoir plus11 Exalead Editeur français Les produits d’Exalead reposent sur une technologie propriétaire. Exalead CloudView est une infrastructure de recherche qui permet qui permet de créer des applications orientées recherche (SBA – Search Based Applications). Le développement d’applications se fait par glisser-déposer et est accessible sans avoir besoin de notions de programmation. Exalead CloudView dispose de fonctionnalités de recherche plein texte, d’affichage dynamique des résultats, de recherche par facettes et de Business Intelligence. Pour en savoir plus 12 11 http://www.polyspot.com/produits/polyspot-enterprise-search.html 12 http://www.3ds.com/fr/products/exalead/products/exalead-cloudview/overview/
  • 25. 22 Doculibre Editeur canadien Doculibre propose un moteur de recherche entièrement open source, basé sur Lucene et Solr. L’outil Constellio propose les fonctionnalités de recherche classiques et permet de fédérer toutes les sources d’informations de l’entreprise via une seule interface de recherche. Constellio présente les avantages des produits open sources, à savoir pas de frais de licence, pas de limites d’utilisateurs, ni de documents indexés et une personnalisation illimitée par le biais de développement supplémentaires. Il existe un intégrateur français de Constellio : France Labs. Pour en savoir plus13 Sinequa Editeur français Sinequa propose des solutions de recherche qui permettent l’accès unifié à l’information et la prise en compte du Big Data avec des possibilités d’analyse de données. Sinequa récupère les informations de différentes sources et y applique des traitements statistiques, sémantiques et linguistiques pour permettre d’enrichir les données et de les analyser. La plateforme Sinequa permet également de créer ses propres applications orientées recherche (SBA). Pour en savoir plus14 Google Enterprise Editeur américain Google propose une solution de recherche d’entreprise clé en main : Google Enterprise search. Il s’agit d’une appliance reposant sur la technologie de Google en matière de recherche d’information. 13 http://constellio.com/ 14 http://www.sinequa.com/fr/page/produit/produit.aspx
  • 26. 23 Cet outil permet de rechercher dans plusieurs sources d’informations et dispose de plusieurs fonctionnalités de recherche comme l’exploitation des métadonnées, la gestion du multilinguisme, des alertes, des suggestions de recherche, prise en compte des problématiques du cloud et de la mobilité… Il permet en outre de bénéficier de la simplicité d’utilisation des produits Google. Par contre, il ne dispose pas de fonctionnalités d’enrichissement et d’analyse des données, ni de possibilités de personnalisation. Pour en savoir plus15 Antidot Editeur français Antidot propose plusieurs outils de recherche, pour sites web et e-commerce ou pour l’entreprise. ASF@Enterprise est une plateforme qui permet un accès unifié à l’information de l’entreprise et propose aussi des fonctions collaboratives. Les solutions Antidot disposent également de briques technologiques permettant l’enrichissement des données. Pour en savoir plus16 Autonomy Filliale de Hewlett-Packard Autonomy propose des produits permettant la recherche dans les contenus structurés et non structurés, ainsi que la prise en compte du Big Data. Leurs outils disposent de fonctions de recherche avancées, de fonctionnalités d’analyse des données grâces à des taxonomies ou de l’analyse et de la classification des données et des possibilités de personnalisation et de collaboration. Pour en savoir plus17 15 http://www.google.fr/enterprise/search/campaigns/gsa7.html 16 http://www.antidot.net/fr/Solutions 17 http://www.autonomy.com/content/Functionality/administration/index.en.html
  • 27. 24 Arisem Editeur français Arisem propose des solutions de veille et de moteur de recherche. En matière de moteur de recherche, Arisem ne fournit pas de solution de recherche à proprement parler mais propose des composants logiciels d’analyse et enrichissement de données à associer à d’autres outils pour leur faire bénéficier de fonctionnalités de text-minnig et d’analyse sémantique. Arisem est, entre autre, partenaire de Polyspot. Pour en savoir plus18 18 http://www.arisem.com/?q=fr/solutions/suite-eidon
  • 28. 25 Pour conclure Les systèmes d’information des entreprises regorgent d’informations et de données peu exploitées, faute de pouvoir y accéder facilement. Les moteurs de recherche d’entreprise se présentent comme LA solution pour mettre en valeur ces données et gagner en efficacité. C’est vrai, ils peuvent rendre de bons services, surtout quand ils disposent de fonctionnalités adaptées aux besoins des utilisateurs. Mais il ne faut pas perdre de vue que les moteurs de recherche sont avant tout des outils et que leur efficacité dépend en grande partie de l’utilisation qui en est faite. Aussi simple d’utilisation soient-ils, il ne faut pas négliger la formation des utilisateurs, ne serait-ce que pour leur présenter l’outil. Les moteurs de recherche permettent d’accéder à des informations, mais ils ne s’occupent pas de la gestion de ces informations. Nettoyer les entrepôts d’informations pour en retirer les documents arrivés en fin de vie, éliminer les doublons, renseigner les métadonnées pour qualifier les informations… Un moteur de recherche ne dispense pas de toutes ces tâches, même s’il peut, dans certains cas, les faciliter. Pour conclure, je dirais que les moteurs de recherche peuvent s’avérer très utiles mais qu’ils ne sont pas la panacée à tous les problèmes informationnels de l’entreprise. Comme tous les outils informatiques, ils ont des limites19 . 19 http://pro.01net.com/editorial/541266/le-moteur-de-recherche-dentreprise/
  • 29. 26 Sources Voici les sources que j’ai utilisées pour ce dossier. N’hésitez pas à les consulter pour approfondir certains points. BREBION Patrick. La recherche en entreprise se professionnalise.2006. [en ligne] Disponible sur < http://pro.01net.com/editorial/331269/la-recherche-en-entreprise-se-professionnalise/> (Dernière consultation le 10/03/2013). DARDANT Frédéric. Le moteur de recherche d’entreprise, quelles cibles ? 2009. [en ligne] Disponible sur < http://www.cio-online.com/contributions/lire-le-moteur-de-recherche-d-entreprise-quelles- cibles-320.html> (Dernière consultation le 10/03/2013). DEBONNE Eric. Moteur de recherche versus entreprise : Quelles sont les différences des moteurs de recherche Internet et en entreprise ? 2007. [en ligne] Disponible sur < http://www.solaci.com/blog/2007/11/moteur-de-recherche-internet-versus.html> (Dernière consultation le 10/03/2013). DEBONNE Eric, « Solutions dans la course à l’innovation » in Veille et recherche d’information sur le web – Guide pratique Archimag n°37, 2009. FAURE Christian. Choisir un moteur de recherche pour l’entreprise. 2006. [en ligne] Disponible sur < http://www.christian-faure.net/2006/09/10/choisir-un-moteur-de-recherche-pour-lentreprise/> (Dernière consultation le 10/03/2013). FAURE Christian. Quand le « Search » bouscule la « Business Intelligence ». 2007. [en ligne] Disponible sur < http://www.christian-faure.net/2007/06/07/quand-le-search-bouscule-la-bi/> (Dernière consultation le 10/03/2013). FAURE Christian. Quelques évidences sur le moteur de recherche. 2006. [en ligne] Disponible sur < http://www.christian-faure.net/2006/09/23/quelques-vidences-sur-le-moteur-de-recherche/> (Dernière consultation le 10/03/2013). FERRE Jean. Desktop search et Moteur de Recherche d’Entreprise : à ne pas mélanger. 2009. [en ligne] Disponible sur < http://jean-ferre.blogspot.fr/2009/02/desktop-search-et-moteur-de- recherche.html> (Dernière consultation le 10/03/2013). FREYERMUTH Jérôme, GUIZIOU Erwan. Le moteur de recherche : Clé de voûte du système d’information. VOIRIN Consultants & Conseils ATELYA, 2012. [en ligne] Disponible sur < http://www.voirin-consultants.com/fr/management/actualites/publications/livres-blancs/le-moteur- de-recherche> (Dernière consultation le 10/03/2013). JUNQ Marie. Bien choisir un moteur de recherche d’entreprise. 2009. [en ligne] Disponible sur < http://pro.01net.com/editorial/402884/bien-choisir-un-moteur-de-recherche-dentreprise/> (Dernière consultation le 10/03/2013).
  • 30. 27 JUNQ Marie. Le moteur de recherche d’entreprise. 2011. [en ligne] Disponible sur < http://pro.01net.com/editorial/541266/le-moteur-de-recherche-dentreprise/> (Dernière consultation le 10/03/2013). LEFASSY Olivier. Moteur de recherche transverse d’entreprise : pour plus de pertinence, croisez les référentiels ! 2011. [en ligne] Disponible sur < http://lecercle.lesechos.fr/entreprises-marches/high- tech-medias/internet/221136539/moteur-recherche-transverse-entreprise-plus-> (Dernière consultation le 10/03/2013). PREVERAUD Jean-François. Sémantique : choisir le bon moteur de recherche pour son entreprise.2013. [en ligne] Disponible sur < http://www.industrie-techno.com/semantique-choisir-le- bon-moteur-de-recherche-pour-son-entreprise.22866> (Dernière consultation le 10/03/2013). STEPHAN Thibaut. Les 7 critères de choix d’un moteur de recherche. 2013. [en ligne] Disponible sur < http://www.serdalab.com/article/2013/2/25/les-7-criteres-de-choix-dun-moteur-de-recherche-de/> (Dernière consultation le 10/03/2013). VANNESTE Xavier. Le moteur de recherche dans l’entreprise. 2011. [en ligne] Disponible sur < http://blog.xvanneste.com/Lists/Billets/Post.aspx?ID=81> (Dernière consultation le 10/03/2013). La web TV du salon Documation a mis en ligne des conférences thématiques enregistrées lors des différents salons. Certaines étaient consacrées à la recherche en entreprise. Elles présentent des cas d’utilisations concrets d’outils de recherche en entreprise. L’Accès unifié à l’Information : le nouveau marché du Search en entreprise avec Sinequa et Locarchives. 21/03/2012 Disponible sur < http://www.documation.tv/ct-2012-sinequa-et-locarchives-29.html > Organiser l’accessibilité de l’information dans l’entreprise avec Polyspot et Magillem. 21/03/2012 Disponible sur < http://www.documation.tv/ct-2012-polyspot-et-magillem-30.html> Un moteur de recherche au centre du poste de travail. Créer une vue à 360° d’un sujet. 24/03/2011 Disponible sur < http://www.documation.tv/ct-2011-3-moteur-de-recherche-20.html>