Etablir le business case de vos projets - VCM Conseil
ANTIDOT - De la « recherche fédérée de documents » au véritable « accès unifié à l’information »
1. De la « recherche fédérée de documents »
au véritable « accès unifié à l’information »
Documation 2011 - Paris
2. SOCIÉTÉ ANTIDOT
Editeur logiciel
depuis 1999 | Paris, Lyon, Aix-en-Provence
Solution de recherche et d’accès à l’information
eCommerce | Portails | Média | Entreprises
Produits (SaaS ou licence)
AIF : workflow de valorisation des données
AFS : moteur de recherche
CKS : services collaboratifs
2
4. PLAN
Le problème La réponse La solution Un exemple
Les limites de
Penser l’accès à Capter, Penser,Le projet
la « recherche
l’information Valoriser, Isidore
fédérée » de un espace
dans Exposer (TGE Adonis
documentsunifié l’information CNRS)
4
5. Les limites de la recherche fédérée de documents
LE PROBLÈME
6. LES DIFFICULTÉS DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »
Des silos de
données cloisonnés Des données hétérogènes
Des référentiels Une terminologie
épars et incomplets subjective
6
8. LES LIMITES DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »
Recette de cuisine de la recherche fédérée
Collectez Indexez Servez
8
9. AU MIEUX, UNE JUXTAPOSITION DE DOCUMENTS
L’utilisateur n’est pas acteur de sa recherche.
9
10. Penser l’accès à l’information dans un espace unifié et enrichie
LA REPONSE
11. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Créer la cohérence et lier les données par l’utilisation de référentiels
Référentiels
terminologiques
Traces,
annotations,
sélection
des utilisateurs
Annuaire
d’entreprise
11
12. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Créer une cohérence et de l’information
par la mise en relation des différents silos
12
13. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS
Utiliser la nature des données sources
fait
et réf
a
suj ére
po
o ur nce
ur
ap à
su
je
t
cite inclut
CR de Fiche Courriel page Web
réunion produit r
t eu
et ire
aut
aut
eur ém ata
eur
par tin eà
ticip s enc
ant de fér
t ré
fa i
une personne
13
14. PENSER UN WORKFLOW DE TRAITEMENT DES DONNÉES
Processus d’enrichissement adapté aux données
s’appuyant sur les référentiels
Entrepôt RDF
(Linked Data)
Enrichissement
Captation Sémantisation
Content
Repository
Normalisation Classification
Annotation
Indexation Moteur de
recherche AFS
14
15. S’APPUYER SUR LES TECHNOLOGIES DU WEB SÉMANTIQUE
Un cadre d’interopérabilité pour mettre à disposition,
consulter, lier et partager des données
Un mécanisme
Un protocole Un principe Un « langage »
d’identification
HTTP URL/URI L’hypertexte RDF
15
16. LE MOTEUR DE RECHERCHE : HUB DE L’ACCÈS UNIFIÉ À
L’INFORMATION
16
20. ANTIDOT INFORMATION FACTORY
Antidot Information Factory : un outil
industriel et évolutif
Une chaîne de Un cadre de Un modèle
captation développement d’Unité Documentaire
et de traitement
20
21. AIF : UNE CHAÎNE DE TRAITEMENT
Créer des chaînes de traitement de données par assemblage de
modules
Sources de Module Modules de transformation
données connecteur et enrichissement
21
22. AIF : UN CADRE DE DÉVELOPPEMENT
Un cadre de développement pour construire des modules
50+ filtres prêts à l’emploi +
Un environnement d’exécution
22
23. AIF : UN MODÈLE D’UNITÉ DOCUMENTAIRE
Le document
est composite
est dynamique
évolue dans le temps
est un objet géré
de façon unifiée
23
24. AIF ET LE WEB SÉMANTIQUE
AIF met le Web sémantique au service de la gestion de
l’information en entreprise
Support des standards SKOS, OWL, RDF, SparQL dans AIF
Indexation du RDF
Intégration native :
Thésaurus Software
Software
Publisher
Publisher
type
Taxonomies
Règles d’inférence label
antidot
loves
w3c:RDF
w3c:RDF
Antidot
antidot a :publisher ;
:loves w3c:RDF .
24
38. Le projet Isidore
UN EXEMPLE
Stéphane Pouyllau, TGE Adonis (CNRS)
@spouyllau
http://www.lespetitescases.net
39. LE TRÈS GRAND ÉQUIPEMENT ADONIS (CNRS)
Le Très grand
équipement du CNRS
pour les sciences
humaines et sociales
Adonis : Accès unifié
aux données et
documents
numériques des
sciences humaines et
sociales
www.tge-adonis.fr
39
40. LES OBJECTIFS DU TGE ADONIS
3 axes :
Accès aux données :
ISIDORE
Accompagnement des
communautés scientifiques
en matière de numériques :
données > publications
Stockage et archivage à
long terme des données
numériques
40
41. LES BESOINS D’ISIDORE
Donner accès à des données numériques réparties
Des données structurées pour qualifier du texte intégral
En entrée : utilisation de standards internationaux
En sortie : données enrichies et normalisées (RDF + Sparql)
Enrichissement : plusieurs traitements/multiples référentiels
entrant plusieurs couches de traitements
Construire un « hub » pour les métadonnées et les données des
SHS
Proposer des services d'accès aux données multiples :
• IHM Web
• API
• Triple store RDF
41
42. LES ENJEUX D’ISIDORE
Valoriser le travail de structuration scientifique (humains) sur les
méta-données pour qualifier les données non structurées
Replacer l'expertise humaines et le savoir scientifique dans les données en ligne
Enrichir les méta-données et les données
Vers de nouveaux champs de recherche
Les ré-exposer selon les principes du linked data dans le web de
données
Ouverture des données publiques de la recherche en sciences
humaines et sociales
42
44. PERSPECTIVES : DANS TOUT CONTEXTE D’ENTREPRISE
Indexation
Service de
recherche
AFS
Export
Document Content repository
Manager
génération
du RDF
Entrepôts RDF
SPARQL endpoint
44
45. Merci pour votre attention
Venez échanger avec nous
et découvrez AIF, AFS et CKS
sur le stand E 16