SlideShare una empresa de Scribd logo
1 de 45
Descargar para leer sin conexión
De la « recherche fédérée de documents »
au véritable « accès unifié à l’information »

              Documation 2011 - Paris
SOCIÉTÉ ANTIDOT

  Editeur logiciel
      depuis 1999 | Paris, Lyon, Aix-en-Provence

  Solution de recherche et d’accès à l’information
     eCommerce | Portails | Média | Entreprises

  Produits (SaaS ou licence)
     AIF : workflow de valorisation des données
     AFS : moteur de recherche
     CKS : services collaboratifs




                                                     2
PARMI NOS CLIENTS

     Entreprises    Média   eCommerce




     Institutions

                    Santé




                                        3
PLAN




Le problème   La réponse         La solution   Un exemple




 Les limites de
             Penser l’accès à   Capter, Penser,Le projet
 la « recherche
             l’information      Valoriser,       Isidore
 fédérée » de un espace
             dans               Exposer     (TGE Adonis
 documentsunifié                l’information     CNRS)
                                                           4
Les limites de la recherche fédérée de documents

LE PROBLÈME
LES DIFFICULTÉS DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »

        Des silos de
     données cloisonnés            Des données hétérogènes




       Des référentiels               Une terminologie
     épars et incomplets                 subjective




                                                             6
LE MOTEUR DE RECHERCHE : UN OUTIL MIRACLE ?




                                              7
LES LIMITES DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS »

          Recette de cuisine de la recherche fédérée




  Collectez             Indexez                  Servez


                                                          8
AU MIEUX, UNE JUXTAPOSITION DE DOCUMENTS

        L’utilisateur n’est pas acteur de sa recherche.




                                                          9
Penser l’accès à l’information dans un espace unifié et enrichie

LA REPONSE
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS

Créer la cohérence et lier les données par l’utilisation de référentiels




                                                           Référentiels
                                                         terminologiques
        Traces,
      annotations,
       sélection
     des utilisateurs


                                                   Annuaire
                                                  d’entreprise
                                                                           11
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS



      Créer une cohérence et de l’information
     par la mise en relation des différents silos




                                                    12
MODÉLISER, LIER ET ANNOTER LES INFORMATIONS

             Utiliser la nature des données sources


                                                                          fait
                                et                                               réf




                                                          a
                             suj                                                    ére




                                                              po
                    o   ur                                                             nce




                                                                ur
                 ap                                                                        à




                                                                   su
                                                                     je
                                                                       t
                  cite                               inclut


   CR de                             Fiche                        Courriel                     page Web
   réunion                           produit                          r
                                                                  t eu
                                                               et        ire
                                           aut
                    aut
                         eur                              ém          ata
                                               eur

               par                                                 tin                 eà
                  ticip                                           s                 enc
                        ant                                     de               fér
                                                                             t ré
                                                                         fa i




                                           une personne

                                                                                                          13
PENSER UN WORKFLOW DE TRAITEMENT DES DONNÉES

   Processus d’enrichissement adapté aux données
           s’appuyant sur les référentiels


                                                                    Entrepôt RDF
                                                                    (Linked Data)
                   Enrichissement
       Captation                      Sémantisation
                                                                    Content
                                                                    Repository

         Normalisation                Classification
                         Annotation


                                                       Indexation    Moteur de
                                                                     recherche AFS




                                                                                     14
S’APPUYER SUR LES TECHNOLOGIES DU WEB SÉMANTIQUE

   Un cadre d’interopérabilité pour mettre à disposition,
          consulter, lier et partager des données


               Un mécanisme
Un protocole                      Un principe    Un « langage »
               d’identification




   HTTP           URL/URI         L’hypertexte       RDF




                                                                  15
LE MOTEUR DE RECHERCHE : HUB DE L’ACCÈS UNIFIÉ À
L’INFORMATION




                                                   16
CRÉER DE LA VALEUR POUR LES UTILISATEURS




                                           17
Capter, penser, valoriser, exposer l’information

LA SOLUTION
Capter, valoriser et traiter l’information

ANTIDOT INFORMATION FACTORY
ANTIDOT INFORMATION FACTORY

       Antidot Information Factory : un outil
                industriel et évolutif

   Une chaîne de       Un cadre de        Un modèle
      captation      développement   d’Unité Documentaire
  et de traitement




                                                        20
AIF : UNE CHAÎNE DE TRAITEMENT

  Créer des chaînes de traitement de données par assemblage de
  modules



   Sources de     Module      Modules de transformation
    données     connecteur       et enrichissement




                                                                 21
AIF : UN CADRE DE DÉVELOPPEMENT

  Un cadre de développement pour construire des modules
  50+ filtres prêts à l’emploi +
  Un environnement d’exécution




                                                          22
AIF : UN MODÈLE D’UNITÉ DOCUMENTAIRE

Le document
     est composite
     est dynamique
     évolue dans le temps
     est un objet géré
     de façon unifiée




                                       23
AIF ET LE WEB SÉMANTIQUE

AIF met le Web sémantique au service de la gestion de
l’information en entreprise

     Support des standards SKOS, OWL, RDF, SparQL dans AIF
     Indexation du RDF
     Intégration native :
        Thésaurus                 Software
                                  Software
                                  Publisher
                                  Publisher
                                          type
        Taxonomies
        Règles d’inférence            label
                                               antidot
                                                       loves
                                                               w3c:RDF
                                                               w3c:RDF




                                       Antidot
                                                 antidot a :publisher ;
                                                   :loves w3c:RDF .




                                                                          24
Rechercher l’information

ANTIDOT FINDER SUITE
AFS V7 QUERY ENGINE

  Recherche plein texte avec fonctions linguistiques :
     extension automatique
     suggestion orthographique
     expressions contextuelles




                                                         26
AFS V7 QUERY ENGINE

  Recherche phonétique




                         27
AFS V7 QUERY ENGINE

  Autocomplétion intelligente pendant la saisie de la requête




                                                                28
AFS V7 QUERY ENGINE

  Recherche multicritères avancée




                                    29
AFS V7 QUERY ENGINE

  Recherche à facettes




                         30
AFS V7 QUERY ENGINE

  Tag clouds : nuage de mots-clés les plus utilisés dans le corpus




                                                                     31
AFS V7 QUERY ENGINE

  Construction de requêtes à partir des métadonnées d’une fiche




                                                                  32
AFS V7 QUERY ENGINE

  Catégorisation : classification automatique des
  documents selon une taxonomie donnée




                                                    33
Annoter et partager l’information

COLLABORATIVE KNOWLEDGE SUITE
CKS : RECHERCHE COLLABORATIVE

  Capitaliser
  Enregistrer
     Requêtes
     Réponses
  Organiser
     Dossiers
     Tags




                                35
Exposer l’information

ANTIDOT CONTENT REPOSITORY
RENDRE ACCESSIBLE LES CONTENUS ENRICHIS PAR AIF


                             API Web




                           Linked Data

                                                  37
Le projet Isidore

UN EXEMPLE
                    Stéphane Pouyllau, TGE Adonis (CNRS)
                                                @spouyllau
                             http://www.lespetitescases.net
LE TRÈS GRAND ÉQUIPEMENT ADONIS (CNRS)


    Le Très grand
    équipement du CNRS
    pour les sciences
    humaines et sociales
    Adonis : Accès unifié
    aux données et
    documents
    numériques des
    sciences humaines et
    sociales
    www.tge-adonis.fr

                                         39
LES OBJECTIFS DU TGE ADONIS


 3 axes :
   Accès aux données :
   ISIDORE
   Accompagnement des
   communautés scientifiques
   en matière de numériques :
   données > publications
   Stockage et archivage à
   long terme des données
   numériques




                                40
LES BESOINS D’ISIDORE

 Donner accès à des données numériques réparties
    Des données structurées pour qualifier du texte intégral
    En entrée : utilisation de standards internationaux
    En sortie : données enrichies et normalisées (RDF + Sparql)

  Enrichissement : plusieurs traitements/multiples référentiels
 entrant plusieurs couches de traitements

  Construire un « hub » pour les métadonnées et les données des
 SHS

 Proposer des services d'accès aux données multiples :
 • IHM Web
 • API
 • Triple store RDF
                                                                  41
LES ENJEUX D’ISIDORE

 Valoriser le travail de structuration scientifique (humains) sur les
 méta-données pour qualifier les données non structurées
    Replacer l'expertise humaines et le savoir scientifique dans les données en ligne


 Enrichir les méta-données et les données
    Vers de nouveaux champs de recherche

  Les ré-exposer selon les principes du linked data dans le web de
 données
    Ouverture des données publiques de la recherche en sciences
    humaines et sociales




                                                                                        42
Perspectives au contexte des entreprises

EN GUISE DE CONCLUSION
PERSPECTIVES : DANS TOUT CONTEXTE D’ENTREPRISE




                                        Indexation
                                                             Service de
                                                             recherche
                                                                AFS



                                                Export
                                              Document   Content repository
                                               Manager
                                        génération
                                         du RDF




                                                           Entrepôts RDF
                                                          SPARQL endpoint
                                                                          44
Merci pour votre attention

 Venez échanger avec nous
et découvrez AIF, AFS et CKS
      sur le stand E 16

Más contenido relacionado

Más de Documation Gestion de l'information et du document numérique en entreprise

Más de Documation Gestion de l'information et du document numérique en entreprise (20)

SCENARI - Scenari 4 comment optimiser la rédaction collaborative et la gestio...
SCENARI - Scenari 4 comment optimiser la rédaction collaborative et la gestio...SCENARI - Scenari 4 comment optimiser la rédaction collaborative et la gestio...
SCENARI - Scenari 4 comment optimiser la rédaction collaborative et la gestio...
 
Mondeca - Smart content ou comment rendre vos contenus plus intelligents par...
Mondeca  - Smart content ou comment rendre vos contenus plus intelligents par...Mondeca  - Smart content ou comment rendre vos contenus plus intelligents par...
Mondeca - Smart content ou comment rendre vos contenus plus intelligents par...
 
Klee Group / Spark Archives - Gel des documents & e-discovery - comment arch...
Klee Group /  Spark Archives - Gel des documents & e-discovery - comment arch...Klee Group /  Spark Archives - Gel des documents & e-discovery - comment arch...
Klee Group / Spark Archives - Gel des documents & e-discovery - comment arch...
 
KODAK - Gestion documentaire enrichie pour SharePoint 2010 - capture, recher...
KODAK  - Gestion documentaire enrichie pour SharePoint 2010 - capture, recher...KODAK  - Gestion documentaire enrichie pour SharePoint 2010 - capture, recher...
KODAK - Gestion documentaire enrichie pour SharePoint 2010 - capture, recher...
 
ISIS PAPYRUS - Comment optimiser la gestion des cas dossiers pour améliorer...
ISIS PAPYRUS   - Comment optimiser la gestion des cas dossiers pour améliorer...ISIS PAPYRUS   - Comment optimiser la gestion des cas dossiers pour améliorer...
ISIS PAPYRUS - Comment optimiser la gestion des cas dossiers pour améliorer...
 
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
INGE COM - Optimisez vos processus métiers en dématérialisant vos courriers e...
 
FLA Consultants - Présentation des principaux serveurs agrégateurs
FLA Consultants  - Présentation des principaux serveurs agrégateursFLA Consultants  - Présentation des principaux serveurs agrégateurs
FLA Consultants - Présentation des principaux serveurs agrégateurs
 
ESKER - Diminuez vos coûts et augmentez votre productivité en dématérialisant...
ESKER - Diminuez vos coûts et augmentez votre productivité en dématérialisant...ESKER - Diminuez vos coûts et augmentez votre productivité en dématérialisant...
ESKER - Diminuez vos coûts et augmentez votre productivité en dématérialisant...
 
Coexel - Retour d'expérience du centre national RFID mytwip® – solution col...
Coexel  - Retour d'expérience  du centre national RFID mytwip® – solution col...Coexel  - Retour d'expérience  du centre national RFID mytwip® – solution col...
Coexel - Retour d'expérience du centre national RFID mytwip® – solution col...
 
Campana & Schott - MS Project et SharePoint Serve, des projets plus performa...
Campana & Schott  - MS Project et SharePoint Serve, des projets plus performa...Campana & Schott  - MS Project et SharePoint Serve, des projets plus performa...
Campana & Schott - MS Project et SharePoint Serve, des projets plus performa...
 
Calinda Software - Comment accélérer le déploiement et l'adoption progressive...
Calinda Software - Comment accélérer le déploiement et l'adoption progressive...Calinda Software - Comment accélérer le déploiement et l'adoption progressive...
Calinda Software - Comment accélérer le déploiement et l'adoption progressive...
 
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
Bentley Systems - Les avantages de Project Wise, solution logicielle permetta...
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
ADBS & Veille Magazine - Pratiques et usages de l'information professionnelle...
ADBS & Veille Magazine - Pratiques et usages de l'information professionnelle...ADBS & Veille Magazine - Pratiques et usages de l'information professionnelle...
ADBS & Veille Magazine - Pratiques et usages de l'information professionnelle...
 
ERIC Archivage et MULTIGEST
ERIC Archivage et MULTIGESTERIC Archivage et MULTIGEST
ERIC Archivage et MULTIGEST
 
Icônes et images dans l'information - Google
Icônes et images dans l'information - Google Icônes et images dans l'information - Google
Icônes et images dans l'information - Google
 
L'offre DOCAPOST
L'offre DOCAPOSTL'offre DOCAPOST
L'offre DOCAPOST
 
La contractualisation électronique en ligne et sur point de vente
La contractualisation électronique en ligne et sur point de venteLa contractualisation électronique en ligne et sur point de vente
La contractualisation électronique en ligne et sur point de vente
 
Les clés financières pour réussir votre projet de dématérialisation - Serda
Les clés financières pour réussir votre projet de dématérialisation - SerdaLes clés financières pour réussir votre projet de dématérialisation - Serda
Les clés financières pour réussir votre projet de dématérialisation - Serda
 
Etablir le business case de vos projets - VCM Conseil
Etablir le business case de vos projets - VCM ConseilEtablir le business case de vos projets - VCM Conseil
Etablir le business case de vos projets - VCM Conseil
 

ANTIDOT - De la « recherche fédérée de documents » au véritable « accès unifié à l’information »

  • 1. De la « recherche fédérée de documents » au véritable « accès unifié à l’information » Documation 2011 - Paris
  • 2. SOCIÉTÉ ANTIDOT Editeur logiciel depuis 1999 | Paris, Lyon, Aix-en-Provence Solution de recherche et d’accès à l’information eCommerce | Portails | Média | Entreprises Produits (SaaS ou licence) AIF : workflow de valorisation des données AFS : moteur de recherche CKS : services collaboratifs 2
  • 3. PARMI NOS CLIENTS Entreprises Média eCommerce Institutions Santé 3
  • 4. PLAN Le problème La réponse La solution Un exemple Les limites de Penser l’accès à Capter, Penser,Le projet la « recherche l’information Valoriser, Isidore fédérée » de un espace dans Exposer (TGE Adonis documentsunifié l’information CNRS) 4
  • 5. Les limites de la recherche fédérée de documents LE PROBLÈME
  • 6. LES DIFFICULTÉS DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS » Des silos de données cloisonnés Des données hétérogènes Des référentiels Une terminologie épars et incomplets subjective 6
  • 7. LE MOTEUR DE RECHERCHE : UN OUTIL MIRACLE ? 7
  • 8. LES LIMITES DE « LA RECHERCHE FÉDÉRÉE DE DOCUMENTS » Recette de cuisine de la recherche fédérée Collectez Indexez Servez 8
  • 9. AU MIEUX, UNE JUXTAPOSITION DE DOCUMENTS L’utilisateur n’est pas acteur de sa recherche. 9
  • 10. Penser l’accès à l’information dans un espace unifié et enrichie LA REPONSE
  • 11. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS Créer la cohérence et lier les données par l’utilisation de référentiels Référentiels terminologiques Traces, annotations, sélection des utilisateurs Annuaire d’entreprise 11
  • 12. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS Créer une cohérence et de l’information par la mise en relation des différents silos 12
  • 13. MODÉLISER, LIER ET ANNOTER LES INFORMATIONS Utiliser la nature des données sources fait et réf a suj ére po o ur nce ur ap à su je t cite inclut CR de Fiche Courriel page Web réunion produit r t eu et ire aut aut eur ém ata eur par tin eà ticip s enc ant de fér t ré fa i une personne 13
  • 14. PENSER UN WORKFLOW DE TRAITEMENT DES DONNÉES Processus d’enrichissement adapté aux données s’appuyant sur les référentiels Entrepôt RDF (Linked Data) Enrichissement Captation Sémantisation Content Repository Normalisation Classification Annotation Indexation Moteur de recherche AFS 14
  • 15. S’APPUYER SUR LES TECHNOLOGIES DU WEB SÉMANTIQUE Un cadre d’interopérabilité pour mettre à disposition, consulter, lier et partager des données Un mécanisme Un protocole Un principe Un « langage » d’identification HTTP URL/URI L’hypertexte RDF 15
  • 16. LE MOTEUR DE RECHERCHE : HUB DE L’ACCÈS UNIFIÉ À L’INFORMATION 16
  • 17. CRÉER DE LA VALEUR POUR LES UTILISATEURS 17
  • 18. Capter, penser, valoriser, exposer l’information LA SOLUTION
  • 19. Capter, valoriser et traiter l’information ANTIDOT INFORMATION FACTORY
  • 20. ANTIDOT INFORMATION FACTORY Antidot Information Factory : un outil industriel et évolutif Une chaîne de Un cadre de Un modèle captation développement d’Unité Documentaire et de traitement 20
  • 21. AIF : UNE CHAÎNE DE TRAITEMENT Créer des chaînes de traitement de données par assemblage de modules Sources de Module Modules de transformation données connecteur et enrichissement 21
  • 22. AIF : UN CADRE DE DÉVELOPPEMENT Un cadre de développement pour construire des modules 50+ filtres prêts à l’emploi + Un environnement d’exécution 22
  • 23. AIF : UN MODÈLE D’UNITÉ DOCUMENTAIRE Le document est composite est dynamique évolue dans le temps est un objet géré de façon unifiée 23
  • 24. AIF ET LE WEB SÉMANTIQUE AIF met le Web sémantique au service de la gestion de l’information en entreprise Support des standards SKOS, OWL, RDF, SparQL dans AIF Indexation du RDF Intégration native : Thésaurus Software Software Publisher Publisher type Taxonomies Règles d’inférence label antidot loves w3c:RDF w3c:RDF Antidot antidot a :publisher ; :loves w3c:RDF . 24
  • 26. AFS V7 QUERY ENGINE Recherche plein texte avec fonctions linguistiques : extension automatique suggestion orthographique expressions contextuelles 26
  • 27. AFS V7 QUERY ENGINE Recherche phonétique 27
  • 28. AFS V7 QUERY ENGINE Autocomplétion intelligente pendant la saisie de la requête 28
  • 29. AFS V7 QUERY ENGINE Recherche multicritères avancée 29
  • 30. AFS V7 QUERY ENGINE Recherche à facettes 30
  • 31. AFS V7 QUERY ENGINE Tag clouds : nuage de mots-clés les plus utilisés dans le corpus 31
  • 32. AFS V7 QUERY ENGINE Construction de requêtes à partir des métadonnées d’une fiche 32
  • 33. AFS V7 QUERY ENGINE Catégorisation : classification automatique des documents selon une taxonomie donnée 33
  • 34. Annoter et partager l’information COLLABORATIVE KNOWLEDGE SUITE
  • 35. CKS : RECHERCHE COLLABORATIVE Capitaliser Enregistrer Requêtes Réponses Organiser Dossiers Tags 35
  • 37. RENDRE ACCESSIBLE LES CONTENUS ENRICHIS PAR AIF API Web Linked Data 37
  • 38. Le projet Isidore UN EXEMPLE Stéphane Pouyllau, TGE Adonis (CNRS) @spouyllau http://www.lespetitescases.net
  • 39. LE TRÈS GRAND ÉQUIPEMENT ADONIS (CNRS) Le Très grand équipement du CNRS pour les sciences humaines et sociales Adonis : Accès unifié aux données et documents numériques des sciences humaines et sociales www.tge-adonis.fr 39
  • 40. LES OBJECTIFS DU TGE ADONIS 3 axes : Accès aux données : ISIDORE Accompagnement des communautés scientifiques en matière de numériques : données > publications Stockage et archivage à long terme des données numériques 40
  • 41. LES BESOINS D’ISIDORE Donner accès à des données numériques réparties Des données structurées pour qualifier du texte intégral En entrée : utilisation de standards internationaux En sortie : données enrichies et normalisées (RDF + Sparql) Enrichissement : plusieurs traitements/multiples référentiels entrant plusieurs couches de traitements Construire un « hub » pour les métadonnées et les données des SHS Proposer des services d'accès aux données multiples : • IHM Web • API • Triple store RDF 41
  • 42. LES ENJEUX D’ISIDORE Valoriser le travail de structuration scientifique (humains) sur les méta-données pour qualifier les données non structurées Replacer l'expertise humaines et le savoir scientifique dans les données en ligne Enrichir les méta-données et les données Vers de nouveaux champs de recherche Les ré-exposer selon les principes du linked data dans le web de données Ouverture des données publiques de la recherche en sciences humaines et sociales 42
  • 43. Perspectives au contexte des entreprises EN GUISE DE CONCLUSION
  • 44. PERSPECTIVES : DANS TOUT CONTEXTE D’ENTREPRISE Indexation Service de recherche AFS Export Document Content repository Manager génération du RDF Entrepôts RDF SPARQL endpoint 44
  • 45. Merci pour votre attention Venez échanger avec nous et découvrez AIF, AFS et CKS sur le stand E 16