SlideShare una empresa de Scribd logo
1 de 53
LES TECHNOLOGIES DU WEB APPLIQUÉES
      AUX DONNÉES STRUCTURÉES

                    2e partie : relier, réutiliser, partager
                       L'apport du Web de données

 Gautier Poupeau                                      Emmanuelle Bermès
 Antidot                                                Centre Pompidou
 http://www.lespetitescases.net                         http://www.figoblog.org
 Twitter @lespetitescases                                      Twitter @figoblog



                                     Séminaire INRIA – 1-5 octobre 2012
SOMMAIRE


1. Une interopérabilité basée sur les liens
2. Les différents types de données du Linked Data
3. Exemple de réutilisation des données du LOD
4. Exemple de réutilisation des technologies du LOD
  dans le contexte de l'organisation
D'un Web de documents...

Principes du Web 1.0


»   Les documents (HTML)
    contiennent des liens entre eux
»   Le contenu n'est pas structuré
»   On ne peut pas faire de requêtes
»   On ne sait pas l'exploiter avec
    des machines
...à un Web d'applications...

Principes du Web 2.0


»   Les APIs permettent d'exposer
    les données structurées
»   ... donc de créer de nouvelles
    applications
»   Mais chaque API est propriétaire
»   Chaque API n'est valable que
    pour un « silo » de données
»   On ne peut pas faire de liens
    entre les données d'un silo à
    l'autre
... à un Web de données
                                                        Principes du Linked Data
»   Comme le Web, le Linked Data est un espace documentaire unifié,
    global, commun
»   On peut faire des liens d'une donnée à une autre
»   Les données ne sont plus isolées dans des silos
»   Les APIs propriétaires sont remplacées par des standards ouverts
    (RDF, SPARQL, HTTP...)‫‏‬
Le problème de la diversité des modèles




  Bibliothèques             Archives                  Musées

 Objets multiples    Description hiérarchique     Objets uniques
Catalogage partagé          Contexte            Description orientée
                       Respect des fonds            événement
Comment mélanger les données tout en préservant la saveur
             unique de chaque domaine ?
Construire l'interopérabilité




Interopérabilité par conversion et copie   Le plus petit dénominateur commun
                MARC                                   OAI-PMH
               Z. 39 50                          Dublin Core Simple
              SRU/SRW...
Construire l'interopérabilité




                Modèle “hub and spoke”
Plusieurs bases de données partagent le même référentiel
Construire l'interopérabilité




             “follow your nose”
     Interopérabilité basée sur les liens
LES 4 PRINCIPES DU WEB DE DONNÉES
http://dbpedia.org/resource/Smoking_pipe_%28tobacco%29




 (1) Utiliser des URIs




                                                         11
LES 4 PRINCIPES DU WEB DE DONNÉES
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29




    (1) Utiliser des URIs




                                 (2) Utiliser des URIs
                                 accessibles via HTTP


                                                         12
LES 4 PRINCIPES DU WEB DE DONNÉES


                                            (2) Utiliser des URIs
                                            accessibles via HTTP
 (1) Utiliser des
  URIs




(3) Donner l’accès aux données utiles en
utilisant les standards SPARQL et RDF                          13
LES 4 PRINCIPES DU WEB DE DONNÉES
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29




    (1) Utiliser des URIs                       (2) Utiliser des URIs
                                                accessibles via HTTP



(3) Donner l’accès aux
données utiles en
utilisant les standards
SPARQL et RDF




                                         (4) Exprimer
                                         l’URI des objets liés
                                                                  14
2007




Le « Linked Data »
 ou Web de données
2008




Le « Linked Data »
 ou Web de données
2009




Le « Linked Data »
 ou Web de données
Le « Linked Data »
 ou Web de données



                     2011
SOMMAIRE


1. Une interopérabilité basée sur les liens
2. Les différents types de données du Linked
  Data
3. Exemple de réutilisation des données du LOD
4. Exemple de réutilisation des technologies du LOD
  dans le contexte de l'organisation
Linked data cloud en détail : ressources d’intérêt général




                                                             20
Le projet DBPedia
                    DBpedia est une initiative visant à extraire de l’information
                    structurée à partir de Wikipedia et à rendre cette
                    information disponible sur le Web. DBPedia permet de
                    faire des requêtes complexes sur les données de
                    Wikipedia, et de relier d’autres ensembles de données du
                    Web à Wikipedia.


                                             3,64 millions de chose dont :

                                                  416,000 personnes, 526,000
                                                  lieux, 106,000 albums musicaux,
                                                  60,000 films, etc.
                        http://dbpedia.org
                                                  1 milliard de triplets RDF‫‏‬

               Mis au point et maintenu par Universität Leipzig, Freie
               Universität Berlin et la société OpenLink Software dans le
               cadre du projet

                                                                                    21
Linked data cloud en détail : ressources « sociales »




                                                        22
Linked data cloud en détail : ressources géographiques




                                                         23
Geonames et LinkedGeoData
         Geonames est un système d’information géographique dont les
         informations sont libres (CC BY). 8 millions d’emplacements géographiques
(villes, monuments, montagnes…) dans le monde sont référencés et géotaggués ce qui
en fait un des référentiels géographiques les plus complets.
En complément de Web services, les données sont accessibles selon les principes du Linked Data.


                                                                                    HTML
                                 http://sws.geonames.org/6487834/                   pour les humains
  RDF
  pour les machines




                               LinkedGeoData est à OpenStreetMap
                               ce que Dbpedia est à Wikipedia



                               320 millions de points géoréférencés
http://linkedgeodata.org       25 millions d’itinéraires
                                                                                                       24
Linked data cloud en détail : Les données
gouvernementales




                                            25
Data.gov et Data.gov.uk
A la suite de l’annonce de Barack Obama de mettre à disposition les données publiques
américaines, les initiatives dans le domaine se multiplient. Les principes du Linked Data sont au
cœur de la réflexion, mais pas forcément utilisés.
              Data.gov.uk                                              Data.gov




Sous la direction de Nigel Shadbolt                Initiative de Barack Obama
et Tim Berners-Lee                                 3500 ensembles de données
7 500 ensembles de données                         Utilisation des technos du Web sémantique
Utilisation des technos du Web sémantique                                                      26
Linked data cloud en détail : ressources multimédia




                                                      27
Linked data cloud en détail : ressources biologiques
et médicales




                                                       28
Linked data cloud en détail : ressources
bibliographiques




                                           29
Data.bnf.fr                         http://data.bnf.fr/11919216/charles_perrault/


Fédérer les données des différentes bases pour
 faciliter l’accès aux ressources




                                                                                     30
SOMMAIRE


1. Une interopérabilité basée sur les liens
2. Les différents types de données du Linked Data
3. Exemple de réutilisation des données du LOD
4. Exemple de réutilisation des technologies du LOD
  dans le contexte de l'organisation
Réutiliser les données du LOD
 un exemple : “Monuments” (Antidot)




   http://labs.antidot.net/demo/monuments/
L'exemple de “Monuments”
 • Travail sur des données publiques
 • Consolider des données éparses,
     individuellement faibles, pour créer une
     application riche.
      – La base : la source des monuments historiques
          français
          (fichier CSV contenant 43 720 lignes sur
          data.gouv.fr)
L'exemple de “Monuments”

• Maillage et enrichissement avec 6 sources
   complémentaires : stations de métro, de
   trains, bases de photos et description de
   Wikipedia…
L'exemple de “Monuments”

  • Mailler les données
L'exemple de “Monuments”

• Le moteur de recherche sémantique pour
    créer simplement des applications riches
    et faciles d’accès
L'exemple de “Monuments”
SOMMAIRE


1. Une interopérabilité basée sur les liens
2. Les différents types de données du Linked Data
3. Exemple de réutilisation des données du LOD
4. Exemple de réutilisation des technologies du
  LOD dans le contexte de l'organisation
Réutiliser les technologies du LOD
  un exemple : le Centre Pompidou Virtuel




                 http://beta2.centrepompidou.fr
    Et à partir du 4/10/12 : http://www.centrepompidou.fr
Le Centre Pompidou Virtuel
La production des ressources (numérisation, indexation, libération
des droits) alimente des bases sources, ou bases métier. Les
ressources sont ensuites transformées pour publication dans le
Centre Pompidou Virtuel.


                           Libération
                           des droits

                                                  Transformation
                                                  des ressources

 Ressources
 numériques




                         Bases sources      Publication dans
    Indexation
                                            le Centre
                                            Pompidou Virtuel

                                                                     40
Le Centre Pompidou Virtuel
Le Centre Pompidou Virtuel est une interface de publication, qui
agrège les contenus produits par différentes sources. Celles-ci sont
alimentées en fonction de l’activité de chaque secteur.




Musée            Bibliothèque   Archives     Dpu (dossiers   Ircam (bases   Agenda         SAV (films      Boutique       Bpi
(reproductions   Kandinsky      (documents   pédagogiques)   de données,    (événements)   DACA,           (produits)     (archives
des œuvres)      (documents     numérisés)                   archives                      captations)                    Sonores,
                 numérisés)                                  sonores)                                                     ouvrages)




                                                                  Service Multimédia, DSIT : Analyse des besoins au regard des
                                                                  contenus nouveaux, mise en place de nouveaux outils.


                                                                                                                                      41
Le Centre Pompidou Virtuel
Modèle de données

                         Œuvre
                                                                 A été présentée à l’occasion de
                                                                                                                    A créé
            Principalement, œuvres du musée
           Mais aussi : œuvre musicale (Ircam)




                                                  Est reproduction de                                 Evénement
                                                                                                   Conférence, exposition…
          A pour sujet



                                                           Ressource                                               Is about
                                            Quelque chose qui existe sous forme numérique
                                                     (image, audio, vidéo, texte)
                                                                                     Est enregistrement de
                         Est reproduction de /
                         Est enregistrement de

                                                                        concerne                                    Personne
                                                                                                                  Artistes, auteurs,
                                                                                                                 collectifs d’artistes…

          Document
           Livres, Archives
                                                                                              Collection
                                                                                     e.g. Cabinet des Arts graphiques,
                                                                                          Donation Nina Kandinsky…
                                                                             Lieu
                                                                   E.g. « Centre Pompidou »
                              concerne




                                                                                                                                          42
Le Centre Pompidou Virtuel
Modèle de données
                                                                           A été présentée à l’occasion de
                                                                                                                        A créé

                            Œuvre


                                                            Est reproduction de
                                                                                                                 Evénement
             A pour sujet



                                                                     Ressource                                         Is about




                                                                                               Is recording of
                             Is reproduction of /
                             Is recording of
                                                                                  Is about                              Personne
                                                    Fait partie de



             Document                  Est localisé dans

                                                                                                       Collection


                                Is about                                               Lieu


                                                                                                                                   43
Le Centre Pompidou Virtuel
Modèle de données
                                                          A été présentée à l’occasion de
                                                                                                          created

                   Œuvre


                                           Is reproduction of
                                                                                             Evénement
        Is about
                   A pour sujet


                                                    Ressource                                           Concerne




                                                                             Est enregistrement de
                    Is reproduction of /
                    Is recording of
                                                                 Is about                                Personne

        Document
                                                                                      Collection

                                                                     Lieu
                        Is about
                                                                                                     Se déroule à




                                                                                                                    44
LE LED – LINKED ENTERPRISE DATA


Le LED correspond à l’application des principes et
technologies du Web sémantique à l’entreprise
Le LED d'Antidot
Le LED d'Antidot
Principes du LED

  Faire émerger l’implicite
Le LED d'Antidot

• Pas de macro ontologie
• Réutiliser les vocabulaires existants
      – Foaf, Organization,
      – Dublin Core, ORE,
      – Beatle (pour les issues)
Le LED d'Antidot

• Utilisation des référentiels et vocabulaires
• Exploitation des données structurées
• Pour les documents : text mining pour repérer
    les personnes, produits, projets …
Le LED d'Antidot
Principes du LED


Des applications métier
CONCLUSION
       (POUR VOUS METTRE EN APPÉTIT)




Data                                   Usages

Más contenido relacionado

La actualidad más candente

Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)François Belleau
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantiqueSpyderwoman
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantiqueGreenIvory
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Gautier Poupeau
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked dataVincentBroute
 
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Eth BestSniper
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQLBorderCloud
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web SémantiqueYves Otis
 
Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantiqueSylvain Gateau
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeuxGautier Poupeau
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sensFabien Gandon
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sensFabien Gandon
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked DataKlee Group
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
Données de la culture et culture des données
Données de la culture et culture des donnéesDonnées de la culture et culture des données
Données de la culture et culture des donnéesFabien Gandon
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesABES
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDFRadhouani Mejdi
 

La actualidad más candente (20)

Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)Découvrir le web sémantique en 15 minutes (Decideo 2014)
Découvrir le web sémantique en 15 minutes (Decideo 2014)
 
Introduction au Web sémantique
Introduction au Web sémantiqueIntroduction au Web sémantique
Introduction au Web sémantique
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
Les technologies du Web appliquées aux données structurées (1ère partie : Enc...
 
Open data & linked data
Open data & linked dataOpen data & linked data
Open data & linked data
 
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
Exposé sur le web sémantique de Laurent Salvadori (20-1-12)
 
Les bases pour utiliser SPARQL
Les bases pour utiliser SPARQLLes bases pour utiliser SPARQL
Les bases pour utiliser SPARQL
 
Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
Les moteurs de recherche sémantique
Les moteurs de recherche sémantiqueLes moteurs de recherche sémantique
Les moteurs de recherche sémantique
 
Information numérique : défintions et enjeux
Information numérique : défintions et enjeuxInformation numérique : défintions et enjeux
Information numérique : défintions et enjeux
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
Web Sémantique — Linked Data
Web Sémantique — Linked DataWeb Sémantique — Linked Data
Web Sémantique — Linked Data
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
Données de la culture et culture des données
Données de la culture et culture des donnéesDonnées de la culture et culture des données
Données de la culture et culture des données
 
Jabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de donnéesJabes 2012 - Tutoriel, vers le Web de données
Jabes 2012 - Tutoriel, vers le Web de données
 
Les ontologies et les graphes RDF
Les ontologies et les graphes RDFLes ontologies et les graphes RDF
Les ontologies et les graphes RDF
 

Destacado

Le web sémantique par l'exemple
Le web sémantique par l'exempleLe web sémantique par l'exemple
Le web sémantique par l'exempledescl
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Julien PLU
 
Quick overview of the use of linked data in sociallearn
Quick overview of the use of linked data in sociallearnQuick overview of the use of linked data in sociallearn
Quick overview of the use of linked data in sociallearnMathieu d'Aquin
 
Referendum Oosterweelverbinding - Doe mee!
Referendum Oosterweelverbinding - Doe mee!Referendum Oosterweelverbinding - Doe mee!
Referendum Oosterweelverbinding - Doe mee!Stedelijke Jeugdraad
 
Web sémantique : données liées et sémantique des schémas
Web sémantique : données liées et sémantique des schémasWeb sémantique : données liées et sémantique des schémas
Web sémantique : données liées et sémantique des schémasFabien Gandon
 
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?Antidot
 
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...Gautier Poupeau
 
Can Deep Learning Techniques Improve Entity Linking?
Can Deep Learning Techniques Improve Entity Linking?Can Deep Learning Techniques Improve Entity Linking?
Can Deep Learning Techniques Improve Entity Linking?Julien PLU
 

Destacado (8)

Le web sémantique par l'exemple
Le web sémantique par l'exempleLe web sémantique par l'exemple
Le web sémantique par l'exemple
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!!
 
Quick overview of the use of linked data in sociallearn
Quick overview of the use of linked data in sociallearnQuick overview of the use of linked data in sociallearn
Quick overview of the use of linked data in sociallearn
 
Referendum Oosterweelverbinding - Doe mee!
Referendum Oosterweelverbinding - Doe mee!Referendum Oosterweelverbinding - Doe mee!
Referendum Oosterweelverbinding - Doe mee!
 
Web sémantique : données liées et sémantique des schémas
Web sémantique : données liées et sémantique des schémasWeb sémantique : données liées et sémantique des schémas
Web sémantique : données liées et sémantique des schémas
 
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
SPARQL, comment illuminer vos mashups en consommant les données du Linked Data ?
 
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...
Réalisation d'un mashup de données avec DSS de Dataiku et visualisation avec ...
 
Can Deep Learning Techniques Improve Entity Linking?
Can Deep Learning Techniques Improve Entity Linking?Can Deep Learning Techniques Improve Entity Linking?
Can Deep Learning Techniques Improve Entity Linking?
 

Similar a Les technologies du Web appliquées aux données structurées (2ème partie : Relier, réutiliser, partager, l'apport du Web de données)

Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Anne-Gaëlle Gaudion
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesnonue12
 
Linked open data pour la consommation des informations
Linked open data pour la consommation des informationsLinked open data pour la consommation des informations
Linked open data pour la consommation des informationsEric Toguem
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Antidot
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? chessmu
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesAntidot
 
2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011Fleury Christine
 
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFAcfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFFrançois Belleau
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesBe_Sa
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011Fleury Christine
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Y. Nicolas
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...Fabien Gandon
 
Formation Culture numerique - Focus sur le Web
Formation Culture numerique -  Focus sur le WebFormation Culture numerique -  Focus sur le Web
Formation Culture numerique - Focus sur le WebABES
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data AsterismsGregoire Burel
 
2 focus web
2 focus web2 focus web
2 focus webABES
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéeschristianhbecker
 
mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011Fleury Christine
 

Similar a Les technologies du Web appliquées aux données structurées (2ème partie : Relier, réutiliser, partager, l'apport du Web de données) (20)

Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Linked open data pour la consommation des informations
Linked open data pour la consommation des informationsLinked open data pour la consommation des informations
Linked open data pour la consommation des informations
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?
 
Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services?
 
Isidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de donnéesIsidore à l'interface de la rencontre des SHS et du Web de données
Isidore à l'interface de la rencontre des SHS et du Web de données
 
2 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt20112 infrastructure numerique_focusweb_cnfpt2011
2 infrastructure numerique_focusweb_cnfpt2011
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFAcfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
Quelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de donnéesQuelques repères sur le Web sémantique / Web de données
Quelques repères sur le Web sémantique / Web de données
 
infrastructure numerique_focusweb_cnfpt2011
 infrastructure numerique_focusweb_cnfpt2011 infrastructure numerique_focusweb_cnfpt2011
infrastructure numerique_focusweb_cnfpt2011
 
Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)Mettre nos données en réseau (données de l'IST en France)
Mettre nos données en réseau (données de l'IST en France)
 
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...web sémantique et web social: deux étapes vers les données liées d'un web ubi...
web sémantique et web social: deux étapes vers les données liées d'un web ubi...
 
Formation Culture numerique - Focus sur le Web
Formation Culture numerique -  Focus sur le WebFormation Culture numerique -  Focus sur le Web
Formation Culture numerique - Focus sur le Web
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
2 focus web
2 focus web2 focus web
2 focus web
 
DBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des donnéesDBpedia - Un hub de liens dans le web des données
DBpedia - Un hub de liens dans le web des données
 
mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011mediation numerique_salledereference_cnfpt2011
mediation numerique_salledereference_cnfpt2011
 

Más de Gautier Poupeau

Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Gautier Poupeau
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesGautier Poupeau
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonGautier Poupeau
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Gautier Poupeau
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
 
Aligner vos données avec Wikidata grâce à l'outil Open Refine
Aligner vos données avec Wikidata grâce à l'outil Open RefineAligner vos données avec Wikidata grâce à l'outil Open Refine
Aligner vos données avec Wikidata grâce à l'outil Open RefineGautier Poupeau
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALGautier Poupeau
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieGautier Poupeau
 
Data in the center of the Information System
Data in the center of the Information SystemData in the center of the Information System
Data in the center of the Information SystemGautier Poupeau
 
L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...Gautier Poupeau
 
Index nominum to ontology
Index nominum to ontologyIndex nominum to ontology
Index nominum to ontologyGautier Poupeau
 

Más de Gautier Poupeau (13)

Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...Why I don't use Semantic Web technologies anymore, event if they still influe...
Why I don't use Semantic Web technologies anymore, event if they still influe...
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Visite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des donnéesVisite guidée au pays de la donnée - Traitement automatique des données
Visite guidée au pays de la donnée - Traitement automatique des données
 
Visite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizonVisite guidée au pays de la donnée - Introduction et tour d'horizon
Visite guidée au pays de la donnée - Introduction et tour d'horizon
 
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
Un modèle de données unique pour les collections de l'Ina, pourquoi ? Comment ?
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Aligner vos données avec Wikidata grâce à l'outil Open Refine
Aligner vos données avec Wikidata grâce à l'outil Open RefineAligner vos données avec Wikidata grâce à l'outil Open Refine
Aligner vos données avec Wikidata grâce à l'outil Open Refine
 
Découverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HALDécouverte du SPARQL endpoint de HAL
Découverte du SPARQL endpoint de HAL
 
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partieRéalisation d'un mashup de données avec DSS de Dataiku - Première partie
Réalisation d'un mashup de données avec DSS de Dataiku - Première partie
 
Data in the center of the Information System
Data in the center of the Information SystemData in the center of the Information System
Data in the center of the Information System
 
L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...L’apport des technologies du Web sémantique à la gestion des données structur...
L’apport des technologies du Web sémantique à la gestion des données structur...
 
Index nominum to ontology
Index nominum to ontologyIndex nominum to ontology
Index nominum to ontology
 

Les technologies du Web appliquées aux données structurées (2ème partie : Relier, réutiliser, partager, l'apport du Web de données)

  • 1. LES TECHNOLOGIES DU WEB APPLIQUÉES AUX DONNÉES STRUCTURÉES 2e partie : relier, réutiliser, partager L'apport du Web de données Gautier Poupeau Emmanuelle Bermès Antidot Centre Pompidou http://www.lespetitescases.net http://www.figoblog.org Twitter @lespetitescases Twitter @figoblog Séminaire INRIA – 1-5 octobre 2012
  • 2. SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation
  • 3. D'un Web de documents... Principes du Web 1.0 » Les documents (HTML) contiennent des liens entre eux » Le contenu n'est pas structuré » On ne peut pas faire de requêtes » On ne sait pas l'exploiter avec des machines
  • 4. ...à un Web d'applications... Principes du Web 2.0 » Les APIs permettent d'exposer les données structurées » ... donc de créer de nouvelles applications » Mais chaque API est propriétaire » Chaque API n'est valable que pour un « silo » de données » On ne peut pas faire de liens entre les données d'un silo à l'autre
  • 5. ... à un Web de données Principes du Linked Data » Comme le Web, le Linked Data est un espace documentaire unifié, global, commun » On peut faire des liens d'une donnée à une autre » Les données ne sont plus isolées dans des silos » Les APIs propriétaires sont remplacées par des standards ouverts (RDF, SPARQL, HTTP...)‫‏‬
  • 6. Le problème de la diversité des modèles Bibliothèques Archives Musées Objets multiples Description hiérarchique Objets uniques Catalogage partagé Contexte Description orientée Respect des fonds événement
  • 7. Comment mélanger les données tout en préservant la saveur unique de chaque domaine ?
  • 8. Construire l'interopérabilité Interopérabilité par conversion et copie Le plus petit dénominateur commun MARC OAI-PMH Z. 39 50 Dublin Core Simple SRU/SRW...
  • 9. Construire l'interopérabilité Modèle “hub and spoke” Plusieurs bases de données partagent le même référentiel
  • 10. Construire l'interopérabilité “follow your nose” Interopérabilité basée sur les liens
  • 11. LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs 11
  • 12. LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/ Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP 12
  • 13. LES 4 PRINCIPES DU WEB DE DONNÉES (2) Utiliser des URIs accessibles via HTTP (1) Utiliser des URIs (3) Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF 13
  • 14. LES 4 PRINCIPES DU WEB DE DONNÉES http://dbpedia.org/resource/ Smoking_pipe_%28tobacco%29 (1) Utiliser des URIs (2) Utiliser des URIs accessibles via HTTP (3) Donner l’accès aux données utiles en utilisant les standards SPARQL et RDF (4) Exprimer l’URI des objets liés 14
  • 15. 2007 Le « Linked Data » ou Web de données
  • 16. 2008 Le « Linked Data » ou Web de données
  • 17. 2009 Le « Linked Data » ou Web de données
  • 18. Le « Linked Data » ou Web de données 2011
  • 19. SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation
  • 20. Linked data cloud en détail : ressources d’intérêt général 20
  • 21. Le projet DBPedia DBpedia est une initiative visant à extraire de l’information structurée à partir de Wikipedia et à rendre cette information disponible sur le Web. DBPedia permet de faire des requêtes complexes sur les données de Wikipedia, et de relier d’autres ensembles de données du Web à Wikipedia. 3,64 millions de chose dont : 416,000 personnes, 526,000 lieux, 106,000 albums musicaux, 60,000 films, etc. http://dbpedia.org 1 milliard de triplets RDF‫‏‬ Mis au point et maintenu par Universität Leipzig, Freie Universität Berlin et la société OpenLink Software dans le cadre du projet 21
  • 22. Linked data cloud en détail : ressources « sociales » 22
  • 23. Linked data cloud en détail : ressources géographiques 23
  • 24. Geonames et LinkedGeoData Geonames est un système d’information géographique dont les informations sont libres (CC BY). 8 millions d’emplacements géographiques (villes, monuments, montagnes…) dans le monde sont référencés et géotaggués ce qui en fait un des référentiels géographiques les plus complets. En complément de Web services, les données sont accessibles selon les principes du Linked Data. HTML http://sws.geonames.org/6487834/ pour les humains RDF pour les machines LinkedGeoData est à OpenStreetMap ce que Dbpedia est à Wikipedia 320 millions de points géoréférencés http://linkedgeodata.org 25 millions d’itinéraires 24
  • 25. Linked data cloud en détail : Les données gouvernementales 25
  • 26. Data.gov et Data.gov.uk A la suite de l’annonce de Barack Obama de mettre à disposition les données publiques américaines, les initiatives dans le domaine se multiplient. Les principes du Linked Data sont au cœur de la réflexion, mais pas forcément utilisés. Data.gov.uk Data.gov Sous la direction de Nigel Shadbolt Initiative de Barack Obama et Tim Berners-Lee 3500 ensembles de données 7 500 ensembles de données Utilisation des technos du Web sémantique Utilisation des technos du Web sémantique 26
  • 27. Linked data cloud en détail : ressources multimédia 27
  • 28. Linked data cloud en détail : ressources biologiques et médicales 28
  • 29. Linked data cloud en détail : ressources bibliographiques 29
  • 30. Data.bnf.fr http://data.bnf.fr/11919216/charles_perrault/ Fédérer les données des différentes bases pour faciliter l’accès aux ressources 30
  • 31. SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation
  • 32. Réutiliser les données du LOD un exemple : “Monuments” (Antidot) http://labs.antidot.net/demo/monuments/
  • 33. L'exemple de “Monuments” • Travail sur des données publiques • Consolider des données éparses, individuellement faibles, pour créer une application riche. – La base : la source des monuments historiques français (fichier CSV contenant 43 720 lignes sur data.gouv.fr)
  • 34. L'exemple de “Monuments” • Maillage et enrichissement avec 6 sources complémentaires : stations de métro, de trains, bases de photos et description de Wikipedia…
  • 35. L'exemple de “Monuments” • Mailler les données
  • 36. L'exemple de “Monuments” • Le moteur de recherche sémantique pour créer simplement des applications riches et faciles d’accès
  • 38. SOMMAIRE 1. Une interopérabilité basée sur les liens 2. Les différents types de données du Linked Data 3. Exemple de réutilisation des données du LOD 4. Exemple de réutilisation des technologies du LOD dans le contexte de l'organisation
  • 39. Réutiliser les technologies du LOD un exemple : le Centre Pompidou Virtuel http://beta2.centrepompidou.fr Et à partir du 4/10/12 : http://www.centrepompidou.fr
  • 40. Le Centre Pompidou Virtuel La production des ressources (numérisation, indexation, libération des droits) alimente des bases sources, ou bases métier. Les ressources sont ensuites transformées pour publication dans le Centre Pompidou Virtuel. Libération des droits Transformation des ressources Ressources numériques Bases sources Publication dans Indexation le Centre Pompidou Virtuel 40
  • 41. Le Centre Pompidou Virtuel Le Centre Pompidou Virtuel est une interface de publication, qui agrège les contenus produits par différentes sources. Celles-ci sont alimentées en fonction de l’activité de chaque secteur. Musée Bibliothèque Archives Dpu (dossiers Ircam (bases Agenda SAV (films Boutique Bpi (reproductions Kandinsky (documents pédagogiques) de données, (événements) DACA, (produits) (archives des œuvres) (documents numérisés) archives captations) Sonores, numérisés) sonores) ouvrages) Service Multimédia, DSIT : Analyse des besoins au regard des contenus nouveaux, mise en place de nouveaux outils. 41
  • 42. Le Centre Pompidou Virtuel Modèle de données Œuvre A été présentée à l’occasion de A créé Principalement, œuvres du musée Mais aussi : œuvre musicale (Ircam) Est reproduction de Evénement Conférence, exposition… A pour sujet Ressource Is about Quelque chose qui existe sous forme numérique (image, audio, vidéo, texte) Est enregistrement de Est reproduction de / Est enregistrement de concerne Personne Artistes, auteurs, collectifs d’artistes… Document Livres, Archives Collection e.g. Cabinet des Arts graphiques, Donation Nina Kandinsky… Lieu E.g. « Centre Pompidou » concerne 42
  • 43. Le Centre Pompidou Virtuel Modèle de données A été présentée à l’occasion de A créé Œuvre Est reproduction de Evénement A pour sujet Ressource Is about Is recording of Is reproduction of / Is recording of Is about Personne Fait partie de Document Est localisé dans Collection Is about Lieu 43
  • 44. Le Centre Pompidou Virtuel Modèle de données A été présentée à l’occasion de created Œuvre Is reproduction of Evénement Is about A pour sujet Ressource Concerne Est enregistrement de Is reproduction of / Is recording of Is about Personne Document Collection Lieu Is about Se déroule à 44
  • 45. LE LED – LINKED ENTERPRISE DATA Le LED correspond à l’application des principes et technologies du Web sémantique à l’entreprise
  • 48. Principes du LED Faire émerger l’implicite
  • 49. Le LED d'Antidot • Pas de macro ontologie • Réutiliser les vocabulaires existants – Foaf, Organization, – Dublin Core, ORE, – Beatle (pour les issues)
  • 50. Le LED d'Antidot • Utilisation des référentiels et vocabulaires • Exploitation des données structurées • Pour les documents : text mining pour repérer les personnes, produits, projets …
  • 52. Principes du LED Des applications métier
  • 53. CONCLUSION (POUR VOUS METTRE EN APPÉTIT) Data Usages