4. Objectifs de l’atelier Faire un bilan d’étape Montrer les données Justifier certains choix Expliquer comment ça marche Manipuler quelques outils simples Esquisser la suite du travail à mener Nous Vous
9. about En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id http://www.sudoc.fr/013041932/id est l’identifiant du document décrit http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932
10.
11. Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id
12.
13.
14. Mettre en relation un document et une langue La langue n’est pas un code (‘fre’) La langue est une entité à part entière Avec son propre identifiant http://lexvo.org/id/iso639-3/fra et ses propres propriétés La propriété dcterms:language met en relation deux entités
20. IdRef, fournisseur d’identifiants et de référentiels www.idref.fr = application Web ouverte Ouverte sur le Web de données Ouverte à d’autres applications IST (France) Par son Web Service de recherche Par ses fonctions d’intégration (Javascript) Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.
22. Les autorités Sudoc,pivot du Linked data ABES theses.fr Sudoc Thèses soutenues et Thèses en cours (2011) Autorités Sudoc Calames
23. RDFa de Calames Pas de page RDF/XML Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211 Pour révéler le RDF caché , utiliser un outil comme
25. RDFa de theses.fr Pas encore de page RDF/XML Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802 Pour révéler le RDF caché , utiliser un outil comme
26. Les thèsesportant sur les correspondants de Goethe PREFIX foaf: <http://xmlns.com/foaf/0.1/> PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX ead: <info:ms#> PREFIX tef: <http://www.abes.fr/abes/documents/tef/> SELECT ?these { ?ms dc:creator <http://www.abes.fr/su/res/026895528>. ?ms ead:destinataire ?destinataire. ?these a tef:Thesis. ?these dc:subject ?destinataire } La requête exploite les données Calames et STAR
28. Linked data IST.fr ? ? theses.fr Sudoc Thèses soutenues et Thèses en cours ( 2011) Autorités Sudoc Plateforme pédagogiq. ? HAL ? revues. org ? Presses univ. de Y ? Calames Persée ?
29. IdRef comme nœud régional Positionnement d’IdRef : IST français En complémentarité avec d’autres fournisseurs d’identifiants et de référentiels : Local : identifiants propres à une application, à un annuaire Régional : BnF, auteurs HAL, CERL, DAI (NL) Global : VIAF, DBpedia
30. Autorités BnF DBpedia VIAF theses.fr Sudoc Autorités Sudoc Plateforme pédagogiq. ? HAL ? revues. org ? Presses univ. de Y ? Calames Persée ?
32. Linked data IST.fr ? Les labos ! ? theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ. de Y Calames Référentiel des laboratoires Persée
33. Linked data IST.fr ? Les affiliations PRISMES (AMUE) locaux theses.fr Sudoc Autorités Sudoc Plateforme pédagogique X HAL revues. org Presses univ.s de Y Calames Référentiel des laboratoires Persée
39. IdRef et Rameau Identifiants IdRef pour Rameau A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés. MeSH Dewey
45. Raisonnement Le Sudoc dit : http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id La Bibliothèque du Congrès dit (ici) : Marcrel:autrdfs:subPropertyOfdc:contributor Un outil de raisonnement pourra en déduire que : http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id
47. tef:auteur Ne semble rien dire de plus que marcrel:aut Mais possède une propriété intéressante : C’est une propriété fonctionnelle = Une thèse ne peut avoir qu’un auteur = si une thèse a deux auteurs, c’est deux fois le même !
48. Raisonnement Quelqu’un dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id Quelqu’un d’autre dit : http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789 Une ontologie TEF dit : http://www.abes.fr/tef/auteur rdf:typeowl:ObjectPropertyowl:FunctionalProperty (une thèse ne peut avoir qu’1 auteur, au sens de tef:auteur) (mais elle peut avoir 2 dc:creator) Un outil de raisonnement pourra en déduire que : http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789
49. Démo Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt Outils de raisonnement : http://www.ivan-herman.net/Misc/2008/owlrl/ http://inspector.sindice.com
50. Raisonnement RDF, c’est de la logique Travaux en cours avec le LIRMM pour ADONIS sur les données Persée Oblige à qualité des données et rigueur de la modélisation Sinon : on génère n’importe quoi ! Usages : Enrichir les données Expliciter les données Mettre au jour des incohérences
60. La suite Enrichir encore les conversions en RDF Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.) Encourager les partenaires à diffuser leurs données en RDF, en s’appuyant sur des référentiels communs (IdRef) Continuer à exploiter ces données en RDF avec le LIRMM et d’autres