SlideShare una empresa de Scribd logo
1 de 55
Juin 2010 muriel.foulonneau@tudor.lu 1 Modélisation, environnements sémantiques et Web de données Muriel Foulonneau Centre de Recherche Public Henri Tudor Luxembourg 					séminaire ISKO 					juin 2010
Sémantique? 2
Objectif La représentation des données De la forme traditionnelle à une publication avec les technologies sémantiques Partager Les descriptions mais aussi leur sens et les associations 3
Juin 2010 muriel.foulonneau@tudor.lu Les métadonnées assurent l’interopérabilité sémantique ,[object Object]
J’aibesoin
D’un langagecommun
D’un interpréteur01-04-04 ,[object Object]
 c’est un mois
 01=“Jan”muriel.foulonneau@tudor.lu
Knowledge Organization Systems 5
Les terminologies Les vocabulaires contrôlés Réduire l’ambiguité du langage naturel lorsque l’on décrit et recherche des informations. Composé de termes utilisés pour représenter un concept Problèmes Des particularités du langage naturel posent des problèmes (synonymes et ambiguité)  Différents termes (synonymes) peuvent représenter le même concept.  Le même terme (homographes) peut représenter différents concepts.  6
Différents types de terminologies Liste contrôlée non hiérarchisée Taxonomie et système de classification (avec organisation hiérarchique) Thésaurus Équivalence Hiérarchique (termes génériques/spécifiques) Association (voir aussi) => Pour intégrer des synonymes dans des recherches, élargir des recherches, naviguer, représenter, …  7
Listes de termes  Pour permettre de gérer les ambiguités.  Des fichiers d’autorité comportent des variantes d’un nom. Les glossaires sont des listes de termes avec leurs définitions dans un domaine spécifique Dictionnaires, ils incluent différentes acceptions d’un terme, ils sont présentés de manière alphabétique, avec éventuellement des informations sur l’origine du terme “Gazetteers” avec des noms de lieux, leur position etc “Synonym Rings”  pour étendre des requêtes de manière transparente 8
Taxonomies Organisation hiérarchique de catégories Généralement utilisées pour classifier 9 http://biodiversite.wallonie.be/cgi/sibw.esp.list2.pl?VAR=Mammiferes
Autorités sujet Listes contrôlées de sujet Ex Rameau, LCSH, MeSH Permettent souvent des compositions Peuvent inclure des sous-catégories 10
Thésaurus Pour de la recherche Ensemble limité de relations entre les termes Equivalence (synonymes)  Hiérarchique (termes génériques / spécifiques)  générique (sous-classe/super-classe), instance (classe/instance) et partitive (tout-partie)  Association (voir aussi). 11
Systèmes de classification Similaires à des taxonomies Visent à l’exhaustivité et en principe les concepts ne se recouvrent pas (appartenance exclusive). Systèmes énumératifs (tous les concepts sont explicites) ou synthétiques (des règles permettent des combinaisons de concepts) Les facettesprésentes desclassifications selon des dimensions qui s’excluent mutuellement 12
Les bases lexicales Des relations plus riches que celles des thésaurus, éventuellement spécifiques à chaque base Ex. WordNet inclut homonymie, antonymie, synonymie 13 http://wordnetweb.princeton.edu/perl/webwn?s=mill&sub=Search+WordNet&o2=&o0=1&o7=&o5=&o1=1&o6=&o4=&o3=&h=
Les ontologies Modélisation d’un domaine avec des classes, des instances, des attributs, des sous-classes, … et de nombreuses relations spécifiques. Ex. CIDOC-CRM  (Martin Doerr, Stephen Stead  http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt) E52 Time-Span E53 Place E39 Actor 7012124 E38 Image E31 Document “Yalta Agreement” E52 Time-Span E39 Actor E39 Actor 1945-02-11 February 1945 P82 at some     time  within P7 took place at P11 participated in E7 Activity “Crimea Conference” P86 falls  within P67 is referred to by E65 Creation Event * 14 P81 ongoing throughout P14 performed P94 has created
Folksonomies Pour indexation par une communauté d’utilisateurs cinema people vs movie people (C. Shirky) 15 http://www.flickr.com/photos/tags/
RDF Crash course 16
Technologies sémantiques RDF Classes et instances 17 http://moi/est_employee_par Alice CNRS foaf:name Alice Dupont Foaf:organization Foaf:person rdfs:subclass_of Moi:research_organization rdf:type rdf:type http://moi/est_employee_par Alice CNRS
Les règles Je peux par exemple définir que  Si foaf:person http://moi/est_employee_parFoaf:organization Et Foaf:organization http://moi/localisation x  => Alors foaf:person http://moi/localisation x 18 Foaf:organization Foaf:person Moi:research_organization rdf:type rdf:type http://moi/est_employee_par http://moi/localisation Alice CNRS Paris
La transitivité 19 foaf:knows foaf:knows Alice Charles Hugues foaf:knows http://moi/a_le_meme_age_que http://moi/a_le_meme_age_que Alice Charles Hugues
Syntaxes RDF/XML Turtle etc 20 <rdf:RDFxmlns:rdf=‘http://www.w3.org/1999/02/22-rdf-syntax-ns# ’xmlns:dc=‘http://purl.org/dc/elements/1.1/’>     <rdf:Descriptionrdf:about=‘urn:isbn:0596002637’>    <dc:title>Practical RDF</dc:title>  </rdf:Description> </rdf:RDF> @prefix dc: <http://purl.org/dc/elements/1.1> . <urn:isbn:0596002637> dc:title ‘Practical RDF’ . Source Alistair Miles, SKOS Core Tutorial, DC-2005 Madrid
W3C SKOS Simple Knowledge Organization System 21
SKOS Structure de base skos:Concept Etiquetage lexical skos:prefLabel, skos:altLabel, skos:hiddenLabel Etiquetage symbolique skos:prefSymbol, skos:altSymbol Documentation skos:definition, skos:note, skos:example, skos:scopeNote, skos:historyNote, skos:editorialNote, skos:changeNote Relations sémantiques skos:broader, skos:narrower, skos:related 22
Structure de base Concept scheme permet de décrire tous les systèmes de terminologies Thesaurus, système de  classification, autorités, vocabulaires contrôlés ... Il est défini comme un ensemble de concepts, éventuellement avec des propriétés et des relations avec d’autres concepts Concept 23
Concept Scheme 24
Skos:Concept 25 Source Alistair Miles
Labels lexicaux 26 Source Alistair Miles
Multilingues 27 Source Alistair Miles
Labels symboliques 28 Source Alistair Miles
Les relations Broader, Narrower, Related http://www.w3.org/2004/02/skos/
Questions liées à la transitivité Problème si skos:related était transitif ex:renaissance skos:related ex:humanism.  ex:humanism skos:related ex:philosophicalAnthropology ex:philosophicalAnthropology skos:related ex:philosophyOfMind ex:philosophyOfMind skos:related ex:cognitiveScience. 30 http://www.w3.org/2004/02/skos/
Propriétés de mapping skos:mappingRelation  skos:closeMatch  skos:exactMatch  skos:broadMatch skos:narrowMatch  skos:relatedMatch 31
Exemple de Skosification Rameau http://rameau.bnf.fr/informations/pdf/journee2008/rameau_skos.pdf
Exemple SKOS Issu de LCSH http://id.loc.gov/authorities/sj96005060.rdf 33
Linked Data 34
Construire le Web de données Des données sous forme de RDF statements Identification des ressources via des HTTP URIs « dé-référençables » Il doit être possible de cliquer et obtenir de l’information Distinction « information resources » (lien vers la ressource) and « non information resources » (redirection vers une ressource d’intérêt) Représentations multiples des ressources Au moins RDF/XML Négociation de contenu 35 Dublin Core
Une source de données Il est préférable d’utiliser des relations vers des sources de données externes (ex: dbpedia) 36 http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
Fusion de graphes 37 http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
Lier des graphes a posteriori Si une ressource est désignée avec 2 URIs différentes dans 2 sources de données différentes Il est possible d’ajouter une équivalence entre les URIs grâce à owl:sameAs 38 <http://dbpedia.org/resource/Berlin>  		owl:sameAs  <http://sws.geonames.org/2950159/>
Publier des données sur des terminologies 39
Une publication orientée service 40 http://www.viaf.org/
Des points d’accès alternatifs Header de la page LCSH Contient des relations alternate et search http://id.loc.gov/authorities/ 41
SKOS en RDFa Les données sont encodées dans la page HTML http://id.loc.gov/authorities/ 42
SKOS de Christianity – History http://id.loc.gov/authorities/sj96005060.rdf Semantic Web http://id.loc.gov/authorities/sh2002000569#concept 43
SKOS-XML de Christianity – History Issu de LCSH http://id.loc.gov/authorities/sj96005060.rdf 44
Des métadonnées classiques au monde sémantique 45
Dublin Core: différentes ères Des métadonnées simples pour les ressources Web Orientées « discovery » Faire mieux que l’anarchie 15 éléments Des « qualifiers » Dcterms Qualifiers (ex hasVersion) ou de premier niveau (ex. audience) Des profils d’applications DC Collection, DC Education, DC Library etc Des terminologies Des termes pour indiquer les terminologies 46
Vers une structure sémantique Une structure différente Ex avec les qualifiers de DC:Relation Replaces, requires hasVersion, isPartOf Le DCAM et la Singapour Framework Un modèle de données Des propriétés ,[object Object]
dcterms:title47
Un registry 48 http://dcmi.kc.tsukuba.ac.jp/dcregistry/
Représentations multiples d’une ressource 49

Más contenido relacionado

Destacado

Réponse immunitaire innée chez la drosophile 2007
Réponse immunitaire innée chez la drosophile 2007Réponse immunitaire innée chez la drosophile 2007
Réponse immunitaire innée chez la drosophile 2007Indoumady Baskara
 
Forum Villes2 0 Marseille Provence
Forum Villes2 0 Marseille ProvenceForum Villes2 0 Marseille Provence
Forum Villes2 0 Marseille ProvenceFing
 
Guillaume Mazain (Videology) - Télé et vidéo : la grande convergence - Ma...
Guillaume Mazain (Videology)  - Télé et vidéo : la grande convergence - Ma...Guillaume Mazain (Videology)  - Télé et vidéo : la grande convergence - Ma...
Guillaume Mazain (Videology) - Télé et vidéo : la grande convergence - Ma...Viuz
 
4 ideas medievales que pasan por modernas
4 ideas medievales que pasan por modernas4 ideas medievales que pasan por modernas
4 ideas medievales que pasan por modernasaugustodefranco .
 
Annonces du french scrum user group - rencontre du 24 juin 2011
Annonces du french scrum user group - rencontre du 24 juin 2011Annonces du french scrum user group - rencontre du 24 juin 2011
Annonces du french scrum user group - rencontre du 24 juin 2011Xavier Warzee
 
Belllissima nature s-best_photography
Belllissima  nature s-best_photographyBelllissima  nature s-best_photography
Belllissima nature s-best_photographyMaria Grazia
 
Tecnologias educativas virtuales en los procesos de formación de la Administr...
Tecnologias educativas virtuales en los procesos de formación de la Administr...Tecnologias educativas virtuales en los procesos de formación de la Administr...
Tecnologias educativas virtuales en los procesos de formación de la Administr...Dolors Capdet
 
El Condon En El Agua
El Condon En El AguaEl Condon En El Agua
El Condon En El Aguacentrowebs
 
Informatique_Libertés_Identités
Informatique_Libertés_IdentitésInformatique_Libertés_Identités
Informatique_Libertés_IdentitésFing
 
Analyse et Optimisation des « Landing Pages » - SMX 2010
Analyse et Optimisation des « Landing Pages » - SMX 2010Analyse et Optimisation des « Landing Pages » - SMX 2010
Analyse et Optimisation des « Landing Pages » - SMX 2010Vincent BOUTON
 
Nathan Stern Voisin-age
Nathan Stern Voisin-ageNathan Stern Voisin-age
Nathan Stern Voisin-ageFing
 

Destacado (20)

Réponse immunitaire innée chez la drosophile 2007
Réponse immunitaire innée chez la drosophile 2007Réponse immunitaire innée chez la drosophile 2007
Réponse immunitaire innée chez la drosophile 2007
 
Présentation formation as
Présentation formation asPrésentation formation as
Présentation formation as
 
Forum Villes2 0 Marseille Provence
Forum Villes2 0 Marseille ProvenceForum Villes2 0 Marseille Provence
Forum Villes2 0 Marseille Provence
 
Guillaume Mazain (Videology) - Télé et vidéo : la grande convergence - Ma...
Guillaume Mazain (Videology)  - Télé et vidéo : la grande convergence - Ma...Guillaume Mazain (Videology)  - Télé et vidéo : la grande convergence - Ma...
Guillaume Mazain (Videology) - Télé et vidéo : la grande convergence - Ma...
 
Le blogue toronto
Le blogue torontoLe blogue toronto
Le blogue toronto
 
Bullying
BullyingBullying
Bullying
 
Suspensions
SuspensionsSuspensions
Suspensions
 
4 ideas medievales que pasan por modernas
4 ideas medievales que pasan por modernas4 ideas medievales que pasan por modernas
4 ideas medievales que pasan por modernas
 
Mémoire pdf
Mémoire pdfMémoire pdf
Mémoire pdf
 
Annonces du french scrum user group - rencontre du 24 juin 2011
Annonces du french scrum user group - rencontre du 24 juin 2011Annonces du french scrum user group - rencontre du 24 juin 2011
Annonces du french scrum user group - rencontre du 24 juin 2011
 
Belllissima nature s-best_photography
Belllissima  nature s-best_photographyBelllissima  nature s-best_photography
Belllissima nature s-best_photography
 
Tecnologias educativas virtuales en los procesos de formación de la Administr...
Tecnologias educativas virtuales en los procesos de formación de la Administr...Tecnologias educativas virtuales en los procesos de formación de la Administr...
Tecnologias educativas virtuales en los procesos de formación de la Administr...
 
El Condon En El Agua
El Condon En El AguaEl Condon En El Agua
El Condon En El Agua
 
Informatique_Libertés_Identités
Informatique_Libertés_IdentitésInformatique_Libertés_Identités
Informatique_Libertés_Identités
 
Analyse et Optimisation des « Landing Pages » - SMX 2010
Analyse et Optimisation des « Landing Pages » - SMX 2010Analyse et Optimisation des « Landing Pages » - SMX 2010
Analyse et Optimisation des « Landing Pages » - SMX 2010
 
Sida
SidaSida
Sida
 
Nathan Stern Voisin-age
Nathan Stern Voisin-ageNathan Stern Voisin-age
Nathan Stern Voisin-age
 
NANEC2010 /11
NANEC2010 /11NANEC2010 /11
NANEC2010 /11
 
Ariketa 7
Ariketa 7Ariketa 7
Ariketa 7
 
1@+tu=1€ - Resultados 07
1@+tu=1€ - Resultados 071@+tu=1€ - Resultados 07
1@+tu=1€ - Resultados 07
 

Similar a Modélisation, environnements sémantiques et Web de données

Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationcatherine roussey
 
L'interopérabilité et l'implémentation de la norme
L'interopérabilité et l'implémentation de la normeL'interopérabilité et l'implémentation de la norme
L'interopérabilité et l'implémentation de la normeADBS
 
Présentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonPrésentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonAssociationAF
 
Sibille jacobson thesaurus
Sibille jacobson thesaurusSibille jacobson thesaurus
Sibille jacobson thesaurusAssociationAF
 
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? ADBS
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Julien PLU
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Sp6 Yann Nicolas
Sp6 Yann NicolasSp6 Yann Nicolas
Sp6 Yann Nicolasent12701
 
Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Sylvie Dalbin
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
 
Perspectives pour les référentiels à l'heure du Web de données
Perspectives pour les référentiels à l'heure du Web de donnéesPerspectives pour les référentiels à l'heure du Web de données
Perspectives pour les référentiels à l'heure du Web de donnéesAntidot
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèquesolivier
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022François-Xavier Boffy
 
Datalift at SemWebPro
Datalift at SemWebProDatalift at SemWebPro
Datalift at SemWebProDatalift
 
Oe Abes Mai2008
Oe Abes Mai2008Oe Abes Mai2008
Oe Abes Mai2008olivier
 
Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Antoine Isaac
 

Similar a Modélisation, environnements sémantiques et Web de données (20)

Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
L'interopérabilité et l'implémentation de la norme
L'interopérabilité et l'implémentation de la normeL'interopérabilité et l'implémentation de la norme
L'interopérabilité et l'implémentation de la norme
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Présentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonPrésentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel Jacobson
 
Sibille jacobson thesaurus
Sibille jacobson thesaurusSibille jacobson thesaurus
Sibille jacobson thesaurus
 
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ? RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
RDA : le nouveau paradigme du catalogage (2). Qu'est-ce que le RDA ?
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!!
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Sp6 Yann Nicolas
Sp6 Yann NicolasSp6 Yann Nicolas
Sp6 Yann Nicolas
 
Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)Référentiels de représentation des contenus (2008)
Référentiels de représentation des contenus (2008)
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Perspectives pour les référentiels à l'heure du Web de données
Perspectives pour les référentiels à l'heure du Web de donnéesPerspectives pour les référentiels à l'heure du Web de données
Perspectives pour les référentiels à l'heure du Web de données
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèques
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Datalift at SemWebPro
Datalift at SemWebProDatalift at SemWebPro
Datalift at SemWebPro
 
Webinaire irp 20170120
Webinaire irp 20170120Webinaire irp 20170120
Webinaire irp 20170120
 
Oe Abes Mai2008
Oe Abes Mai2008Oe Abes Mai2008
Oe Abes Mai2008
 
Outils Web Sémantique
Outils Web SémantiqueOutils Web Sémantique
Outils Web Sémantique
 
Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)
 

Más de chessmu

Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? chessmu
 
Smart semantic content for the Future Internet
Smart semantic content for the Future InternetSmart semantic content for the Future Internet
Smart semantic content for the Future Internetchessmu
 
Mtsr foulonneau-14102011
Mtsr foulonneau-14102011Mtsr foulonneau-14102011
Mtsr foulonneau-14102011chessmu
 
Generating educational assessment items from Linked Open Data
Generating educational assessment items from Linked Open DataGenerating educational assessment items from Linked Open Data
Generating educational assessment items from Linked Open Datachessmu
 
Metadata for Assessment resources
Metadata for Assessment resourcesMetadata for Assessment resources
Metadata for Assessment resourceschessmu
 
Tentative de conclusion Journées Fredoc 2009 OAI-PMH
Tentative de conclusion Journées Fredoc 2009 OAI-PMHTentative de conclusion Journées Fredoc 2009 OAI-PMH
Tentative de conclusion Journées Fredoc 2009 OAI-PMHchessmu
 
Open Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata HarvestingOpen Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata Harvestingchessmu
 
Dublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériquesDublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériqueschessmu
 
Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications chessmu
 
Infrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-PortailsInfrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-Portailschessmu
 
Archives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives EuropeennesArchives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives Europeenneschessmu
 
Virtual Collections for researchers
Virtual Collections for researchersVirtual Collections for researchers
Virtual Collections for researcherschessmu
 
Dublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task groupDublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task groupchessmu
 
Stratégie de partage des ressources
Stratégie de partage des ressources  Stratégie de partage des ressources
Stratégie de partage des ressources chessmu
 

Más de chessmu (14)

Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services? Le Web de données - nouvelles pratiques de publication et nouveaux services?
Le Web de données - nouvelles pratiques de publication et nouveaux services?
 
Smart semantic content for the Future Internet
Smart semantic content for the Future InternetSmart semantic content for the Future Internet
Smart semantic content for the Future Internet
 
Mtsr foulonneau-14102011
Mtsr foulonneau-14102011Mtsr foulonneau-14102011
Mtsr foulonneau-14102011
 
Generating educational assessment items from Linked Open Data
Generating educational assessment items from Linked Open DataGenerating educational assessment items from Linked Open Data
Generating educational assessment items from Linked Open Data
 
Metadata for Assessment resources
Metadata for Assessment resourcesMetadata for Assessment resources
Metadata for Assessment resources
 
Tentative de conclusion Journées Fredoc 2009 OAI-PMH
Tentative de conclusion Journées Fredoc 2009 OAI-PMHTentative de conclusion Journées Fredoc 2009 OAI-PMH
Tentative de conclusion Journées Fredoc 2009 OAI-PMH
 
Open Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata HarvestingOpen Archives Initiative Protocol for Metadata Harvesting
Open Archives Initiative Protocol for Metadata Harvesting
 
Dublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériquesDublin Core et partage de métadonnées - Faire interagir les objets numériques
Dublin Core et partage de métadonnées - Faire interagir les objets numériques
 
Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications Dublin Core Metadata Initiative - Exemples d'applications
Dublin Core Metadata Initiative - Exemples d'applications
 
Infrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-PortailsInfrastructures de recherche - Meta-Portails
Infrastructures de recherche - Meta-Portails
 
Archives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives EuropeennesArchives ouvertes - Perspectives Europeennes
Archives ouvertes - Perspectives Europeennes
 
Virtual Collections for researchers
Virtual Collections for researchersVirtual Collections for researchers
Virtual Collections for researchers
 
Dublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task groupDublin Core Collection Application Profile - task group
Dublin Core Collection Application Profile - task group
 
Stratégie de partage des ressources
Stratégie de partage des ressources  Stratégie de partage des ressources
Stratégie de partage des ressources
 

Modélisation, environnements sémantiques et Web de données

  • 1. Juin 2010 muriel.foulonneau@tudor.lu 1 Modélisation, environnements sémantiques et Web de données Muriel Foulonneau Centre de Recherche Public Henri Tudor Luxembourg séminaire ISKO juin 2010
  • 3. Objectif La représentation des données De la forme traditionnelle à une publication avec les technologies sémantiques Partager Les descriptions mais aussi leur sens et les associations 3
  • 4.
  • 7.
  • 11. Les terminologies Les vocabulaires contrôlés Réduire l’ambiguité du langage naturel lorsque l’on décrit et recherche des informations. Composé de termes utilisés pour représenter un concept Problèmes Des particularités du langage naturel posent des problèmes (synonymes et ambiguité) Différents termes (synonymes) peuvent représenter le même concept. Le même terme (homographes) peut représenter différents concepts. 6
  • 12. Différents types de terminologies Liste contrôlée non hiérarchisée Taxonomie et système de classification (avec organisation hiérarchique) Thésaurus Équivalence Hiérarchique (termes génériques/spécifiques) Association (voir aussi) => Pour intégrer des synonymes dans des recherches, élargir des recherches, naviguer, représenter, … 7
  • 13. Listes de termes Pour permettre de gérer les ambiguités. Des fichiers d’autorité comportent des variantes d’un nom. Les glossaires sont des listes de termes avec leurs définitions dans un domaine spécifique Dictionnaires, ils incluent différentes acceptions d’un terme, ils sont présentés de manière alphabétique, avec éventuellement des informations sur l’origine du terme “Gazetteers” avec des noms de lieux, leur position etc “Synonym Rings” pour étendre des requêtes de manière transparente 8
  • 14. Taxonomies Organisation hiérarchique de catégories Généralement utilisées pour classifier 9 http://biodiversite.wallonie.be/cgi/sibw.esp.list2.pl?VAR=Mammiferes
  • 15. Autorités sujet Listes contrôlées de sujet Ex Rameau, LCSH, MeSH Permettent souvent des compositions Peuvent inclure des sous-catégories 10
  • 16. Thésaurus Pour de la recherche Ensemble limité de relations entre les termes Equivalence (synonymes) Hiérarchique (termes génériques / spécifiques) générique (sous-classe/super-classe), instance (classe/instance) et partitive (tout-partie) Association (voir aussi). 11
  • 17. Systèmes de classification Similaires à des taxonomies Visent à l’exhaustivité et en principe les concepts ne se recouvrent pas (appartenance exclusive). Systèmes énumératifs (tous les concepts sont explicites) ou synthétiques (des règles permettent des combinaisons de concepts) Les facettesprésentes desclassifications selon des dimensions qui s’excluent mutuellement 12
  • 18. Les bases lexicales Des relations plus riches que celles des thésaurus, éventuellement spécifiques à chaque base Ex. WordNet inclut homonymie, antonymie, synonymie 13 http://wordnetweb.princeton.edu/perl/webwn?s=mill&sub=Search+WordNet&o2=&o0=1&o7=&o5=&o1=1&o6=&o4=&o3=&h=
  • 19. Les ontologies Modélisation d’un domaine avec des classes, des instances, des attributs, des sous-classes, … et de nombreuses relations spécifiques. Ex. CIDOC-CRM (Martin Doerr, Stephen Stead http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt) E52 Time-Span E53 Place E39 Actor 7012124 E38 Image E31 Document “Yalta Agreement” E52 Time-Span E39 Actor E39 Actor 1945-02-11 February 1945 P82 at some time within P7 took place at P11 participated in E7 Activity “Crimea Conference” P86 falls within P67 is referred to by E65 Creation Event * 14 P81 ongoing throughout P14 performed P94 has created
  • 20. Folksonomies Pour indexation par une communauté d’utilisateurs cinema people vs movie people (C. Shirky) 15 http://www.flickr.com/photos/tags/
  • 22. Technologies sémantiques RDF Classes et instances 17 http://moi/est_employee_par Alice CNRS foaf:name Alice Dupont Foaf:organization Foaf:person rdfs:subclass_of Moi:research_organization rdf:type rdf:type http://moi/est_employee_par Alice CNRS
  • 23. Les règles Je peux par exemple définir que Si foaf:person http://moi/est_employee_parFoaf:organization Et Foaf:organization http://moi/localisation x => Alors foaf:person http://moi/localisation x 18 Foaf:organization Foaf:person Moi:research_organization rdf:type rdf:type http://moi/est_employee_par http://moi/localisation Alice CNRS Paris
  • 24. La transitivité 19 foaf:knows foaf:knows Alice Charles Hugues foaf:knows http://moi/a_le_meme_age_que http://moi/a_le_meme_age_que Alice Charles Hugues
  • 25. Syntaxes RDF/XML Turtle etc 20 <rdf:RDFxmlns:rdf=‘http://www.w3.org/1999/02/22-rdf-syntax-ns# ’xmlns:dc=‘http://purl.org/dc/elements/1.1/’> <rdf:Descriptionrdf:about=‘urn:isbn:0596002637’> <dc:title>Practical RDF</dc:title> </rdf:Description> </rdf:RDF> @prefix dc: <http://purl.org/dc/elements/1.1> . <urn:isbn:0596002637> dc:title ‘Practical RDF’ . Source Alistair Miles, SKOS Core Tutorial, DC-2005 Madrid
  • 26. W3C SKOS Simple Knowledge Organization System 21
  • 27. SKOS Structure de base skos:Concept Etiquetage lexical skos:prefLabel, skos:altLabel, skos:hiddenLabel Etiquetage symbolique skos:prefSymbol, skos:altSymbol Documentation skos:definition, skos:note, skos:example, skos:scopeNote, skos:historyNote, skos:editorialNote, skos:changeNote Relations sémantiques skos:broader, skos:narrower, skos:related 22
  • 28. Structure de base Concept scheme permet de décrire tous les systèmes de terminologies Thesaurus, système de classification, autorités, vocabulaires contrôlés ... Il est défini comme un ensemble de concepts, éventuellement avec des propriétés et des relations avec d’autres concepts Concept 23
  • 30. Skos:Concept 25 Source Alistair Miles
  • 31. Labels lexicaux 26 Source Alistair Miles
  • 32. Multilingues 27 Source Alistair Miles
  • 33. Labels symboliques 28 Source Alistair Miles
  • 34. Les relations Broader, Narrower, Related http://www.w3.org/2004/02/skos/
  • 35. Questions liées à la transitivité Problème si skos:related était transitif ex:renaissance skos:related ex:humanism. ex:humanism skos:related ex:philosophicalAnthropology ex:philosophicalAnthropology skos:related ex:philosophyOfMind ex:philosophyOfMind skos:related ex:cognitiveScience. 30 http://www.w3.org/2004/02/skos/
  • 36. Propriétés de mapping skos:mappingRelation skos:closeMatch skos:exactMatch skos:broadMatch skos:narrowMatch skos:relatedMatch 31
  • 37. Exemple de Skosification Rameau http://rameau.bnf.fr/informations/pdf/journee2008/rameau_skos.pdf
  • 38. Exemple SKOS Issu de LCSH http://id.loc.gov/authorities/sj96005060.rdf 33
  • 40. Construire le Web de données Des données sous forme de RDF statements Identification des ressources via des HTTP URIs « dé-référençables » Il doit être possible de cliquer et obtenir de l’information Distinction « information resources » (lien vers la ressource) and « non information resources » (redirection vers une ressource d’intérêt) Représentations multiples des ressources Au moins RDF/XML Négociation de contenu 35 Dublin Core
  • 41. Une source de données Il est préférable d’utiliser des relations vers des sources de données externes (ex: dbpedia) 36 http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
  • 42. Fusion de graphes 37 http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/
  • 43. Lier des graphes a posteriori Si une ressource est désignée avec 2 URIs différentes dans 2 sources de données différentes Il est possible d’ajouter une équivalence entre les URIs grâce à owl:sameAs 38 <http://dbpedia.org/resource/Berlin> owl:sameAs <http://sws.geonames.org/2950159/>
  • 44. Publier des données sur des terminologies 39
  • 45. Une publication orientée service 40 http://www.viaf.org/
  • 46. Des points d’accès alternatifs Header de la page LCSH Contient des relations alternate et search http://id.loc.gov/authorities/ 41
  • 47. SKOS en RDFa Les données sont encodées dans la page HTML http://id.loc.gov/authorities/ 42
  • 48. SKOS de Christianity – History http://id.loc.gov/authorities/sj96005060.rdf Semantic Web http://id.loc.gov/authorities/sh2002000569#concept 43
  • 49. SKOS-XML de Christianity – History Issu de LCSH http://id.loc.gov/authorities/sj96005060.rdf 44
  • 50. Des métadonnées classiques au monde sémantique 45
  • 51. Dublin Core: différentes ères Des métadonnées simples pour les ressources Web Orientées « discovery » Faire mieux que l’anarchie 15 éléments Des « qualifiers » Dcterms Qualifiers (ex hasVersion) ou de premier niveau (ex. audience) Des profils d’applications DC Collection, DC Education, DC Library etc Des terminologies Des termes pour indiquer les terminologies 46
  • 52.
  • 54. Un registry 48 http://dcmi.kc.tsukuba.ac.jp/dcregistry/
  • 58. Structures et activités du DCMI Usage Board, Advisory Board Des communautés et des task groups Les conférences Un task group KOS pour décrire les KOS SWAP validé comme DC AP 52
  • 59. Comment rendre une terminologie sémantique? La skosifier? Le modèle Rendre explicites un certain nombre de relations L’encoder (et la valider) La référencer et l’exposer: linked data, registries, repositories… S’assurer que les collections référencent correctement la terminologie 53
  • 60. Des terminologies sur le Web sémantique Partage Modèle décentralisé L’exploitation des ressources sur le Web via de simples liens Descriptions non ambigües, pour les machines Le principe 1 – 1 Faut-il penser comme une machine? problèmes de validité, fiabilité, autorité, qualité Modèles d’inférences 54
  • 61. Références CRM tutorial at Imperial College, UK, May 22, 2009 .Martin Doerr, Steve Stead, The CIDOC CRM, a Standard for the Integration of Cultural Information http://cidoc.ics.forth.gr/docs/crm_for_imperial_2009.ppt Alistair Miles, SKOS Core Tutorial, DC Conference 2005, Madrid Douglas Tudhope, Traugott Koch, Rachel Heery, Terminology Services and Technology  - JISC state of the art review http://www.ukoln.ac.uk/terminology/TSreview-jisc-final-Sept.html Chris Bizer , Richard Cyganiak, Tom HeathHow to Publish Linked Data on the Web, 2007, http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ http://ivan-herman.name/2009/05/01/library-of-congress-subject-headings-in-skos-on-line/ http://dublincore.org/documents/abstract-model/ Clay Shirky, Ontology is Overrated: Categories, Links, and Tags http://www.shirky.com/writings/ontology_overrated.html Thierry Boucher, Le vocabulaire Rameau en SKOS, http://rameau.bnf.fr/informations/pdf/journee2008/rameau_skos.pdf 55