SlideShare una empresa de Scribd logo
1 de 32
Descargar para leer sin conexión
Portails documentaires et
référentiels du Web sémantique :
exemples et enjeux à venir à partir
de HDA-Lab et DBpedia
Alexandre Monnin

Paris 1, PhiCo, EXeCO
Inria, Wimmics
Membre du réseau d’expert Open Data
d’Etalab

Les portails documentaires : un atout pour les archives ?
Journée d’étude ALMA
14 février 2014
Le portail Histoires des arts (HDA)
Près de 5000 ressources agrégées et commentées pour
l'enseignement de l'histoire des arts : dossiers pédagogiques,
expositions virtuelles, vidéos... ainsi que des repères chronologiques
par domaines artistiques (architecture, bande dessinée, littérature,
jardins, musique, peinture, théâtre...).
• Toutes les périodes
• Toutes les civilisations
• Tous les domaines artistiques

 Grande hétérogénéité des institutions impliquées (+300)
 Grande hétérogénéité des contributeurs de ces institution au
portail HDA
Enjeux d’une indexation commune
• Un seul modèle pour toutes les
institutions ?
• Un seul modèle pour tous les éléments
du corpus ?
• Un seul domaine pour toutes les période ?
• Un seul modèle pour toutes les civilisations ?
• Un seul modèle pour tous les domaines artistiques ?
?
Three Rings for the Elven-kings
under the sky,
Seven for the Dwarf-lords in their
halls of stone,
Nine for Mortal Men doomed to die,
One for the Dark Lord on his dark
throne
In the Land of Mordor where the
Shadows lie.
One Ring to rule them all, One Ring
to find them,
One Ring to bring them all and in
the darkness bind them
In the Land of Mordor where the
Shadows lie.
Se mettre d’accord
Autour d’une table ?
Une grande table alors…
Solution

Le tagging libre augmenté
 libre en amont (pas d’anneau unique,
faible barrière d’entrée)
 augmenté en aval (une lingua franca
post-hoc)
Où trouver les entités/concepts dont
nous avons besoin ?
DBpedia ?
En France: SemanticPedia (convention)
• 8 semaines pour sémantiser 16 000 mots-clefs
de HDA (données ouvertes disponibles sur
data.gouv.fr).
• Mise en place dans le back-office de la plateforme HDA d’un workflow semi-automatique
de tagging lié à DBpedia (analyse des notices,
et suggestion de liaison avec des URI de
DBpedia aux utilisateurs)
Verdict
Wikipedia répond aux besoins du tagging culturel
• 2012 : 77, 2 % des tags ont pu être liés à
Wikipedia en français (en passant par la version
anglaise à l’époque, chiffre qu’il faut donc revoir
sensiblement à la hausse).
• 2012 : 83 % des tags utilisés l’ont été plus d’une
fois par les visiteurs du site.
• Octobre 2012 : 100 % des 100 mots-clefs les plus
fréquemment utilisés par les visiteurs du site sont
appariés à Wikipedia/DBpedia.
Enrichissement
•
•
•
•
•

Désambiguïsation
Gestion de la synonymie
Descriptions
Illustrations
Coordonnées géographiques…
Créer une boucle vertueuse
réutilisation <-> contribution
Mobiliser les agents pour que les thèmes traités aient une représentation sur
WP
 Améliore DBpedia
 Améliore les applications qui utilisent DBPedia
 etc.

De plus en plus d’initiatives impliquent des institutionnels (mapping parties
avec Open Street Map, résidence au château de Versailles, etc.).

« nos établissements sont invités à leur tour à consolider, à enrichir ou à
rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement
d’augmenter la qualité de ses articles en langue française, mais aussi son
efficacité sur le Web sémantique. »
(Aurélie Filippetti, 19 novembre 2012)
Simplicité : pas d’appel aux couches
supérieures du Web Sémantique
Linked Open Data
• Use URIs as names for things
• Use HTTP URIs so that people can look up
those names.
• When someone looks up a URI, provide useful
information, using the standards (RDF*,
SPARQL)
• Include links to other URIs. so that they can
discover more things.
Enrichissement multilingue
• Lien entre les différentes versions linguistiques
de Wikipedia
= équivalents linguistique des entrées
(dont des mots-clefs)
= recherche multilingue à coût quasi- nul
(traduction des interfaces)
= désenclavement linguistique du corpus
traité
Plus-value « sémantique »
A tester sur HDA-Lab : http://hdalab.iriresearch.org/hdalab/
Aujourd’hui
• Le projet Joconde Lab (http://jocondelab.iriresearch.org/jocondelab/) a prolongé l’effort
initié avec HDA-Lab.
• Corpus de 500.000 notices d'objets de toute
nature (archéologie, beaux-arts, ethnologie,
histoire, sciences et techniques...) valorisées par
des parcours thématiques, des zooms et des
expositions virtuelles, valorisé par des parcours
thématiques dans les images.
• Même principe que HDA : 80 % des descripteurs
utilisés sur Joconde sont couverts du Wikipedia
Merci !

Más contenido relacionado

La actualidad más candente

Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...scduag
 
Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?scduag
 
Partenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets WikimediaPartenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets WikimediaLesticetlart Invisu
 
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...CTLes
 
Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...eGov Innovation Center
 
5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert PoirotCTLes
 
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...Jeannette Frey
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...AssociationAF
 
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...CTLes
 
OPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvertOPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvertpierre mounier
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Jean-Michel Mermet
 
Digital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcingDigital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcingeGov Innovation Center
 
Bibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles HumanistesBibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles HumanistesEquipex Biblissima
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaEquipex Biblissima
 
Free & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisationsFree & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisationsAtelier-Francais
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesPierre Couchet
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...ABES
 
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...Michèle Furer-Benedetti
 

La actualidad más candente (20)

Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
Bibliothèque et diffusion de la recherche sur les catastrophes naturelles : l...
 
Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?Wikipédia : un outil de médiation pour les bibliothèques numériques ?
Wikipédia : un outil de médiation pour les bibliothèques numériques ?
 
Partenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets WikimediaPartenariats et projets GLAM. Au sein des projets Wikimedia
Partenariats et projets GLAM. Au sein des projets Wikimedia
 
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
7Jpros : Politique documentaire physique et numérique de la BnF : la compléme...
 
Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...Les données de l’administration à travers le temps ou comment valoriser un pa...
Les données de l’administration à travers le temps ou comment valoriser un pa...
 
5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot5Jpro CTLes : intervention Albert Poirot
5Jpro CTLes : intervention Albert Poirot
 
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
La stratégie LIBER en action: quelles actions des bibliothèques de recherche ...
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
 
20111128rechercheinfo_slsh
20111128rechercheinfo_slsh20111128rechercheinfo_slsh
20111128rechercheinfo_slsh
 
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
7Jpros : L’Europe de la coopération des bibliothèques par Dr Marian Koren #CT...
 
OPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvertOPERAS : une infrastructure européenne pour les livres en accès ouvert
OPERAS : une infrastructure européenne pour les livres en accès ouvert
 
Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...Des outils de recherche en libre accès - Open Access week 2015 - université G...
Des outils de recherche en libre accès - Open Access week 2015 - université G...
 
Digital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcingDigital Valais, la mémoire d’un canton via le crowdsourcing
Digital Valais, la mémoire d’un canton via le crowdsourcing
 
Redis keynote
Redis keynoteRedis keynote
Redis keynote
 
Bibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles HumanistesBibliothèques Virtuelles Humanistes
Bibliothèques Virtuelles Humanistes
 
A la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail BiblissimaA la recherche du patrimoine écrit avec le portail Biblissima
A la recherche du patrimoine écrit avec le portail Biblissima
 
Free & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisationsFree & Open Data dans le secteur culturel : quelques réalisations
Free & Open Data dans le secteur culturel : quelques réalisations
 
Omeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériquesOmeka, une plateforme pour les humanités numériques
Omeka, une plateforme pour les humanités numériques
 
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
Jabes 2011 - Sessions parallèles : Retours d'expériences innovantes - " ISIDO...
 
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
L’Open Access dans les carrières académiques - Quelle stratégie Open Access p...
 

Similar a Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia

HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
 HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantiqueBe_Sa
 
C - Débats et usages autour des wikis
C - Débats et usages autour des wikisC - Débats et usages autour des wikis
C - Débats et usages autour des wikisDavid Liziard
 
Les archives ouvertes et l'architecture
Les archives ouvertes et l'architectureLes archives ouvertes et l'architecture
Les archives ouvertes et l'architectureacquier
 
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...OpenEdition
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériquesOpenEdition
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèquesolivier
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version CourteDavid Liziard
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicAlexandre Monnin
 
Projets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf pacaProjets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf pacaFranck Queyraud
 
Présentation Comité de projets Inria Sophia
Présentation Comité de projets Inria SophiaPrésentation Comité de projets Inria Sophia
Présentation Comité de projets Inria SophiaAlexandre Monnin
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimonialesABES
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseolivier
 
Usage des API de HAL
Usage des API de HALUsage des API de HAL
Usage des API de HALOAccsd
 
Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Parc De Camargue
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesSemWebPro
 

Similar a Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia (20)

Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
 HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
HDA-Lab… suite. Quelques réflexions sur Wiki/DB-pédia et le tagging sémantique
 
C - Débats et usages autour des wikis
C - Débats et usages autour des wikisC - Débats et usages autour des wikis
C - Débats et usages autour des wikis
 
Les archives ouvertes et l'architecture
Les archives ouvertes et l'architectureLes archives ouvertes et l'architecture
Les archives ouvertes et l'architecture
 
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
Open edition et dariah. L'édition électronique scientifique à l'échelle europ...
 
Netizenship et Wikipedia
Netizenship et WikipediaNetizenship et Wikipedia
Netizenship et Wikipedia
 
Wikis 2008
Wikis 2008Wikis 2008
Wikis 2008
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériques
 
Web 2.0 et bibliothèques
Web 2.0 et bibliothèquesWeb 2.0 et bibliothèques
Web 2.0 et bibliothèques
 
Urfist Wiki Version Courte
Urfist Wiki Version CourteUrfist Wiki Version Courte
Urfist Wiki Version Courte
 
Urfist Wiki 2007
Urfist Wiki 2007Urfist Wiki 2007
Urfist Wiki 2007
 
DBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du publicDBpedia ou le Linked Open Data et la question du public
DBpedia ou le Linked Open Data et la question du public
 
Projets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf pacaProjets wikimedia hervé goldberg présentation abf paca
Projets wikimedia hervé goldberg présentation abf paca
 
Présentation Comité de projets Inria Sophia
Présentation Comité de projets Inria SophiaPrésentation Comité de projets Inria Sophia
Présentation Comité de projets Inria Sophia
 
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
3 focus catalogues-et_bibliothequesnumeriquespatrimoniales
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
 
Test
TestTest
Test
 
Usage des API de HAL
Usage des API de HALUsage des API de HAL
Usage des API de HAL
 
Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 

Más de Alexandre Monnin

La 5G comme "commun négatif"
La 5G comme "commun négatif"La 5G comme "commun négatif"
La 5G comme "commun négatif"Alexandre Monnin
 
The (de)feasibility of smart cities
The (de)feasibility of smart citiesThe (de)feasibility of smart cities
The (de)feasibility of smart citiesAlexandre Monnin
 
Quel avenir pour le numérique
Quel avenir pour le numériqueQuel avenir pour le numérique
Quel avenir pour le numériqueAlexandre Monnin
 
The Future Web (we can afford)
The Future Web (we can afford)The Future Web (we can afford)
The Future Web (we can afford)Alexandre Monnin
 
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Alexandre Monnin
 
L'obsolescence à programmer
L'obsolescence à programmer L'obsolescence à programmer
L'obsolescence à programmer Alexandre Monnin
 
Approcher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireApprocher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireAlexandre Monnin
 
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...Alexandre Monnin
 
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ? Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ? Alexandre Monnin
 
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Alexandre Monnin
 
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the AnthropoceneAlexandre Monnin
 
La question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationLa question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationAlexandre Monnin
 
Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Alexandre Monnin
 
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...Alexandre Monnin
 
Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Alexandre Monnin
 
Façonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationFaçonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationAlexandre Monnin
 
Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Alexandre Monnin
 
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindThe Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindAlexandre Monnin
 

Más de Alexandre Monnin (20)

La 5G comme "commun négatif"
La 5G comme "commun négatif"La 5G comme "commun négatif"
La 5G comme "commun négatif"
 
The (de)feasibility of smart cities
The (de)feasibility of smart citiesThe (de)feasibility of smart cities
The (de)feasibility of smart cities
 
What Future for ICT?
What Future for ICT?What Future for ICT?
What Future for ICT?
 
Quel avenir pour le numérique
Quel avenir pour le numériqueQuel avenir pour le numérique
Quel avenir pour le numérique
 
The Future Web (we can afford)
The Future Web (we can afford)The Future Web (we can afford)
The Future Web (we can afford)
 
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
Quel rôle pour le design à l'heure de l'Anthropocène/Effondrement ?
 
L'obsolescence à programmer
L'obsolescence à programmer L'obsolescence à programmer
L'obsolescence à programmer
 
Approcher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaireApprocher en pragmatiste les mondes en train de se défaire
Approcher en pragmatiste les mondes en train de se défaire
 
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...​Le numérique est notre futur  mais quel est notre avenir ?  (R)évolution num...
​Le numérique est notre futur mais quel est notre avenir ? (R)évolution num...
 
Cours sur REST
Cours sur RESTCours sur REST
Cours sur REST
 
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ? Quel avenir pour le Web et le numérique à  l’heure de l’Anthropocène ?
Quel avenir pour le Web et le numérique à l’heure de l’Anthropocène ?
 
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
Présentation du projet ValueModels (Académie 1 de l'Idex UCA JEDI)
 
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene Asynchronous futures: Digital technologies at the time of the Anthropocene
 Asynchronous futures: Digital technologies at the time of the Anthropocene
 
La question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunicationLa question de la durabilité des technologies de calcul et de télécommunication
La question de la durabilité des technologies de calcul et de télécommunication
 
Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?Le monde devient numérique, a-t-il les moyens de le rester ?
Le monde devient numérique, a-t-il les moyens de le rester ?
 
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...A quoi peuvent servir les  technologies « smart » en regard  d’une vision réa...
A quoi peuvent servir les technologies « smart » en regard d’une vision réa...
 
Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?Transition numérique et effondrement écologique : quel monde d'après ?
Transition numérique et effondrement écologique : quel monde d'après ?
 
Façonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'informationFaçonner les données. Travail et valeur de l'information
Façonner les données. Travail et valeur de l'information
 
Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...Routines et improvisation, à propos de Computation and Human Experience de Ph...
Routines et improvisation, à propos de Computation and Human Experience de Ph...
 
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended MindThe Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
 

Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia

  • 1. Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia Alexandre Monnin Paris 1, PhiCo, EXeCO Inria, Wimmics Membre du réseau d’expert Open Data d’Etalab Les portails documentaires : un atout pour les archives ? Journée d’étude ALMA 14 février 2014
  • 2. Le portail Histoires des arts (HDA)
  • 3. Près de 5000 ressources agrégées et commentées pour l'enseignement de l'histoire des arts : dossiers pédagogiques, expositions virtuelles, vidéos... ainsi que des repères chronologiques par domaines artistiques (architecture, bande dessinée, littérature, jardins, musique, peinture, théâtre...). • Toutes les périodes • Toutes les civilisations • Tous les domaines artistiques  Grande hétérogénéité des institutions impliquées (+300)  Grande hétérogénéité des contributeurs de ces institution au portail HDA
  • 4. Enjeux d’une indexation commune • Un seul modèle pour toutes les institutions ? • Un seul modèle pour tous les éléments du corpus ? • Un seul domaine pour toutes les période ? • Un seul modèle pour toutes les civilisations ? • Un seul modèle pour tous les domaines artistiques ?
  • 5. ? Three Rings for the Elven-kings under the sky, Seven for the Dwarf-lords in their halls of stone, Nine for Mortal Men doomed to die, One for the Dark Lord on his dark throne In the Land of Mordor where the Shadows lie. One Ring to rule them all, One Ring to find them, One Ring to bring them all and in the darkness bind them In the Land of Mordor where the Shadows lie.
  • 6. Se mettre d’accord Autour d’une table ?
  • 7. Une grande table alors…
  • 8. Solution Le tagging libre augmenté  libre en amont (pas d’anneau unique, faible barrière d’entrée)  augmenté en aval (une lingua franca post-hoc)
  • 9. Où trouver les entités/concepts dont nous avons besoin ?
  • 10.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21. En France: SemanticPedia (convention)
  • 22. • 8 semaines pour sémantiser 16 000 mots-clefs de HDA (données ouvertes disponibles sur data.gouv.fr). • Mise en place dans le back-office de la plateforme HDA d’un workflow semi-automatique de tagging lié à DBpedia (analyse des notices, et suggestion de liaison avec des URI de DBpedia aux utilisateurs)
  • 23. Verdict Wikipedia répond aux besoins du tagging culturel • 2012 : 77, 2 % des tags ont pu être liés à Wikipedia en français (en passant par la version anglaise à l’époque, chiffre qu’il faut donc revoir sensiblement à la hausse). • 2012 : 83 % des tags utilisés l’ont été plus d’une fois par les visiteurs du site. • Octobre 2012 : 100 % des 100 mots-clefs les plus fréquemment utilisés par les visiteurs du site sont appariés à Wikipedia/DBpedia.
  • 24. Enrichissement • • • • • Désambiguïsation Gestion de la synonymie Descriptions Illustrations Coordonnées géographiques…
  • 25. Créer une boucle vertueuse réutilisation <-> contribution Mobiliser les agents pour que les thèmes traités aient une représentation sur WP  Améliore DBpedia  Améliore les applications qui utilisent DBPedia  etc. De plus en plus d’initiatives impliquent des institutionnels (mapping parties avec Open Street Map, résidence au château de Versailles, etc.). « nos établissements sont invités à leur tour à consolider, à enrichir ou à rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement d’augmenter la qualité de ses articles en langue française, mais aussi son efficacité sur le Web sémantique. » (Aurélie Filippetti, 19 novembre 2012)
  • 26. Simplicité : pas d’appel aux couches supérieures du Web Sémantique
  • 27. Linked Open Data • Use URIs as names for things • Use HTTP URIs so that people can look up those names. • When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL) • Include links to other URIs. so that they can discover more things.
  • 28. Enrichissement multilingue • Lien entre les différentes versions linguistiques de Wikipedia = équivalents linguistique des entrées (dont des mots-clefs) = recherche multilingue à coût quasi- nul (traduction des interfaces) = désenclavement linguistique du corpus traité
  • 29.
  • 30. Plus-value « sémantique » A tester sur HDA-Lab : http://hdalab.iriresearch.org/hdalab/
  • 31. Aujourd’hui • Le projet Joconde Lab (http://jocondelab.iriresearch.org/jocondelab/) a prolongé l’effort initié avec HDA-Lab. • Corpus de 500.000 notices d'objets de toute nature (archéologie, beaux-arts, ethnologie, histoire, sciences et techniques...) valorisées par des parcours thématiques, des zooms et des expositions virtuelles, valorisé par des parcours thématiques dans les images. • Même principe que HDA : 80 % des descripteurs utilisés sur Joconde sont couverts du Wikipedia