Présentation à l'occasion de la journée d'étude ALMA du 14 février 2014 organisée par les étudiants du Master 2 Histoire et document, Métiers des archives et des bibliothèques de l'université d'Angers et par l'Association des étudiants et diplômés en archivistique d'Angers (AEDAA).
The Knowledge ecology: Epistemic Credit and the Technologically Extended Mind
Portails documentaires et référentiels du Web sémantique : exemples et enjeux à venir à partir de HDA-Lab et DBpedia
1. Portails documentaires et
référentiels du Web sémantique :
exemples et enjeux à venir à partir
de HDA-Lab et DBpedia
Alexandre Monnin
Paris 1, PhiCo, EXeCO
Inria, Wimmics
Membre du réseau d’expert Open Data
d’Etalab
Les portails documentaires : un atout pour les archives ?
Journée d’étude ALMA
14 février 2014
3. Près de 5000 ressources agrégées et commentées pour
l'enseignement de l'histoire des arts : dossiers pédagogiques,
expositions virtuelles, vidéos... ainsi que des repères chronologiques
par domaines artistiques (architecture, bande dessinée, littérature,
jardins, musique, peinture, théâtre...).
• Toutes les périodes
• Toutes les civilisations
• Tous les domaines artistiques
Grande hétérogénéité des institutions impliquées (+300)
Grande hétérogénéité des contributeurs de ces institution au
portail HDA
4. Enjeux d’une indexation commune
• Un seul modèle pour toutes les
institutions ?
• Un seul modèle pour tous les éléments
du corpus ?
• Un seul domaine pour toutes les période ?
• Un seul modèle pour toutes les civilisations ?
• Un seul modèle pour tous les domaines artistiques ?
5. ?
Three Rings for the Elven-kings
under the sky,
Seven for the Dwarf-lords in their
halls of stone,
Nine for Mortal Men doomed to die,
One for the Dark Lord on his dark
throne
In the Land of Mordor where the
Shadows lie.
One Ring to rule them all, One Ring
to find them,
One Ring to bring them all and in
the darkness bind them
In the Land of Mordor where the
Shadows lie.
22. • 8 semaines pour sémantiser 16 000 mots-clefs
de HDA (données ouvertes disponibles sur
data.gouv.fr).
• Mise en place dans le back-office de la plateforme HDA d’un workflow semi-automatique
de tagging lié à DBpedia (analyse des notices,
et suggestion de liaison avec des URI de
DBpedia aux utilisateurs)
23. Verdict
Wikipedia répond aux besoins du tagging culturel
• 2012 : 77, 2 % des tags ont pu être liés à
Wikipedia en français (en passant par la version
anglaise à l’époque, chiffre qu’il faut donc revoir
sensiblement à la hausse).
• 2012 : 83 % des tags utilisés l’ont été plus d’une
fois par les visiteurs du site.
• Octobre 2012 : 100 % des 100 mots-clefs les plus
fréquemment utilisés par les visiteurs du site sont
appariés à Wikipedia/DBpedia.
25. Créer une boucle vertueuse
réutilisation <-> contribution
Mobiliser les agents pour que les thèmes traités aient une représentation sur
WP
Améliore DBpedia
Améliore les applications qui utilisent DBPedia
etc.
De plus en plus d’initiatives impliquent des institutionnels (mapping parties
avec Open Street Map, résidence au château de Versailles, etc.).
« nos établissements sont invités à leur tour à consolider, à enrichir ou à
rectifier s’il y a lieu les données figurant sur Wikipédia, afin non seulement
d’augmenter la qualité de ses articles en langue française, mais aussi son
efficacité sur le Web sémantique. »
(Aurélie Filippetti, 19 novembre 2012)
26. Simplicité : pas d’appel aux couches
supérieures du Web Sémantique
27. Linked Open Data
• Use URIs as names for things
• Use HTTP URIs so that people can look up
those names.
• When someone looks up a URI, provide useful
information, using the standards (RDF*,
SPARQL)
• Include links to other URIs. so that they can
discover more things.
28. Enrichissement multilingue
• Lien entre les différentes versions linguistiques
de Wikipedia
= équivalents linguistique des entrées
(dont des mots-clefs)
= recherche multilingue à coût quasi- nul
(traduction des interfaces)
= désenclavement linguistique du corpus
traité
31. Aujourd’hui
• Le projet Joconde Lab (http://jocondelab.iriresearch.org/jocondelab/) a prolongé l’effort
initié avec HDA-Lab.
• Corpus de 500.000 notices d'objets de toute
nature (archéologie, beaux-arts, ethnologie,
histoire, sciences et techniques...) valorisées par
des parcours thématiques, des zooms et des
expositions virtuelles, valorisé par des parcours
thématiques dans les images.
• Même principe que HDA : 80 % des descripteurs
utilisés sur Joconde sont couverts du Wikipedia