Présentation de Fabien Gandon, chercheur à l'INRIA, responsable d el'équipe wimmics, représentant du W3C, lors de la journée de conférence « Transmettre la culture à l’ère du numérique » le 7 novembre 2013, Ministère de la culture et de la communication.
1. Le web sémantique dans le secteur
culturel
Fabien GANDON
Chercheur à l’INRIA, responsable de l’équipe Wimmics, représentant du W3C
14h15 - 14h30
Ministère de la Culture et de la Communication
Secrétariat général
Département des programmes numériques
2. DONNÉES DE LA CULTURE ET CULTURE DES DONNÉES
web sémantique et secteur culturel
fabien gandon, @fabien_gandon, http://fabien.info
3. DONNÉES DE LA CULTURE ET CULTURE DES
DONNÉES
web sémantique et secteur culturel
fabien gandon, @fabien_gandon, http://fabien.info
5. UR UR
L
I
identifier ce
qui existe sur
le web
http://mon-site.fr
identifier,
sur le web, ce
qui existe
http://animaux.fr/ce-zèbre
6. http://paris.fr/...
données et liens
Mai 2007
Avril 2008
base
une toile de données
Septembre 2008
utiliser des adresses web pour tout
répondre avec des données descriptives
inclure des liens vers d’autres données
Septembre 2010
Septembre 2011
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
March 2009
27. celui qui contrôle les métadonnées contrôle le Web
et, à travers cette toile mondiale, une part grandissante de notre
monde.
fabien, gandon, @fabien_gandon, http://fabien.info
Notas del editor
Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web.
1
Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web.
1
Vous avez probablement vu se multiplier autour de nous ces QR code qui nous permettent notamment à partir d’une référence physique dans notre monde d’accéder à des services ou informations sur le web.
1
Ces codes sont symptomatiques d’une évolution d’un composant central du web qu’est l’adresse web.
Nous sommes passés d’adresses essentiellement utilisées pour identifier les pages et ressources du web.
A des adresses permettant d’identifier sur le web tout ce qui existe autour de nous et d’en parler sur le web.
1
Le principe est donc simple:
Utiliser des adresses web pour tout identifier autour de nous
Lorsque l’on se rend à une adresse web répondre avec des données descriptives sur le sujet identifié par cette adresse
Et inclure des liens vers d’autres sujets pour permettre la découverte de proche en proche de nouvelles données
1
Pour permettre ces échanges et traitements il manque un dernier ingrédient que sont les schémas.
On peut les voir comme des dictionnaires décrivant le sens et les catégories qui organisent les données.
Ainsi un ordinateur ne peut pas savoir a priori qu’il ne peut pas mélanger impunément la donnée d’une température de cuisson et celle d’une partition de musique.
Alors que sous certaines contraintes il peut mélanger une partition and du texte par exemple s’il s’agit de paroles.
Le schémas publiés avec les données permettent de contrôler ces traitements.
1
Je suis fabien gandon, je suis responsable de Wimmics une équipe de recherche jointe entre Inria, I3S, CNRS et université de Nice et je suis aussi représentant d’Inria au W3C le consortium de standardisation pour le Web.
1
Si j’identifie les œuvres sur le web je peut les décrire et les gérer à cette échelle
1
L’une des plus veilles applications est Creative Commons qui permet d’indiquer et de chercher des œuvres en spécifiant les droits de réutilisation associés
1
Dans le domaine des bibliothèques on peut dès lors publier, échanger, relier, enrichir de nouvelles données les index et descriptions des fonds.
1
Après l’œuvre je peux identifier l’artiste
1
Ainsi les programmes de la BBC appliquent cette approche pour agréger non seulement leurs contenus par exemple sur un groupe…
Mais aussi l’enrichir d’autres contenus disponibles sur le web.
1
Je peux identifier les lieux
1
Voilà quelques données sur la tour eiffel disponibles dans Dbpedia.fr et qui peuvent ainsi permettre immédiatement de traduire le nom d’un monument dans une application touristique
<numéro>
Au-delà du lieu géographique d’autres spécificités peuvent être décrites comme les collections, les services, les référentiels dans le cas d’un musée
<numéro>
Et ce faisant on peut alors proposer des portails transverses au collections permettant de nouveaux parcours dans ces données intégrées
<numéro>
Ces portails peuvent même être dédiés par exemple ici pour une parcours pédagogique dans l’histoire de l’art.
<numéro>
Et je pourrais continuer très longtemps à identifier de potentiels sujets.
<numéro>
C’est d’ailleurs cette généricité qu’utilise DiscoveryHub pour faire découvrir de nouveaux centres d’intérêts à ses utilisateurs en reliant des sujets appartenant parfois à des catégories à première vue très différentes.
1
Ces liens qui se tissent peuvent eux même faire l’objet de nouvelles études et nouvelles méthodes de travail comme ici où le même outil interrogeant de façon identique le web de données permet de voir les influences respectivement entre des genres musicaux, des philosophes et des langages de programmation.
1
La publication et l’explicitation de ces données permet aussi de nouveaux moyens d’accès comme ce moteur de recherche qui répond à des questions en langage naturelle en les traduisant et requêtes sur les données pour l’utilisateur.
<numéro>
J’ai personnellement été agréablement surpris de voir l’industrie des jeux utiliser les données des villes pour rendre les jeux plus réalistes.
1
Rendre l’émission de CO2 visible… la donnée ouverte a aussi le potentiel pour devenir un matériau artisitique
1
Alors le danger est pour ces éléments de notre patrimoine d’êtres invisibles
1
Ou un lieu est décrit en détail mais pas dans une source accessible
1
Et il y a un réel enjeu pour une culture à être présente dans les données ouvertes et liées sur le web.
1