6. 2.
Le projet pilote
de moteur de recherche fédérée
7. Premiers pas…
Point de départ
• réalisation de la plate-forme de pérennisation et d’archivage des collections
numériques et numérisées du Service de la culture
• premiers versements d’archives électroniques effectués en mai 2011
• volume des données au 31 décembre 2011 = 5.5 TB
• 147 226 photographies
• 1934 archives sonores
• 429 films
7
8. Premiers pas…
Objectifs
• mettre en œuvre le processus d’accès aux collections numériques et
numérisées du Service de la culture (Archives de l’Etat du Valais,
Médiathèque Valais et Musées cantonaux)
• organiser et réaliser un projet pilote de recherche fédérée et de consultation
pour les collections numériques et numérisées du Service de la culture
Constitution d’un groupe de travail composé de
• représentants des Archives de l’Etat du Valais, de la Médiathèque Valais et
des Musées cantonaux
• représentants du Service cantonal de l’informatique
• consultant = Antidot SAS
8
Mandat du 28 mars 2011
9. Les difficultés d’un tel projet…
Choix du corpus
• Archives de l’Etat du Valais
• 88 793 unités documentaires (scopeQuery)
• provenance = anciens fonds de l’Etat du Valais, fonds de communes municipales et
bourgeoisiales et fonds privés
• Médiathèque Valais
• 13 438 unités documentaires
• provenance = collections audiovisuelles du site de Martigny (10 298 unités
documentaires) et collections numérisées du site de Sion (3 140 unités
documentaires)
• Musées cantonaux
• 24 915 unités documentaires
• provenance = Musée d’histoire
9
10. Les difficultés d’un tel projet…
Description des unités documentaires
• chaque métier a ses propres normes de description
• nécessité de définir, le cas échéant, les correspondances entre les différents
éléments des schémas de métadonnées utilisés
Livraison des unités documentaires
• Archives de l’Etat du Valais = EAD
• Médiathèque Valais = Dublin Core
• Musées cantonaux = extraction XML brute
=> transformation en un format XML pivot
10
11. Les difficultés d’un tel projet…
Indexation
• objectif = obtenir une indexation suffisamment fine pour éviter les silences et
les bruits
• définir des index généraux « utiles » pour toutes les institutions et des index
spécifiques à chaque institution
• tenir compte des différents niveaux et qualités de l’indexation
• Archives de l’Etat du Valais = aucune indexation des unités de description
• Médiathèque Valais = utilisation de différents index (vocabulaire RERO,
bibliographie valaisanne, CDU)
• Musées cantonaux = index spécifiques à chaque Musée
11
12. Les difficultés d’un tel projet…
Indexation
• index généraux
• provenance
• lieux
• périodes
• personnes
• index « matières »
• tests avec différents index (GEMET Thesaurus, Thésaurus SIAF, bibvs)
12
13. Le moteur de recherche fédérée…
projet pilote a démontré la possibilité de mettre en œuvre un moteur de
recherche fédérée au sein du Service de la culture 13
14. Les suites du projet
Consolidation des résultats de la phase pilote
• travail important à entreprendre en matière d’indexation (indexation
« matières »)
Réalisation de l’interopérabilité du moteur de recherche fédérée, de
manière à pouvoir l’inscrire dans le réseau mondial d’échange des
données
• réalisation d’un entrepôt OAI-PMH (cf. Europeana)
• exposition des données (web des données)
14
15. Les suites du projet
Interface de consultation du moteur de recherche fédérée
• interface de recherche des informations dans la corpus
• contenu éditorial
• prise en compte de l’interactivité (web 2.0)
• prise en compte des différents supports
15