Archiving and disseminating sound archives – 5. Preparing, recording, archivi...
Sauvegarde sur le long terme à la phonothèque de la MMSH. Récit d’une expérience
1. Sauvegarde sur le long terme à la
phonothèque de la MMSH
Récit d’une expérience
Véronique Ginouvès
veronique.ginouves@univ-amu.fr`
Ingénieure de recherche CNRS – USR 3125
2. Créée en 1979 par des
chercheurs en SHS :
- Pour conserver la
source qui documente
leur recherche :
l’enquête de terrain
enregistrée
- Pour une réutilisation
éventuelle des
enregistrements dans le
cadre de nouvelles
recherches.
La Maison méditerranéenne
des sciences de l'homme
Elle intègre la MMSH en 1997
https://phonotheque.hypotheses.org
3. 1995 - Supports analogiques : Claude Gendre, Jean-Marc
Fontaine et Andrée Gioux. L'oral en boîte : guide pratique
pour la collecte et la conservation des enregistrement
sonores, Afas, 1984.
1999 - Cédés/cédéroms : participation au Plan national de
numérisation du Ministère de la Culture lancé par la mission
recherche et technologie. Voir JP Dalbéra, « La recherche au
ministère chargé de la Culture (1959-2000) », Histoire de la
recherche contemporaine, t. II, n°2, 2013, 108-121.
2001 – Numérisation sur site.
2005 - Disques externes : échec de la mise en place d’une
conservation sur site à la MMSH. Prise de conscience : la
qualité du stockage garantit la conservation du train de bits
composant les fichiers de données.
Sauvegarder les archives sonores
de la phonothèque de la MMSH
4. Sauvegarder les données
numériques de la recherche
à la phonothèque de la MMSH
2010
À partir de 2010
collaboration avec la
TGIR Huma-Num : 1
copie sur une baie de
stockage à la MMSH, 1
copie DD envoyés
régulièrement aux
équipes d’Huma-Num
pour copie sur serveurs,
2016
2016 : les fichiers sont
transférés par FTP sur le
site d’IN2P3 sur la « Box
d’Huma-Num ». Les
audits réguliers ont
montré l’intégrité des
copies.
5. Premiers versements
au CINES en
collaboration étroite
avec l’équipe d’Huma-
Num
Avril / mai 2014 : premiers échanges
sur l’archivage numérique avec
Nicolas Larrousse (TGIR Huma-Num)
2018
7. Conseiller et former les
chercheurs sur la collecte des
données de la recherche en
SHS, enregistrée sur le
terrain, en utilisant les
standards internationaux
Les carnets :
https://phonotheque.hypotheses.org
https://ethiquedroit.hypotheses.org
Les travaux dans le cadre du Consortium des
ethnologues (TGIR Huma-Num) :
https://ethnologia.hypotheses.org
8. Les standards des fichiers des
données de la recherche à la
MMSH : le son
Enregistrements analogiques :
transfert de l’analogique en
format WAVE (a minima
44.6khz/16bits).
Enregistrements nativement
numériques : transfert en wave
des formats propriétaires (issus
de téléphones, dictaphones), des
supports compressés ou pas (DAT,
MiniDisc, certaines cartes, fichiers
MP3…).
9. Les standards des fichiers des données
de la recherche à la MMSH : les films
et la vidéo
Conversion, quel que soit le format
d’origine analogique ou numérique :
.mpeg4, codec H264, débit entre 10
et 20 kbit / seconde.
Résolution : la taille de l’image d’origine
est conservée (une Mini-DV , 720 × 576
pixels, une VHS, 720 × 576 pixels).
Conservation actuelle : copie sur site,
Huma-Num Box, Nakala
Hélène Colombié « Numériser des archives audiovisuelles à la
phonothèque de la MMSH », Les Carnets de la phonothèque, 10 juin
2017, https://phonotheque.hypotheses.org/21896
10. Les 5 risques qui nous épouvantent
- La perte du contenu du fichier : l’importance du nommage des fichiers des
métadonnées et du fichier pour une identification unique est au cœur de nos
préoccupations ;
- Le format de fichier inconnu : surtout pour les sons enregistrés la fin des années
90* et jusqu’en 2010 pour des formats numériques propriétaires pour lesquels
nous n’avons pas été parfois assez vigilants, plus compliqué encore pour la vidéo ;
- La détérioration du support ;
- Le matériel de lecture disparu : pour le son nous ne possédons pas de lecteur
DCC**, pour la vidéo nous possédons à peine 40% des modes de lecture.
- Le plus terrorisant est la perte du contexte de production.
Lorsque nous plaçons un fonds dans le processus d’archivage sur le long terme, le
traitement est a priori terminé.
* 1987, lancement du DAT ** Le Digital compact cassette a été lancé par Philips) en 1992
11. Or, les sources de la recherche
sont plurielles et se croisent
11
12. Que conserver
des archives de
terrain sur le
long terme ?
Notre objectif est de conserver les
documents et les informations
contenues non seulement dans leur
aspect physique comme dans leur
aspect intellectuel mais aussi avec
leur contexte de production de
manière à ce qu’ils soient en
permanence accessibles certes mais
aussi compréhensibles par tou.te.s.
Au vu des évolutions technologiques
que nous vivons, cette permanence
d’accès et de compréhension
implique d’avoir prévu au préalable
une description complète et
cohérente du contexte de
production et des objectifs de
recherche.
13. L’adoption de standards
pour les métadonnées a
facilité la démarche qualité
pour la conservation
Dublin Core – DC
Europeana Data Model –
EDM
Encoded Archival
Description - EAD
14. Le ppdi.xsd :
renseigner clairement
sur le contexte d’archivage
-<mdMetier><mdDesc>Les métadonnées métiers
sont décrites dans l’ouvrage “Patrimoine culturel
immatériel. Traitement documentaire des archives
sonores inédites. Guide des bonnes pratiques”, [En
ligne], URL : https://halshs.archives-
ouvertes.fr/halshs-01065125/document. L’EAD est
celui de CALAMES - Catalogue en ligne des archives et
des manuscrits de l'enseignement supérieur et de la
recherche, [En ligne], URL :
http://www.calames.abes.fr explicité dans un manuel
de catalogage spécifique, [En ligne], URL :
http://documentation.abes.fr/aidecalames/ManuelD
eCatalogage.pdf Les référentiels utilisés sont ceux
d’IdRef - Identifiants et référentiels pour
l'Enseignement supérieur et la recherche pour les
mots-clés thématiques, les périodes historiques et les
lieux, [En ligne], URL : https://www.idref.fr Les
informateurs.trices peuvent avoir été anonymisé.e.s à
la demande des chercheur.e.s qui ont réalisé les
entretiens. Les contributeurs <contributors>
apparaissent alors sous forme
chiffrée</mdDesc></mdMetier>
15. La collection : la granularité des « paquets » déposés prend du sens avec
le contexte de production des archives. Exemple du fonds de Christian
Bromberger.
<structure> […] D’une façon générale les dépôts sont structurés en collection (nommé
“corpus”).</structure>
16. Un des éléments du dispositif : la compréhension et la
documentation de l’ensemble des acteurs, en particulier :
L’enquêteur, l’informateur et les ayants droit : pour chacun est établi un état des
autorisations (sous forme de contrat principalement mais il peut s’agir d’accord
moral d’un enquêteur sur un ensemble de documents).
Tiers archivage : plusieurs services d’archives bénéficient de l’expertise et du
traitement de la phonothèque de la MMSH sur les sources enregistrées sur le
terrain. Des conventions de collaboration précisent les fonctions de chacun des
services (exemple : les archives départementales des Bouches-duRhône, les
Archives nationales d’Outre-Mer, le musée ethnologique de Salagon, l’école
d’architecture de Marseille, les archives historiques des Cyclades, l’Institut français
du Proche-Orient, la Maison des sciences de l’homme de Nice, le Museon Arlaten) :
<notesCadre> </notesCadre>
L’utilisateur : pour chaque corpus déposé, les règles éthiques et juridiques sont
précisées pour en expliciter l’accès dans le respect de la législation applicable en
matière de communication des archives.
17. Novembre 2018 :
publication d’un guide
de bonnes pratiques
sur les questions
éthiques et juridiques
pour la diffusion des
données en SHS
18. Des questions en suspens (en vrac)
Pour chaque corpus nous avons des contrats d’autorisation : doit-on ou non les
déposer ? une information générale sur les questions juridiques suffit-elle ?
Est-ce que les dépôts dans Nakala seront déposés directement au CINES ?
Même question pour Medihal qui actuellement archive seulement les jpeg.
Par ailleurs le nommage des images sur Medihal ne correspond pas à l’URI des
documents >> à la phonothèque on renomme les photographies du numéro
Medihal.
Comment récupérer les ARK pour les intégrer dans la base de données de la
phonothèque et est-ce que cela a un intérêt de le faire ?
Comment faire pour des fonds mixtes (supports traditionnels et données
numériques) ? Exemple du fonds Annie-Hélène Dufour où tout ne sera pas
numérisé : cf Que conserver des archives du chercheur et selon quels critères ?
Le cas du fonds Annie-Hélène Dufour https://ethnologia.hypotheses.org/259
19. Crédits
Diapo 2 : MMSH par Pierre Monteil, 2000.
Diapo 3, 6 , 11: Archives de Marceau Gast, Laure Principaud, 2012.
Diapo 4 : SDASM Archives Computer Catalog : Consolidated/Convair Aircraft Factory San Diego Equipment, pas de
restrictions de droits connues
Diapo 6 ; Fonds Christian Bromberger, Gast (couverture d’un arnet de terrain), Métral (Loukou, 2015) et Annie-
Hélène Dufour (Colombié, 2016), dont une affiche issue du fonds Bromberger : Sous son portrait, Husayn ibn Ali
pleure la mort de son fils Ali al-Akbar ibn Husayn qui a reçu trois flèches https://medihal.archives-
ouvertes.fr/medihal-01789641
Diapo 6 et 7 : JP Chrétien sur le terrain au Burundi avec son témoin Sékélé, photographie diffusée avec l’aimable
autorisation de Jean-Pierre Chrétien
Diapo 8 : Station de numérisation nomade, Tanzanie, formation TBC, V. Ginouvès, 2015
Diapo 9 : Bandes viéso analogiques 2017, Hélène Colombié -
https://www.flickr.com/photos/phonothequemmsh/38435993771
Diapo 11 : fonds Gast ‘1970) et Bernus (1954), dont journée d’hommage à Marceau Gast (V. Ginouvès, 2011)
Diapo 13 : écouter la radio et lire la presse au début du 20ème siècle dans l’Hérault, domaine public.
Diapo 14 : différents corpus de Christian Bromberger dont photographie d’un lavoir par Annie-Hélène Dufour en
1981 (Medihal : https://medihal.archives-ouvertes.fr/medihal-01107250v1) et Abbas ibn Ali avec son turban vert,
affiche de la révolution iranienne, 1980 (Medihal : https://medihal.archives-ouvertes.fr/medihal-01789657)