3. Types de documents concernés
• Fonds d’archives
• Documents imprimés
• Monographies
• Publications en série
Les premiers fonds traités à la MSH ont été des fonds d’archives
• Forum Social Européen
• Enquête archives de la recherche en SHS
Description des fonds d’archives
Réalisation d’instruments de recherche encodés en XML EAD (2002)
Outils successifs : X-Metal , Arkhéïa aide au classement, oXygen depuis 2012
4. Fonds de documents imprimés décrits par la plateforme
• Revues :
• Cahiers d’histoire (1966-2001)
• Société française (1981-1999)
• Brochures / ouvrages
• Brochures de la Bibliothèque Marxiste de Paris
• Brochures du fonds des archives privées Patrick Kessel
• Grande Edition Marx et Engels
Description des documents imprimés
Réalisation de catalogues encodés en XML EAD (2002)
Outils utilisés : Arkhéïa aide au classement, module bibliothèque, oXygen depuis
2012.
Les catalogues EAD produits avec Arkhéïa sont conformes au format ISBD
5. Décrire des documents imprimés en XML-EAD
• Une question de compétences
Plusieurs années de pratique de l ’EAD à la MSH
• Un choix contextuel
Pleade, solution utilisée à la MSH pour la mise en oeuvre de son portail PANDOR
est un outil de publication et de consultation d'instruments de recherche
encodés en XML-EAD
• Répondre aux évolutions de la pratique du web par le public
Les catalogues de bibliothèques sont de moins en moins consultés. Opter pour le
format XML, c’est être visible par les moteurs de recherche et donc par le public
qui ne connait pas le portail de la MSH
• Souplesse de la description en EAD
Possibilité de créer et de distinguer des champs spécifiques aux besoins d’un
projet, d’un corpus.
Ex : notices de la GEME
6. Notice « enrichie » de la GEME
Renvoi vers une autre
traduction d’une même oeuvre.
Rebond entre notices par lien hypertexte.
7. Distinguer la forme du contenu
Objectifs
• Proposer des affichages différents en fonction de la nature des documents
décrits
• Faciliter la mise en correspondance avec d’autres formats de métadonnées
(ex : Dublin Core simple) et/ou l’exploitation par d’autres systèmes
8. Exemple d’encodage en EAD
<c id="brb3612" level="item">
<did altrender="isbd-m-fr">
<unitid label="Cotes extrêmes">brb3612</unitid>
<unittitle label="Intitulé de l'unité documentaire">
Un aspirant dictateur : André Tardieu / Félicien Challaye.
<edition>2ème édition.</edition>
<imprint>
<geogname>Paris</geogname>
<publisher>Librairie du travail</publisher>
<date normal="1932" type="publication">1932</date>
</imprint>
<bibseries>Faits et documents ; 10</bibseries>
</unittitle>
<unitdate label="Date de l'unité documentaire" normal="1932">1932</unitdate>
<physdesc label="Description physique">
<genreform >Ouvrages</genreform><lb/>
<extent label="Collation" type="collation">32 p.</extent><lb/>
</physdesc>
</did><prefercite href="http://pandor.u-bourgogne.
fr/ead.html?id=FRMSH021_00009&amp;c=FRMSH021_00009_brb3612"/>
<controlaccess>
<persname role="auteur">Challaye, Félicien</persname>
<title >Un aspirant dictateur : André Tardieu</title>
</controlaccess>
<dao href="BMP/brb3612/" role="series" title="Consulter la brochure"/></c>
9. Affichage par défaut de Pleade
pour les documents imprimés
Affichage de type ISBD : sans distinction des zones de description, peu adapté
au public.
10. Affichage de type catalogue de
bibliothèque prévu pour PANDOR
Même contenu en EAD que la vue précédente, l’affichage varie en fonction de
paramètres gérés par une feuille de style au niveau de l’application Pleade.
12. La même notice sur Europeana
Après une mise en correspondance des champs EAD et Dublin Core simple, les
métadonnées produites à la MSH sont affichées dans Eureopeana
13. Indexation
Index existants
• Titres
• Auteurs
• Éditeurs
• Collection
En outre, la navigation par le plan de classement permet une consultation
thématique des fonds
Indexation à venir
• Indexation matière d’une partie du fonds des brochures de la BMP pendant
un stage de 2 mois (avril – mai 2014)
15. Constitution d’un parc de scanners depuis 2006
• 2 scanners de production CANON DR 9050 C. Formats de sortie TIFF, JPEG,
PDF, résolution max 600 dpi.
• 2 scanners de livres i2s COPIBOOK RGB 300 dpi et i2s COPIBOOK ONYX 600
dpi format de sortie
16. Constitution d’un parc de scanners depuis 2006
• 1 scanner de livres précieux ou plans I2s DIGIBOOK A0, résolution max 800 DPI
jusqu’au format A1
• 1 scanner de microfilms automatique 16/35 mm WICKS 1 Wilson RS 325,
résolution max 600 DPI.
17. Numérisation
Le service de numérisation (SNBD) de la MSH de Dijon s’appuie sur les
recommandations du Service Interministériel des Archives de France (SIAF), du
Centre Informatique National de l’Enseignement Supérieur (CINES) et du TGIR
Huma-Num en termes de numérisation, choix des formats numériques en
fonction des différentes typologies et résolutions… (« Guide méthodologique
pour le choix de formats numériques pérennes » et « le guide des bonnes
pratiques numériques »). Une numérisation dite de conservation est effectuée à
la MSH.
Le format de numérisation pour les archives de type textuel ou iconographique
est le format Tagged Image File Format (TIFF) sans compression. La résolution
minimum est de 300 DPI, cependant s’il est prévu une phase de reconnaissance
optique de caractères, la résolution sera de 400 DPI. Dans la plupart des cas la
numérisation s’effectue en couleur.
18. La numérisation des corpus
Grace au soutien de la fondation Gabriel Péri et du Conseil Régional de
Bourgogne les corpus suivants ont pu être constitués
• Le fonds de brochures de la BMP : 2933 brochures numérisées, traitées,
recadrées soit 128 785 pages
• Le fonds de brochures Patrick Kessel : 475 brochures numérisées, traitées,
recadrées soit 16 000 pages
• Numérisation d’ouvrages dans le cadre de la Grande édition Marx-Engels, 41
ouvrages ont été numérisés soit 8800 pages
19. La numérisation des corpus
Les revues dites communistes
• Cahiers de l'Institut Maurice Thorez - Cahiers d'histoire, revue d'histoire
critique (1966-2001) : 116 numéros numérisés soit 22 080 pages
• Société française, Cahiers de l'institut de recherches marxistes - Société
française - Société française, Raisons d'agir, passion de comprendre (1981-
1999) : 60 numéros numérisés soit 4520 pages
• La revue Economie et politique : 401 numéros, hors séries, ou conférences ont
été numérisés soit 40 700 pages
• La revue l’Ecole & la Nation : 338 numéros, hors séries ou suppléments
numérisés soit 18 522 pages
20. La numérisation des corpus
Corpus archives du communisme
une partie des fonds suivants : 488, 489, 490, 491, 492, 493, 494, 495, 507, 717,
533, 534, 535, 537, 538, 539
Il s’agissait de numériser 220 microfilms soit 176 000 pages environ (cf. ANR
PAPIK@2F pour de plus amples informations.
22. Le résultat de l’ensemble du travail réalisé par la plateforme de la MSH de Dijon
(instruments de recherche, catalogues électroniques et documents numérisés)
est mis en ligne sur internet et librement accessible via le Portail Archives
Numériques et Données de la Recherche (PANDOR).
http://pandor.u-bourgogne.fr
Cet outil de diffusion permet la mise à disposition des corpus numériques
constitués lors de programmes de recherche portés par la MSH et/ou les
laboratoires SHS qui lui sont associés.
23. Fonctionnement technique du portail PANDOR
L’application utilisée par la MSH de Dijon est issue du monde du libre. C’est une
application Web, s’appuyant sur un serveur Apache et l’architecture J2EE (JAVA).
Elle permet la publication et la diffusion de documents au format XML, et
supporte les documents aux formats XML-EAD, XML-EAC, XML-TEI, et XML METS
/ ALTO. Elle dispose aussi d’un moissonneur et d’un entrepôt OAI-PMH. En effet,
elle supporte le protocole d’échange de données OAI-PMH, ce qui garantit
l’interopérabilité avec d’autres bibliothèques numériques.
Ainsi, le portail de publication de la MSH de Dijon est moissonné depuis mai 2013
par la Bibliothèque Numérique EUROPEANA, dans le cadre du programme
européen Heritage of People’s Europe (HOPE).
24. Navigation dans PANDOR
Navigation dans un cadre de classement (classement par thématiques de
recherche soutenues à la MSH de Dijon) – Navigation dans l’ensemble des corpus.
25.
26. La recherche sur PANDOR
Recherche simple
Recherche avancée (dans tous les corpus)
Recherche spécifique (recherche dans un corpus particulier)
Recherche en plein texte dans les documents numérisés (très prochainement) –
module XML ALTO
Après obtention d’un identifiant et d’un mot de passe, possibilité de sauvegarder
l’historique des requêtes et mise à disposition d’un porte-documents