Jabes 2012 - Intervention sponsor - Libérer le potentiel des collections historiques numériques : nouvelles considérations
1. Libérer le potentiel des collections historique numériques :
Nouvelle considérations
19 Juin 2012
2. UMI
Fondé en 1938 par
Eugene Power sous
l‟appellation University
Microfilms International
Mission : Fournir l‟accès à
un prix raisonnable à
l‟information destinée à la
recherche via la meilleure
technologie disponible
Premiers produits
Thèses
Early English Books sur
microfilm
Les origines de ProQuest
4. Les attentes des utilisateurs:
Qu‟est-ce qui a changé?
“Tous les contenus sont en ligne”
“Tous les contenus sont faciles à trouver”
Recherche dans le texte intégral possible
Ou, au minimum, de bonnes métadonnées
Toutes les images sont en couleurs
Tous les contenus sont facilement
manipulables et partageables avec des
pairs - - haut degré d‟interaction avec les
contenus.
5. Livres rares : Early European Books
• Scannérisation en haute résolution couleur (400 bpi) à
partir de volumes originaux (pas à partir de microfilms)
• Projet en cours – Plus de 15 000 volumes numérisés à
ce jour
• Comprend toutes les pages, les pages blanches, les
pages de garde, les encarts non-reliés, les dépliants,
ainsi que les couvertures, les tranches et les dos
• Métadonnées : informations complètes sur chaque livre :
• format, propriétaire, annotations, histoire de l‟édition et du lectorat
• Ces informations sont souvent absentes des autres projets de
microfilmage et de scannérisation
• Interface et moteur de recherche dédiés
• Conçus pour répondre aux besoins spécifiques des chercheurs utilisant
des livres rares
6. Early European Books: Défis
• Manipulation des livres :
• Manipulation minutieuse d‟objets de valeur
fragiles
• Scannérisation sur le site des bibliothèques
(Florence, La Haye, Londres, Copenhague)
• Scannérisation:
• Nécessité de tourner les pages à la main
• Différents scanners pour différents formats de
livres
• Dépliants
• Les reliures serrées de certains ouvrages limite
leur ouverture à 90 degrés
• La capture des tranches et des dos nécessitent
de nouvelles méthodes photographiques
• Métadonnées relatives à chaque page :
• Capture précise des caractéristiques des pages
(numérotation originale, cartes, portraits,
enluminures, annotations manuelles, etc..)
Alberti, Salomon, 1540-1600, Historia
plerarunque ... Wittenberg, 1585.
Wellcome Library.
7. Fermoirs : Importants pour la recherche
Theodotus, Salomon. Het paradys der gheestelycke en kerckelycke lof-sangen...
T'SHertogenbosch: by Jan Jansz. Scheffer, 1627.
Koninklijke Bibliotheek, Den Haag.
8. Dante Alighieri, La Divina Commedia , Venice 1554
(copy with interleaved blank pages).
Biblioteca Nazionale Centrale di Firenze
9. Missale Romanum. Venezia, 1574.
Biblioteca Nazionale Centrale di Firenze.
Jost Amman and Hartmann Schopper, [Panoplia] omnium
illiberalium mechanicarum... Frankfurt, 1568. Wellcome
Library.
Identification des pages non-textuelles
10. Kriegsbuch. Copenhagen, 1578.
Royal Library, Copenhagen.
Bartolommeo dalli Sonetti, Isolario. [Venezia, ca.1485/86]
Biblioteca Nazionale Centrale di Firenze.
L‟importance de capturer les images en
couleur
11.
12.
13.
14.
15. The Vogue Archive
Regroupe la totalité de l‟édition
américaine du magazine Vogue
de 1892 à aujourd‟hui
Reproduit chaque page au format
image en haute résolution
couleur.
Plus de 400 000 pages
Constitue un trésor contenant les
travaux des plus grands
designers, photographes,
stylistes et illustrateurs des 20e et
21st siècles.
16. Problèmes particuliers: La recherche
d‟images
Comment se fait la recherche d‟images de mode sur le
web aujourd‟hui :
Les usagers utilisent des moteurs de recherche
standards
Pas d‟indexation ou de termes spécifiques au
domaine
Images de qualités, tailles et formats variables
Images sorties de leur contexte original
Origines variées (catwalk, paparazzi, scans de
magazines, photos de studio, mannequins)
Cherchons „Fendi dress‟ sur un moteur de recherche
populaire :
18. La recherche d‟images dans Vogue.
3 étapes.
1. Capture des légendes des
images
2. Utilisation de l‟index “In This
Issue”
3. Thesaurus spécialisée
19. Recherche d‟images
• Etape 1:
OCRisation des
légendes des
images et contrôle
manuel pour une
précision de
99,95%
• Les utilisateurs
peuvent chercher
„Fendi pastel dress‟
20. Recherche d‟images
• Etape 2:
Copie des éléments
décrivant les vêtements
dans l‟index „In This Issue‟
de chaque numéro
• Les utilisateurs peuvent
chercher „silk polyamide
pastel Fendi dress‟
• Cette information
supplémentaire apparait
dans la rubrique „Retail
Information‟ correspondant
au sujet „Hollywoodland‟
21. • Etape 2:
• Copie des éléments
décrivant les vêtements
dans l‟index „In This Issue‟
de chaque numéro
• Les utilisateurspeuvent
chercher „silk polyamide
pastel Fendi dress‟
• Cette information
supplémentaire apparait
dans la rubrique „Retail
Information‟ correspondant
au sujet „Hollywoodland‟
Recherche d‟images
22. • Etape 3:
Indexation des images à l‟aide
d‟un thesaurus spécialisé
• Phase 1: Correspondance
automatique avec les légendes
des images
• Phase 2: Indexation manuelle
par les éditeurs spécialisés de
Condé Nast
29. Considérations finales: Durabilité
Comment assurer la pérénité du site?
Prendre en compte les coûts de maintenance du site
Stockage – Les images en haute résolution couleur ont des coûts
de stockage plus élevés
Mises à jour des logiciels et augmentation des capacités de
stockage
Coûts continus de maintenance
Support technique et formation des utilisateurs
La plupart de ces coûts ne sont pas pris en compte dans les
évaluations financières et subventions initiales
Options possible
Subventions ultérieures
Sponsoring / Parrainage
Partenariats Public / Privé
30. Early English Books Online: Le précurseur
Regroupe l‟intégralité des ouvrages
imprimés entre 1450 et 1700 en Grande-
Bretagne et dans les colonies britanniques
d‟Amérique du Nord, ainsi que tous les
ouvrages en langue anglaise imprimés
ailleurs.
125 000 livres
33 langues et 15 pays d‟édition sont
représentés, de l‟Algonquin au Gallois, et
de la Belgique aux USA.
31. Early English Books Online: Le précurseur
Tous les domaines sont couverts, dont :
la littérature (Shakespeare, Spencer, Marlowe,
Rabelais, Montaigne, …)
les sciences (Galilée, Harvey, Mercator, Vesalius,
Newton)
la religion (Calvin, Luther, Know, Laud)
l‟histoire (Drake, Raleigh, Hakluy) et la géographie
la philosophie (More, Bacon, Kemp)
les sciences politiques (Machiavel, Prynne, Lilburne)
le droit
la médecine
les arts
l‟architecture
la musique (Purcell)
les mathématiques, etc…
32. Early English Books Online:
La licence nationale
Signée en 2011
Périmètre :
organismes situés sur le territoire français ayant
une activité pédagogique ou de recherche
centres hospitaliers universitaires et régionaux
bibliothèques publiques
établissements du réseau de coopération
culturelle à l‟étranger
33. Early English Books Online:
La licence nationale
Pour y accéder :
https://stp.abes.fr/node/3?origine=Licences
Nationales
Pour être formé :
Webinars de Françoise Devillard
Inscription : www.proquest.com