Les Tic et l'art: images numériques, traitement et diffusion, 1
Je biblissima
1. Biblissima et la modélisation
de l’histoire de la
transmission des textes et de
la constitution des collections
Matthieu Bonicel, BnF, Coordinateur Observatoire Biblissima
Stefanie Gehrke, Coordinatrice Métadonnées Biblissima
Biblissima bénéficie d’une aide de l'Etat gérée par l'ANR au titre du programme Investissements d'avenir (ANR-11-EQPX-0007)
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
2. Grandes lignes :
● CORPUS
● OUTILS
● METHODES
o Modélisation de l’histoire de la
transmission des textes
o Modélisation de la constitution des
collections
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
3. Corpus
Manuscrits :
BnF Archives et Manuscrits, Medium,
Bibale, Pinakes, Jonas, Librairie de
Charles V et Charles VI, Initiale,
Mandragore, Manuscripta Medica,
Europeana Regia
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
5. Corpus
Incunables :
CR2I, Initiale, Medium, Reliures
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
6. Corpus
Inventaires :
Bibliotheca bibliothecarum de Montfaucon
Bibliothèque du Mont Saint-Michel
Sanderus électronicus, Rabelais Forse
Catalogues de la Sorbonne
Catalogues de vente
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
7. Corpus
Reliures :
reliures.bnf.fr
BSG sur la reliure médiévale et moderne
Transmission :
Miroir des classiques
Traditio Hollandrini
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
8. Outils I
GINCO
(thesaurus termes techniques -
concepts en SKOS)
baseX
Editeur XML
XXE
(référentiels lieux, personnes, collectivités,
oeuvres (+expressions et manifestation
singletons ?) - données en TEI)
triplestore ou
quad store
Mirador
(affichage des données)
(images ; manifests en JSON-LD)
?
openRefine
(alignement des autorités)
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
9. Outils II
Pour EAD, TEI, CSV,
RDF, SKOS, SQL et images
Donnera accès via
HTML
SPARQL endpoint
visualiseur IIIF
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
10. METHODES
● Réutilisation de standards existants
● Utilisation d’un cadre RDF pour arriver à
l’interopérabilité de 50 bases
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
11. METHODES
● Capitaliser sur les résultats de projets
précédents comme Europeana Regia
● Établir de bonnes pratiques en terme de
projets numériques sur l’histoire des
collections et la transmission de textes
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
14. METHODES
Obstacles à la fin d’Europeana Regia lors du
passage ESE -> EDM (RDF) :
● besoin d’URIs pour les collections et
possesseurs (dcterms:isPartOf, dc:provenance)
● besoin d’URIs pour les manuscrits
(edm:physicalThing)
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
15. Constitution des collections et histoire
de la transmission des textes
● Portail biblissima permettra faire des
requêtes sur :
o collections et possesseurs
o contenu d’une collection
o vie d’une collection, vie d’un livre
o copie, traduction, décoration, diffusion,
rédaction etc. d’une oeuvre textuelle
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
16. Constitution des collections et histoire
de la transmission des textes
● Portail permettra de visualiser les
résultats sous forme de listes, de cartes
et de frises chronologiques
● et la circulation matérielle des documents
=> accent sur l’évènement
=> choix de CIDOC CRM et FRBRoo
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
17. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ)
bibma:Manuscript
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
18. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ)
P48_has_preferred_identifier
bibma:Manuscript
E42_Identifier
P2_has_type
E55_Type
P70i_is_documented_in
bibma:Record
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E35_Title
P102_has_title
19. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ)
P48_has_preferred_identifier
bibma:Manuscript
E42_Identifier
P2_has_type
E55_Type
P50_has_current_keeper
P45_consists_of
P70i_is_documented_in
bibma:Record
E57_Material
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E35_Title
P102_has_title
E39_Actor
20. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ)
P48_has_preferred_identifier
F28_Expression_Creation
P108i_was-produced-by
bibma:Manuscript
E42_Identifier
P2_has_type
E55_Type
F22_Self-
Contained_Expression
P128_carries
P50_has_current_keeper
P45_consists_of
P70i_is_documented_in
bibma:Record
E57_Material
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E35_Title
P102_has_title
R17_created
?
E39_Actor
21. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type
rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#manuscript"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
22. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type
rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#manuscript"/>
</rdf:Description>
ontologie Biblissima
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
23. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type
rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
24. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type
rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
URL Notice
Medium
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
25. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/mdCONCEPT/49049">
<ecrm:P48_has_preferred_identifier rdf:resource="http://biblissima-condorcet.fr/id/Identifier/Medium/49049"/>
<ecrm:P70i_is_documented_in rdf:resource="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b"/>
<ecrm:P128_carries rdf:resource="http://biblissima-condorcet.fr/id/Expression/Medium/100043720"/>
<ecrm:P2_has_type
rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine"/>
<ecrm:P45_consists_of rdf:resource="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin"/>
<rdf:type rdf:resource="http://purl.org/NET/bibma#Manuscript"/>
</rdf:Description>
<rdf:Description rdf:about="http://biblissima-condorcet.fr/id/Identifier/Medium/49049">
<rdf:value>France, Paris, Bibliothèque Mazarine, ms. 1292</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E42_Identifier"/>
</rdf:Description>
<rdf:Description rdf:about="http://medium.irht.cnrs.fr/ark:/63955/md892801rw5b">
<rdf:type rdf:resource="http://purl.org/NET/bibma#Record"/>
</rdf:Description>
URL Notice
Medium
termes thesaurus
Biblissima
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
26. RDF pour Biblissima - Manuscrits -
exemple Medium (par D2RQ) (test!)
<rdf:Description rdf:about="http://biblissima-condorcet.fr/ark:43093/id/Expression/Medium/49049">
<efrbroo:R17i_was_created_by rdf:resource=”http://biblissima-condorcet.fr/id/ExpressionCreation/Medium/49049”>
<rdf:type rdf:resource="http://erlangen-crm.org/efrbroo/F28_Self-Contained_Expression"/>
</rdf:Description>
<rdf:Description rdf:about="http://data.biblissima.fr/ark:/43093/thesaurus/resource/document_type/ms_enlumine">
<rdf:value rdf:datatype="http://www.w3.org/2001/XMLSchema#string">manuscrit enluminé</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E55_Type"/>
<rdf:type rdf:resource=”http://www.w3.org/2004/02/skos/core#Concept”/>
</rdf:Description>
<rdf:Description rdf:about="http://data.biblissima.fr/ark:/43093/thesaurus/resource/material/parchemin">
<rdf:value rdf:datatype="http://www.w3.org/2001/XMLSchema#string">parchemin</rdf:value>
<rdf:type rdf:resource="http://erlangen-crm.org/current/E57_Material"/>
<rdf:type rdf:resource=”http://www.w3.org/2004/02/skos/core#Concept”/>
</rdf:Description>
Evènement
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
27. CIDOC CRM + FRBRoo :
Transmission des textes
P14_carried_out_by
F1_Work
R19_created_a_realisation_of
E39_Actor
F28_Expression_Creation F22_Self-Contained_Expression
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E50_Date
E52_Time-Span
E53_Place
E44_Place_Appellation
E56_Language
E39_Actor
R17_created
F22_Self-Contained_Expression
E56_Language
P4_has-time_span
F28_Expression_Creation
R17_created
P72_has_language
P72_has_language
F27_Work_Conception
P7_took_place_at P73_has_translation
bibma:Manuscript
bibma:Manuscript
R3_is_realised_in
E39_Actor
28. Chaque manuscrit son expression ?
F28_Expression_Creation F22_Self-Contained_Expression
R17_created
P108i_was-produced-by
P128_carries
bibma:Manuscript
P102_has_title
E35_Title
P102_has_title
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E50_Date
E53_Place
F1_Work
R3_is_realised_in
E35_Title
E35_Title
E52_Time-Span
E44_Place_Appellation
E39_Actor
R19_created_a_realisation_of
29. Plusieurs manuscrits par expression ?
F1_Work
R17_created
R3_is_realised_in
F28_Expression_Creation F22_Self-Contained_Expression
bibma:Manuscript
P12_occurred_in_the_presence_of
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E53_Place
E12_Production (Copy Event)
E53_Place
E39_Actor (Copist)
P108_has_produced
R19_created_a_realisation_of
P14_carried_out_by
E52_Time-Span
E52_Time-Span
P128_carries
30. FRBRoo 2.0
“Not all manuscripts, however, are necessarily produced by an
instance of F28 Expression Creation: a perfect copy of a brief
text, made by a highly trained scribe from an original, and
checked several times with the original to contain no alteration of
the text, could be regarded as just the result of an instance of E12
Production; but as a rule, no two mediaeval manuscripts carry
exactly the same text”
(Source : FRBR object-oriented definition and mapping from FRBRER, FRAD
and FRSAD (version 2.0), page 24)
31. Obstacle : Titre - URI
F1_Work E35_Title
Definition ?
“auteur (xxxx-xxxx), titre”
Definition ?
Definition ?
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
F28_Expression
(1)
F28_Expression
(2)
bibma:Manuscript
P102_has_title
E35_Title
E35_Title
E35_Title Definition ?
P102_has_title
P102_has_title
P102_has_title
“auteur, titre. langue (type)”
a) titre d’expression ?
b) nom d’usage (+ Cote ?)
32. CIDOC CRM + FRBRoo :
Constitution des collections
E65_Creation
E87_Curation_Activity E79_Part_Addition
E78_Collection
E8_Acquisition
bibma:Manuscript
bibma:Manuscript
bibma:Manuscript
bibma:Print
bibma:Print
P102_has_title
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
E39_Actor
E53_Place
E35_Title
E6_Destruction
E80_Part_Removal
bibma:Inventory
P46_is_composed_of
P70_documents
E50_Date
P109_has_current_or_former_curator
P53_has_former_or_
current_location
33. CIDOC CRM + FRBRoo :
Inventaires + catalogues de ventes
P70_documents
P106_is_composed_of
P70_documents
bibma:Sales_Catalogue
bibma:Manuscript
E78_Collection
owl:sameAs
bibma:Manuscript
P24_transferred_title_of
E8_Acquisition
P23_transferred_title_from
P22_transferred_title_to
E39_Actor E39_Actor
P108_has_produced
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
bibma:Item ?
bibma:Subdivison ?
P106_is_composed_of
E12_Production
34. CIDOC CRM + FRBRoo :
Inventaires + catalogues de ventes
E13_Attribute_Assignement
P140_assigned_attribute_to
P70_documents
P14_carried_out_by
P141_assigned
bibma:Item bibma:Manuscript
E39_Actor
Chercheur MRSH
Caen
P48_has_preferred_
identifier
E42_Identifier
Avranches,
Bibliothèque
municipale, 161
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
Inventaire de
Montfaucon
35. But du projet Biblissima
● production de données (2013-2016)
● transmission des textes / collections
● les rendre accessibles via UN portail
● faciliter la recherche sur ces données
● visualisation des résultats
● soutenir des outils, répertoires et projets
du domaine des humanités numériques
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
36. En cours
● ADHO SIG Libraries and DH Proposal
● Prototype Initiale Mandragore
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
37. ADHO SIG “Libraries and DH”
Planning : envoyer une proposition fin de l’année
But : “advocate for initiatives of interest and benefit to
both libraries and digital humanities ;
organizing conference sessions - ones for librarians at DH
conferences, and others focused on DH at conferences
intended primarily for librarians”
>130 collègues ont déjà signalé leur intérêt
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
38. Prototype Initiale - Mandragore
● valoriser le potentiel des données de
Biblissima
● jeu de données en RDF
● descripteurs géographiques
● compatible avec le CIDOC CRM + FRBRoo
● http://doc.biblissima-condorcet.fr/retour-dexperience-
biblissima-lutilisation-de-cidoc-crm
Outils, méthodes, corpus : la modélisation des données en SHS, 17/11/2014 INHA Paris
Notes de l'éditeur
= copie du texte par exemple la copie de la traduction de Rufin : ne créée pas une nouvelle expression de l’oeuvre. on n’utilise donc pas l’évènement F28_Expression_Creation mais l’évènement E12_Production.
ça va être difficile et prendre du temps de réaliser des transformations différentes selon les cas (copies ou nouvelles expressions) ainsi que de gérer les URIs.