El documento describe la evolución de las bases de datos y recursos digitales para el estudio de los incunables clásicos en España desde las primeras bibliotecas digitales estáticas hasta la web semántica. Se detalla el desarrollo de catálogos digitalizados, bases de datos en línea y portales que enlazan información sobre incunables. Finalmente, propone avanzar hacia la digitalización y procesamiento de imágenes con reconocimiento óptico de caracteres, la creación de colecciones enlazadas mediante estándares semanticos y la visibilidad
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Bases de datos y recursos digitales para el estudio de los incunables clásicos
1. Bases de datos y recursos digitales
para el estudio de los incunables
clásicos en España. Perspectivas de
investigación a la luz de la tecnología
Elena González-Blanco García
egonzalezblanco@flog.uned.es
“LOS CLÁSICOS LATINOS EN LOS
ORÍGENES DE LA IMPRENTA:
TEXTOS, CONTEXTOS Y CULTURA
IMPRESA (CA. 1450-1540)”
UNED. 19-21 de noviembre de 2014.
2. Perspectivas de análisis desde
las Humanidades Digitales
Cambios en la aproximación al estudio de los
incunables y de los clásicos
5. 5
Era del PC
Web 1.0
Web 2.0:
Web social
Web 3.0: web de datos enlazados
6. Digital Incunabula metaphor
Gregory Crane et al, 2006. “Beyond Digital Incunabula: Modeling
the Next Generation of Digital Libraries”. Lecture Notes in
Computer Science Volume 4172, 2006, pp 353-366,
http://www.eecs.tufts.edu/~dsculley/papers/incunabula.pdf
7. Web 1.0 – web estática
Modelos “incunables” = primeras bibliotecas digitales
Los modelos digitales solucionan los problemas pero
imitan las realidades que los preceden (el papel).
• Publicaciones en PDF o HTML que siguen la
estructura del papel: encabezado, pie de página,
notas, bibliografía.
• Los metadatos siguen las clasificaciones en papel
de las signaturas de las bibliotecas
• Las primeras bibliotecas digitales son estáticas y
no son capaces de generar nuevo contenido por sí
solas ni de aprender
9. Catálogos en pdf colgados en
internet
• García Romero: Catálogo de incunables de la Real
Academia de la Historia,
1921http://ia600604.us.archive.org/5/items/catlogodelosi
n00garc/catlogodelosin00garc.pdf
• Catálogo de incunables y obras impresas del siglo XV
de la Biblioteca Municipal de Madrid,
2002.http://www.memoriademadrid.es/fondos/BH/docum
entos/BHM_CatalogoIncunables.pdf
• Catálogo de incunables de la Biblioteca Foral de
Navarrahttp://www.unav.es/biblioteca/jmtorres_publicaci
ones/pdf/INCU.PDF
11. Un paso más: bases de datos
Creación de catálogos locales en las bibliotecas
• Disponibles online
• Acceso libre
• Permiten búsquedas de complejidad creciente en
distintos campos
16. Gesamtkatalog der Wiegendrücke
36,000 descripciones de incunables, con más de 3,900 artículos
http://www.gesamtkatalogderwiegendrucke.de
17. ISTC: Incunabula Short Title Catalog
En 2008 29,777 registros, incluyendo impresos del siglo XVI
http://www.bl.uk/catalogues/istc/
18. Catálogos… y más
Imágenes de las obras
Enlaces a otras bases de datos
Otros elementos adyacentes: encuadernaciones,
poseedores
Sistemas de localización geográfica…
19. Digital gallery of rare books &
special collections, Keio
University Library
http://project.lib.keio.ac.jp/dg_kul/incunabula_tbl.php?lang=en
23. Base de datos de
encuadernaciones de la RB
http://encuadernacion.realbiblioteca.es/index.ph
p
24. Portales monográficos:
Dawn of Western Printing
de Dawn of western printing, elaborada por la
National Diet Library de Tokio, Japón, incluye desde
un sencillo panorama histórico sobre el proceso de
fabricación de estos libros hasta un complejo índice
de tipos utilizados por los distintos impresores.
http://www.ndl.go.jp/incunabula/e/index.html
25. Atlas of Early Printings, Iowa
http://atlas.lib.uiowa.edu
27. Web 2.0
• Portales “nodo” de catálogos de incunables
• Listas de correo:
• INCUNABULA-L@LISTSERV.DFN.DE
• Digital Classicist
• Digital Medievalist
• Blogs: http://www.stoa.org
28.
29. Las bibliotecas “post-incunables”
• Granularidad: los diferentes items bibliográficos inclyen
elementos que facilitan la búsqueda y la accesibilidad a
la información cuando son enlazados: Marcado,
procesamiento automático, estructuración de los
documentos y uso de convenciones para el intercambio
de datos.
• Autonomía inteligente: sistemas que “aprenden” de sus
contenidos y se ponen en relación con fuentes o
recursos similares.
• Colaboración de la comunidad de usuarios: modelo
Wikipedia.
• Creación de bibliotecas orientadas a las necesidades
del usuario y personalizables que auto-aprendan de sus
preferencias
31. ¿Qué es la web semántica?
• La web pasa de convertirse en una web de
documentos a una web de DATOS.
• Los datos son reutilizables y se conectan
• Los datos se relacionan, no hay datos aislados
• Existen vocabularios controlados para describir el
mismo tipo de información
• Informáticamente, se codifican como “tripletas”
SUBJECT-PROPERTY-OBJECT
32. LOD principles
Information is available on theWeb (any format)
under an open license
Information is available as structured data (e.g. Excel
instead of an image scan of a table)
Non-proprietary formats are used (e.g. CSV instead
of Excel)
URI identification is used so that people can point at
individual data
Data is linked to other data to provide context
42. Una mirada hacia el futuro…
Líneas estratégicas de avance:
• Digitalización y procesamiento de imágenes con
OCR avanzados y específicos
• Creación de colecciones documentales digitales
utilizando estándares y en acceso abierto
• Enlace de las diferentes bases de datos y recursos
mediante las tecnologías de la web semántica
43. Digitalización y procesamiento
de imágenes
• Captura
• Presentación y Preservación
• Puesta en web: colecciones digitales
• Almacenamiento a mayor calidad (másteres)
• Reconocimiento y tratamiento
• Imágenes digitalizadas
• Imágenes + Metadatos
• Reconocimiento con OCR (DAG-CVC)
• Transcripción manual y edición crítica digital
• Enlace y visibilidad
44.
45. Referencias bibliográficas
Monfort, Marie-Laure. Où en est le catalogue mondial des incunables?.
Bulletin des bibliothèques de France [en ligne], n° 5, 1995 [consulté le 20
novembre 2014]. Disponible sur le Web : <http://bbf.enssib.fr/consulter/bbf-
1995-05-0042-003>. ISSN 1292-8399.
Digitizing Latin Incunabula: Challenges, Methods, and Possibilities
Jeffrey A. Rydberg-Cox <rydbergcoxj_at_umkc_dot_edu>, University of
Missouri-Kansas City, Changing the Center of Gravity: Transforming
Classical Studies Through Cyberinfrastructure 2009 Volume 3 Number 1
http://www.digitalhumanities.org/dhq/vol/3/1/000027/000027.html#
Beyond Digital Incunabula: Modeling the Next Generation of Digital
Libraries⋆ Gregory Crane, David Bamman, Lisa Cerrato, Alison Jones, David
Mimno, Adrian Packel, David Sculley, and Gabriel Weaver. Perseus Project,
Tufts University. En Research and Advanced Technology for Digital Libraries
Lecture Notes in Computer Science Volume 4172, 2006, pp 353-366, texto
completo en http://www.eecs.tufts.edu/~dsculley/papers/incunabula.pdf