El documento describe el repositorio cooperativo catalán TDX, gestionado por el Consorcio de Servicios Universitarios de Cataluña (CSUC) desde 2001. TDX alberga tesis, preprints, materiales docentes y datos de investigación de 15 universidades catalanas. El CSUC realiza copias de seguridad y migraciones periódicas para preservar los contenidos digitales a largo plazo a través de su participación en la red LOCKSS.
1. Lluís Anglada & Ricard de la Vega
Consorci de Serveis Universitaris de Catalunya (CSUC)
5 de março de 2021
Experiência do repositório
cooperativo catalão TDX
2. • Generalitat de Catalunya + 10
universidades
• Fusão de um consórcio TIC e um
bibliotecário
• Gestão de infraestruturas e serviços
cooperativos para as universidades e lá
investigação da Catalunha
• Eletricidade
• Telefonia
• Revistas científicas
• Programas
• ...
• Repositórios
Consórcio de Serviços Universitários de
Catalunha (CSUC)
3. Repositorios en el CSUC
• Para diferentes objetivos
– Repositorios cooperativos y específicos para determinas instituciones o
funciones
• En diferentes momentos
– El 1º en 2001 (tesis), en 2005 (preprints), 2006 (revistas) … 2015
(ciencias de la salud)
• De distintos contenidos
– Tesis, prepints, películas, documentos históricos, materiales docentes…
recientemente, de datos de investigación
• En formatos variados:
– texto (PDF), imágenes´, vídeos, audios, páginas web…
• Usando distintos programas
– DSpace, OJS, Heritrix + Wayback , CONTENTdm, DSpace-CRIS, Dataverse
5. Divulgação e preservação da tese
URV
UVic
UdG
UdL
UJI
UA
UAB
UPF
UB
Arquivos
UIB
Metadados
Admissão das 15
universidades
6. CRIS
CRIS
CRIS
Mais divulgação da teses
DART
Recol
ecta
Driver
Tese europeia
Trabalhos de pesquisa
espanhol
Trabalhos de
pesquisa
europeia
…
Motores
de busca
Outros
colecionadores
Portal de pesquisa da Catalunha
CRIS
CRIS
CRIS
7. Preservación digital
• Los documentos físicos se queman, quedan destruidos por
las catástrofes o se pierden
– Lo mismo (a su manera) puede pasar con los documentos
electrónicos
• Las infraestructuras digitales deben asegurar el acceso
diferido (a medio y largo plazos) a los contenidos
• ¿Cómo?
– Replicando ficheros
– Refrescando datos
– Migrando formatos
– Usando formatos abiertos
– Comprobando la integridad
– Con planes de copntingéncia
– Teniendo políticas de preservación
– …
8. Las acciones del CSUC para TDX
• Migraciones de hardware
– Cada 5 años mínimo, gracias al conjunto de infraestructuras que el CSUC
gestiona
• Migraciones de software
– Cambios de software (de NDLDT a DSpace), módulos añadidos (estadísticas),
nuevas funcionalidades, cambios de versiones …
• Integridad de los datos
– Checksums en DSpace (online) + en LOCKSS (copias oscuras)
• Migración de formato
– Aun no (PDF) pero si para los metadatos (de ETDdb a Dublin Core )
• Diferentes réplicas
– Diferentes copias de backup en cinta (una en una cabina ignífuga, otra en un
centro del CSUC a 150 km de distancia)
– 7 copias oscuras en MetaArchive Cooperative
9. MetaArchive Cooperative
• Educopia Institute mission:
– Aumentar el impacto de instituciones culturales, científicas y eruditas
• MetaArchive Cooperative
– a digital preservation network created and hosted by and for memory
organizations.
– The mission = to foster better understanding of distributed digital preservation
methods and to create enduring and stable, geographically dispersed “dark
archives” of digital materials that can, if necessary, be drawn upon to restore
collections at Member organizations.
– Formada por 19 miembros en 3 países de 3 continentes
• Basada en LOCKSS (Lots of Copies Keep Stuff Safe)
– Promueve y soporta una preservación digital cooperativa, robusta y
descentralizada
– Funciona bajo lo que se conoce como Private LOCKSS Network , donde los
nodos se conocen e interactúan entre sí para almacenar copias, pero no para
proporcionar acceso a las mismas
– Cada fichero se replica un determinado número de veces y se conserva en
instituciones alejadas geográficamente entre sí
16. Private LOCKSS network
• 7 copies with widespread geographical
distribution
• All 7 servers revisit on a regular basis to pick
up new and changed content
• Versioning (no remove changed content)
• Checksums file integrity control
17. Valoración
• Solução robusta, fácil e econômica para recuperar
conteúdo em caso de desastre
• Controla a integridade dos dados e restaura o
original se houver uma cópia danificada
• Até agora apenas para teses, agora estamos
tentando fazer com que você arquive periódicos
• Os serviços de armazenamento comercial são
seus concorrentes?