Preservación digital: donde la conservación encuentra la tecnología
1. Preservación Digital:
Donde la conservación
se encuentra con la tecnología
Efraim Martinez
Mail: efraim@arspermeable.org
Twitter: @arspermeable
26 de febrero de 2014
2. La NASA y la preservación digital
• 1975: La NASA envía las
misiones Viking a Marte
• 1999. El profesor Joseph
Miller desea acceder a
los datos. Los datos se
recuperan desde copias
impresas.
El 20% se ha perdido
definitivamente.
• 2001: El análisis halla
trazas de vida.
“The data were on magnetic tapes, and
written in a format so old that the
programmers who knew it had died”
http://spaceflightnow.com/news/n0107/29marslife/
3. La raza humana es una ávida generadora
(y destructora) de información
5. Los contenidos digitales son frágiles y
complejos.
Degradación muy rápida
del dato
Obsolescencia
tecnológica
Falta de metadatos y
descripciones
En contra de lo que se piensa, el dato
almacenado en formato digital se
degrada muy rápidamente. En
algunos soportes como CD-ROM,
memorias o cintas de backup, menos
de 10 años. Muy inferior a los
soportes tradicionales analógicos.
Los formatos digitales dejan de estar
en vigor en plazos muy cortos. Hoy
en día ya no es posible leer ficheros
escritos en wordstar y es complejo
abrir ficheros Excel 2003 con la
versión del año 2013. Por no hablar
de los lectores de cintas, disquetes y
CDROM que han caído en desuso.
Incluso aún pudiendo leerlos, si en el
momento del almacenaje no se
incluyeron metadatos, reutilizarlo
será inviable, especialmente en
grandes colecciones o contenidos con
relaciones complejas.
Esto hace que la probabilidad de que
un dato no accedido en los últimos
10 años se haya perdido sea muy alta
(se estima aproximadamente en un
60%).
La duración de un formatos es muy
inferior al tiempo de vida de la
información que contienen.
Datos como la aplicación de creación,
sistema operativo o historial de
cambios no son necesarios para el
uso actual pero son imprescindibles
para la usabilidad futura.
Por ello son necesarios procesos de preservación
especializados en el mundo digital, diferentes de
los conocidos para la información analógica y a
los procesos de gestión de documentación viva.
La “negligencia benigna” no sirve.
6. ¿Qué es la preservación digital?
Proceso y actividades para garantizar la
reutilización futura de la información digital.
(es decir, el acceso, integridad, autenticidad y usabilidad de la misma)
7. ¿Para qué preservar la información digital?
• Motivos históricos
• Motivos económicos
• Motivos legales
• … ¿Motivos de vida o muerte?
Tenemos que crear y
preservar la memoria
del futuro.
10. Procesos de preservación
QUÉ Y DÓNDE ALMACENAR LOS DATOS
El almacenamiento de preservación
tiene características diferentes del de
producción online
•Poca necesidad de velocidad y ancho de banda
•Número mínimo de accesos
•Alta seguridad y fiabilidad
11. Procesos de preservación
QUÉ Y DÓNDE ALMACENAR LOS DATOS
Principios básicos
•Varias copias
•Separadas geográficamente
•Distintas tecnologías
12. Procesos de preservación
QUÉ Y DÓNDE ALMACENAR LOS DATOS
¿Y la nube?
• Muchas ventajas por ubicuidad y
por gestión
• Técnicamente no es evidente que
siempre sea una ventaja para
preservar (difícil de auditar,
pérdida de control, poca capacidad
de sobresuscripción, …)
• Administrativamente es complejo
(pago periódico, con tarjeta…)
13. Procesos de preservación
QUÉ Y DÓNDE ALMACENAR LOS DATOS
Chip de cuarzo
Laser sobre acero
1000 años
A. Nuclear Francia
1 millón de años
Berkeley
1000M años
http://cuneiformtech.com
http://neofronteras.com/?p=3927
http://neofronteras.com/?p=3927
http://neofronteras.com/?p=3927
¿garantiza la reusabilidad?
¿es adecuado a nuestra necesidad actual?
Preservar ≠ Almacenar
14. Procesos de preservación
SELECCIÓN Y ADQUISICIÓN DE MATERIAL
No todo el material debe ser preservado
•Una buena selección definirá la utilidad y el
coste de la preservación
•Debe pensar en el usuario futuro
•Digitalizar pensando en preservar (formatos y
calidades normalmente más restrictivos)
•Hay que tomar decisiones, en el mundo digital
la negligencia benigna no sirve
15. Procesos de preservación
INGESTA, DISEMINACIÓN, AUDITORÍA
Definir un plan de preservación y
garantizar que se cumple
•Ingestar con garantías de calidad, formato,
estructura y metadatos
•Guardar en los repositorios definidos
garantizando que lo almacenado es lo correcto
•Revisar que lo sigue siendo en el tiempo
mediante firmas digitales o funciones hash
•Debido al alto volumen de datos, debe ser una
tarea automatizada
16. Procesos de preservación
EXTRACCIÓN Y VISUALIZACIÓN
Seguridad y trazabilidad
•Durante la extracción se accede a una copia y no
al objeto preservado
•Una vez que se accede… ¿cómo se representa?
• Si el formato es obsoleto
• Si el hardware / sistema operativo / aplicación
originales ya no existen