Presentada en la Jornada Internacional sobre Archivos Web y Depósito Legal Electrónico, en la Biblioteca Nacional de España (BNE), el día 9 de julio de 2013.
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
El archivo de la Web Española y el reto tecnológico del DL-e. José Ramón García Amo
1. El Archivo de la Web Española y el
reto tecnológico del DL-e
José Ramón García Amo
Coordinador de Informática 9 Julio 2013
2. La Unidad de Coordinación
Informática en la BNE
Soporte en TI
Comunicaciones
– Internas, con terceros, Internet, IA, correo electrónico etc
Sistemas (hardware y software)
– Servidores, almacenamiento, back up, equipos personales, movilidad.
Desarrollo
– Definiendo y desarrollando sistemas de información (horizontales y
verticales).
Seguridad
Posibilita que la BNE realice las funciones de gestión que tiene encomendadas
(conservar y difundir el patrimonio documental español).
Para el caso que nos ocupa (archivo web y depósito legal electrónico), la UCI debe
garantizar el acceso a las publicaciones digitales en línea, su recolección, su
almacenamiento, su salvaguarda, aplicando reglas de seguridad etc.
2
3. Retos
Se pretende:
La preservación del dominio .es y otros dominios y subdominios asociados que tengan
contenidos digitales patrimoniales vinculados a España.
El almacenamiento de las publicaciones en línea no tangibles que constituyen el
fundamento del DL-e (libros electrónicos, revistas electrónicas, otros elementos
electrónicos etc.).
Retos
Presupuestario (difícil de superar)
Técnico.
– Nuevas herramientas
– Nuevos procedimientos
– Aumento exponencial de necesidades de almacenamiento
– Aumento exponencial de necesidades de procesamiento
Recurso humanos
3
4. Red.es
Red.es
El 13 de diciembre del pasado 2012 la BNE y la entidad pública empresarial
Red.es suscribieron un convenio de colaboración para el desarrollo de
actuaciones conjuntas en el ámbito del DL-e.
Estas actuaciones están encaminadas a:
– Consolidación y mejora de la infraestructura de red
– Consolidación y ampliación de la infraestructura de almacenamiento
– La implantación de herramientas TIC.
– El desarrollo de sistemas de información y servicios asociados.
– Conocimiento en herramientas software que posibiliten la recolección,
indexación, almacenamiento y gestión de los contenidos
4
5. Fases
Fases
Ley 23/2011, de 29 de julio, de depósito legal.
BNE asume abordar el archivado web con medios propios
Convenio con Red.es
Prueba disco contenido Internet Archive.
Implantación 1ª fase de la infraestructura de red.
Implantación del SW y HW pilotos
– NetarchiveSuite: Versión 4.0.1
– Wayback Machine: Versión 1.6.0
– Java: Versión 1.6.0_22
– Apache Tomcat (v. 6.0.36) Apache HTTP (v. 2.2), BB.DD.: Derby 10.8.2.2
Primeras pruebas y recolecciones
Concurso para ampliación de sistemas de almacenamiento (Red.es)
Concurso de la 2ª fase de ampliación infraestructura de red (Red.eS)
Integración contenidos recolecciones realizadas en IA
Primeros pasos…
5
6. Nos queda mucho
Instalación y configuración definitivas de Heritrix y NetArchive Suite, a lo
que hay que sumar las pruebas habituales de seguimiento de recolecciones
(refinamiento constante de la parametrización).
Instalación y configuración definitivas de la Wayback Machine.
Diseño del entorno de indexación y refinamiento de la parametrización.
Estudio de opciones de software para la recuperación de la información
(Solr...).
Análisis continuo de los requisitos de preservación de un archivo web
(conjunto al equipo bibliotecario): SW, formatos ARC y WARC...
Control de calidad y realización de informes.
Diseño, producción y mantenimiento del portal web del repositorio.
6
7. Finalizando
Se nos presentan muchas incógnitas.
Retos muy interesantes y atractivos.
Superando poco a poco.
Con la experiencia de los que ya han pasado por
esto y de nuestro propio esfuerzo.
7