Este documento describe las diferentes etapas del proceso de migración de sistemas de automatización de bibliotecas. Explica que la migración implica la transferencia de datos de un sistema a otro y puede involucrar un cambio en el formato de los registros. Luego detalla las principales etapas del proceso como descubrimiento de datos, análisis, limpieza y validación de los datos migrados. El objetivo es dar lineamientos generales sobre cómo llevar a cabo con éxito un proyecto de migración entre sistemas de automatización
Proceso de migración de sistemas de automatización de bibliotecas
1. UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO
FACULTAD DE FILOSOFÍA Y LETRAS
COLEGIO DE BIBLIOTECOLOGÍA
PROCESO DE MIGRACIÓN DE SISTEMAS DE
AUTOMATIZACIÓN DE BIBLIOTECAS
Propuesta de ponencia presentada por:
LIC. CARLOS RICARDO VARGAS MEDINA
En el marco del XXIX Encuentro de profesores y estudiantes del Colegio de
Bibliotecología.
Ciudad de México, julio 2019
2. 2
Resumen: El presente trabajo nace de la práctica profesional, en la cual el autor se a
percatado que el proceso de migración de sistemas de automatización no se lleva a cabo de
una manera estandarizada, en parte por desconocimiento de parte del personal bibliotecar io
de cuales son las fases de este proceso y, por otra parte, las empresas o personas que
realizan estás actividades las llevan a cabo con los conocimientos que se van adquiriendo
en el proceso. Debido a lo anterior muchas migraciones presentan inconsistencias, pérdida
de información, ubicación errónea y otras situaciones que se derivan de la mala praxis.
El objetivo de la ponencia es dar a conocer las fases generales que se deben considerar en
un proyecto de migración de sistemas de automatización de bibliotecas y una descripción
general de las mismas, ya que cada proyecto presenta características que lo hacen diferente,
a este respecto es importante mencionar que dos bibliotecas que utilizan el mismo sistema
de automatización en la misma versión lo pueden configurar o utilizar de manera diferente,
y es por ello que en cada caso se debe realizar el proceso desde el inicio.
Abstract: The present work is born from the professional practice, in which the author
realized that the process of migration of integrated library systems is not carried out in a
standardized way, in part because of ignorance on the part of the librarian personnel of
which are the phases of this process and, on the other hand, the companies or people that
carry out these activities carry out them with the knowledge that are acquired in the process.
Due to the above, many migrations present inconsistencies, loss of information, erroneous
location and other situations derived from malpractice.
The objective of the paper is to present the general phases that should be considered in a
migration project of integrated library systems and a general description of them, as each
project has characteristics that make it different, in this regard it is important to mention
3. 3
that two libraries that use the same automation system in the same version can configure it
or use it differently, and that is why in each case the process must be carried out from the
beginning.
Palabras clave: Automatización, administración de proyectos, sistemas de
automatización, migración de datos. Automation, project management, integrated library
system (ILS), data migration.
Introducción:
Una de las primeras integraciones de las bibliotecas y la automatización es el uso de tarjetas
perforadas, la cual lleva a cabo Ralph H. Parker en 1936 (Burns, 2014, p. 89), el uso de la
computadora para la recuperación de información tiene sus primeros intentos en la década
de 1950, específicamente en 1954 cuando Harley Tillet construyó el primer sistema
operativo de recuperación de información de biblioteca en una computadora de propósito
general, para ello empleo un equipo IBM 701 en la Naval Ordnance Test Station (NOTS)
ubicada en Inyokern, California, later called China Lake (Jeremy Norman & Co., Inc., s. f.),
este sistema contenía alrededor de 15,000 registros bibliográficos y el resultado de la
búsqueda se limitó a los números de acceso a los informes.
En 1958, Hans Peter Luhn desarrolló un programa de indexación de documentos que
automatizaría la producción de resúmenes de literatura. (Lamb, s. f.), sin embargo el diseño
del formato MARC en la década de 1960 en la Library of Congress, llevado a cabo por
Henriette Avram, permitió el intercambio de información bibliográfica entre diferentes
unidades de información, e impacto en el desarrollo de software de automatización de
bibliotecas.
4. 4
Los sistemas de automatización de bibliotecas centraron sus esfuerzos en la descripción de
los materiales y el catálogo al público, utilizando las bases sentadas por el formato MARC,
normas y estándares existentes, posteriormente cubriendo otros aspectos de las tareas
bibliotecarias, como la adquisición y circulación de materiales hasta convertirse en
sistemas integrales de gestión de bibliotecas.
Con la existencia de múltiples sistemas de automatización, y sus diferentes estados de
evolución y características, las unidades de información han realizado migraciones entre
ellos por diferentes motivos, entre los que se destacan: mejoras en la funcionalidad, ajuste
presupuestal, cambios en la estructura de la propia unidad de información, desaparición de
la empresa desarrolladora de un software en específico o fusión con otras empresas, etc.
Cada una de estas migraciones tiene sus características propias y existe documentación que
explica de manera general como se llevó a cabo.
Este trabajo pretende plantear las diferentes etapas que se desarrollan en los proyectos de
migración de sistemas de automatización de bibliotecas, teniendo en cuenta no solo las
características de cada sistema, sino también las del recurso humano necesario para la
conclusión exitosa de una migración de este tipo.
El proceso de migración expuesto se basa en la experiencia profesional en la migración de
sistemas de automatización, investigación teórica de los sistemas de automatización y la
migración de datos entre diferentes sistemas de automatización.
La automatización de bibliotecas
En el ámbito bibliotecario es muy común el término “automatización de bibliotecas” sin
embargo, al revisar diferentes definiciones de este término se observa que tienen puntos en
común y puntos discordantes, esto es completamente entendible porque se dieron en
5. 5
contextos y épocas diferentes, por ello se requiere establecer una definición que tenga en
cuenta los antecedentes y la realidad actual.
Las siguientes definiciones se mencionan en orden cronológico:
Kent proporciona una definición de automatización de bibliotecas fundamental:
“El uso de máquinas automáticas y semiautomáticas de procesamiento de datos
para realizar actividades tradicionales de biblioteca como adquisiciones,
catalogación y circulación. Aunque estas actividades no se realizan
necesariamente de manera tradicional, las actividades en sí son las que
tradicionalmente se asocian con las bibliotecas; por lo tanto, la automatización de
las bibliotecas puede distinguirse de otros campos relacionados, como la
recuperación de información, la indexación y la abstracción automáticas y el
análisis textual automático” (Kent & Lancour, 1975, p. 338).
Lancaster la define como “aplicación de la computadora y mecanismos relacionados con
el procesamiento de datos a los procesos técnicos y a las funciones administrativas
rutinarias de las bibliotecas” (Lancaster, 1983, p. 309).
Angulo considera la automatización de bibliotecas como:
“la aplicación de la computadora en el desarrollo de operaciones bibliotecarias,
considerando las tareas de carácter administrativo, la ordenación de los recursos
documentales y la generación de productos y servicios de información” (Angulo
Marcial, 1988, p. 28)
López asienta una definición muy escueta y general “acto o proceso por el cual se sustituye
al agente o agentes humanos que realizan un trabajo por una máquina o un conjunto de
ellas” (López Yepes, 2004, p. 176)
Por su parte Arriola menciona que:
“La automatización de bibliotecas tiene que ver con el proceso de adaptar la
tecnología a las labores bibliotecarias, pero ya no solo en las tareas rutinarias y
la circulación, si no va más allá. Y todo con la finalidad de disminuir tiempos,
6. 6
costos y movimientos para una buena gestión de la biblioteca; y así, satisfacer las
necesidades de información de los usuarios” (Arriola Navarrete, 2014, p. 132).
Derivado de la revisión de estas definiciones podemos considerar la automatización de
bibliotecas como: la utilización de la tecnología como una herramienta que auxilie en las
labores bibliotecarias, con la finalidad de facilitar la administración de dichas actividades
y ofrecer mejores productos y servicios tanto a la unidad de información como a sus
usuarios.
Sistemas de automatización de bibliotecas
Al igual que el concepto automatización de bibliotecas, existen diferentes definiciones de
sistema de automatización de bibliotecas, las siguientes definiciones se registran en orden
cronológico:
“Sistema integrado para la automatización de bibliotecas: conjunto organizado de
recursos humanos que utilizan dispositivos y programas informáticos, adecuados
a la naturaleza de los datos que deben procesar, para realizar procesos y facilitar
los servicios que permiten alcanzar los objetivos de la biblioteca: almacenar de
forma organizada el conocimiento humano contenido en todo tipo de materiales
bibliográficos para satisfacer las necesidades informativas, recreativas y de
investigación de los usuarios” (Garcia Melero & Garcia Camarero, 1999, p. 24)
“Sistema integrado de bibliotecas: sistema de información basado en
computadoras que utiliza una base de datos bibliográfica y un conjunto de
programas interrelacionados para automatizar las múltiples tareas de la
biblioteca” (Saffady, 1999, p. 209).
Sistemas integrados de biblioteca (ILS por sus siglas en inglés) y plataformas de servicios
bibliotecarios: aplicaciones utilizadas para adquirir, describir, administrar y proporcionar
acceso a las colecciones (Breeding, 2018a, p. 57)
En lo particular, el autor considera que “sistema integrado” surge en contraposición de los
“sistemas modulares”, pero ambos son sistemas que tienen características propias. Así,
7. 7
existen tanto sistemas integrados privativos como libres y de la misma manera sistemas
modulares privativos y libres.
El término que se usará en adelante es sistema de automatización de bibliotecas (SAB) para
referirnos a las aplicaciones conocidas como sistemas de automatización de bibliotecas y
sus sinónimos (tanto integrales, modulares, privativos o libres) que se utilizan como
herramientas auxiliares en la agilización de procesos bibliotecarios y acceso a la
información por parte de los usuarios de las unidades de información.
La migración de datos
La migración de datos es un proceso cuya finalidad es la transferencia de datos
almacenados de un origen a otro, este proceso puede plantear un cambio en el formato de
registro de los datos o la transferencia de los datos tal cual se encuentran de un sitio a otro.
En otras palabras, la migración de datos consiste en la “extracción, transformación y carga
de datos de un sistema a otro” (Grupo PowerData, 2017a, p. 5)
El proceso de migración de datos es un proceso continuo, en el sentido de que requiere
terminar correctamente una etapa para pasar a la siguiente, en general este proceso se
conforma de las siguientes etapas: “descubrimiento o recolección de los datos, análisis de
los datos, limpieza de los datos, transferencia de los datos y validación de los datos
migrados” (Grupo PowerData, 2017b, pp. 7-8).
La decisión o necesidad de realizar una migración de datos tiene diversas variables, algunas
de ellas son:
Liberación de nuevas versiones del sistema empleado
Cambio de sistema
Estandarización o unificación de la información en un sistema diferente al utilizado
8. 8
Nuevos procesos, que implican cambios en el sistema y estructuración de los datos
Vencimiento de licenciamiento
Actualización o cambio de hardware y/o software
Mejoras en la seguridad informática, etc.
La migración de información de un sistema de automatización de bibliotecas a otro.
La migración de la información contenida en la base de datos de un SAB a otro es una tarea
compleja, si no se planifica adecuadamente puede resultar en un trabajo que se prolongue
mucho más de lo proyectado o bien que los resultados deriven en situaciones que pudieron
evitarse, tal como menciona Breeding1:
El paso a un nuevo sistema de automatización trae consigo una mezcla de
reacciones para aquellos que se enfrentan a los retos de la migración y la
implementación, [...] estas migraciones traen consigo muchos desafíos y
considerables trastornos. Mientras que algunas migraciones se llevan a cabo de
manera más fluida que otras, no estoy al tanto de ninguna que se haya llevado a
cabo sin algún grado de frustración y ajuste (Breeding, 2018b).
Todos los SAB que se encuentran en la literatura consultada utilizan un motor de base de
datos como: MySQL, SQL Server, PostgreSQL, Oracle, Access, y otros más. Su base de
datos contiene la información de la configuración del sistema, usuarios, registros,
ejemplares, préstamos, adeudos, avisos, etc. y manejan estructuras muy diferentes. Así,
tenemos que la base de SIABUC8 maneja una estructura muy diferente a la de SIABUC9,
Altair tiene una estructura diferente a las anteriores y Aleph es otro diseño de base de datos.
1
Traducción del autor.
9. 9
Etapas de la migración
A continuación, se abordan las etapas que componen una migración de SAB en orden de
ejecución, la descripción de cada etapa se da manera general:
Descubrimiento de datos: Previo al análisis de datos, existe una fase que se denomina la
de "descubrimiento de los datos" y que permite conocer con qué datos se cuenta y cuál es
la calidad de los mismos. Es aquí donde se debe proceder a identificar los datos relevantes
para la migración (Grupo PowerData, 2017a, p. 7).
El descubrimiento de los datos es un recordatorio de la importancia del trabajo con datos y
de su calidad, en un entorno de seguridad de la información, ya que muchas organizaciones
no son del todo conscientes del valor de la información hasta que tienen ocasión de
descubrirlo durante esta fase, que les facilita un contacto más directo con él. Los resultados
de esta etapa son:
Seleccionar las fuentes de datos, cual es la forma más completa de obtener los datos
de origen.
Establecer qué campos se requieren de cada fuente, tanto de tablas como de
archivos externos.
Calcular una estimación de los requisitos e almacenamiento, en relación al número
de registros, ejemplares, archivos digitales vinculados, usuarios, préstamos,
devoluciones, etc.
Determinar los derechos de acceso y conexión a los datos, si se requiere contar con
algún permiso o licencia para la extracción de los datos, si se encuentran
encriptados, si se tiene que hacer de manera fragmentada, etc.
10. 10
Análisis: Una vez determinada la manera de descubrir o extraer los datos del SAB origen,
se procede a su análisis. El análisis de datos es un reconocimiento de las reglas de negocio,
no sólo por entidad, sino también en lo relativo a su correlación, campo a campo, entre
ellos y con el nuevo sistema. Cuando esta etapa concluye, ya se puede comenzar a perfilar
los datos.
El perfilado hace posible determinar cuál es la verdadera calidad de los datos. Es habitual
encontrar claves duplicadas, descubrir la aplicación de distintos términos para un mismo
concepto (tipos de material, usuarios, categorías, etc.), detectar inconsistencias o asumir la
existencia de campos vacíos que revelan datos inexistentes o perdidos. En esta fase es
fundamental:
Trabajar sobre el total de datos a migrar, trabajar sobre una muestra no permitirá
detectar el total de inconsistencias en la base origen, ni la cantidad de informac ión
a migrar.
Trabajar en conjunto con el propietario de los datos, es decir, con el personal de la
biblioteca, pues son ellos quienes conocen su trabajo y los datos con los cuales lo
hacen.
Terminar el proceso con una validación del análisis realizado, es recomendable no
continuar con las siguientes etapas hasta contar con el visto bueno del análisis
realizado por parte de los responsables correspondientes, de lo contrario se aumenta
la probabilidad de omisión de inconsistencias y de información relevante para la
migración exitosa.
11. 11
Calidad de datos: Dentro de un proyecto de migración, llegar a la fase de calidad de datos
supone armonizar, normalizar y enriquecer los mismos. Este proceso puede pasar por
varios ciclos y actividades, que son:
Limpieza de datos: es el momento en que se corrigen los datos que se consideran
incorrectos o inconsistentes
Homologación: implica la unificación de criterios, necesaria porque los datos de
origen pueden estar manejado diferentes nombres para un mismo elemento.
Enriquecimiento: se lleva a cabo al complementar y perfeccionar los datos
maestros, si les faltase completitud o información.
Conversión de los datos: Adecuar los datos para facilitar su proceso de carga, en la etapa
final de la migración de datos es un paso muy relevante. Su importancia reside en que de
su incorrecta o poco precisa ejecución pueden derivarse diferentes errores, cuyas
consecuencias podrían afectar a todo el proyecto. Las claves de una conversión de datos de
alta calidad son:
Realizar la conversión con las herramientas adecuadas a cada caso.
Poseer un profundo conocimiento de los requerimientos del sistema destino, en los
SAB se refiere a los diferentes métodos de importación para cada caso (registros,
ejemplares, usuarios, préstamos, etc.), de esta forma se minimizan los errores, por
lo que se ahorran tiempo y recursos.
Dominar las reglas de negocio: que son las directrices sobre las que la conversión
se estructurará y son derivadas del análisis de los datos.
12. 12
Productos de esta etapa son:
Determinar qué campos van a ser migrados, cómo se migrarán y cuál será su
destino.
Auditar la transferencia de datos mostrando, al menos, el origen y destino de los
datos, las actualizaciones o necesidades de procesamiento especiales y el número
de registros procesados.
Mapeo y carga
La fase de mapeo y carga es la culminación del proceso de migración de datos. Cuando los
datos han sido procesados correctamente y se han realizado las pruebas correspondientes
en los entornos adecuados, es el momento de proceder a la carga de los datos. Una vez
realizada la carga o importación de los datos es necesario:
Comprobar que los datos se hallan en el sistema destino según estaba previsto.
Aplicar comprobaciones de calidad a los datos, ya sea mediante búsquedas,
reportes, etc.
Demostrar que las nuevas aplicaciones o procesos pueden aprovechar los datos en
el modo en que era esperado.
Analizar si, en términos globales, el sistema destino ofrece una mayor precisión en
la información que el sistema origen.
Todo el proceso de migración debe documentarse, ya que de esta manera será más fácil
realizar ajustes a la migración si se llegará a detectar alguna inconsistencia en la
información.
13. 13
Conclusiones
Al emprender un proyecto de migración de SAB deben considerarse diversos aspectos
como son: la infraestructura con la que se cuenta, el personal, las características del acervo,
un estudio profundo sobre la situación del sistema de administración de bibliotecas actual,
entre otros, una vez justificado el cambio del sistema el proyecto de migración como tal
debe ser bien detallado, tanto las tareas a realizar como el alcance de cada tarea y
responsable. Para ello se requiere personal experto, cuya experiencia y referencias sean
comprobables, ya que es un paso importante para cualquier unidad de información y debe
ser llevado a cabo por personal capaz.
En este tipo de proyectos es necesario ser conscientes de la complejidad que se enfrenta,
ya que si bien es cierto que existen estándares internacionales, tanto bibliotecarios como
informáticos, no todos los sistemas de automatización los soportan al cien por ciento, lo
que entraña retos a vencer el desarrollo de la migración.
Las etapas planteadas en este trabajo sirven de marco de referencia para proyectos de
migración de SAB, sin embargo, no se debe olvidar que el proceso de migración es uno de
los pasos en la implementación de un nuevo sistema, debe incluirse en un plan de proyecto
junto con otras etapas importantes como son la validación de la infraestructura necesaria,
la capacitación al personal operativo, administrativo y técnico, periodos y característica de
soporte técnico, planificación de actualizaciones, entre otros.
Con este trabajo se busca orientar a los nuevos profesionales de la información en este tipo
de proyectos que son complejos y se requiere conocer en términos generales las etapas de
la migración de datos.
14. 14
Bibliografía
Angulo Marcial, N. (1988). Terminología de automatización documental. México:
Imprenta Muñoz.
Arriola Navarrete, Ó. (2014). Automatización de bibliotecas universitarias del área
metropolitana de la ciudad de México (Tesis doctoral, Universidad Complutense
de Madrid). Recuperado de https://eprints.ucm.es/24567/
Breeding, M. (2018a). Perceptions 2017. Encuesta internacional sobre automatización de
bibliotecas. Anuario ThinkEPI, 12(0), 56-76.
https://doi.org/10.3145/thinkepi.2018.05
Breeding, M. (2018b). Systems Migration: Opportunities Revamp Automation Strategies.
Computers in Libraries, 38(2), 17-20. Recuperado de
http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=128568944&si
te=ehost-live
Burns, C. S. (2014). Academic Libraries and Automation: A Historical Reflection on Ralph
Halsted Parker. portal: Libraries and the Academy, 14(1), 87-102.
https://doi.org/10.1353/pla.2013.0051
Garcia Melero, L. A., & Garcia Camarero, E. (1999). Automatizacion de bibliotecas.
Madrid: Arco Libros.
Grupo PowerData. (2017a). Introducción a la migración de datos. Recuperado de
https://landings.powerdata.es/guia-sobre-la-migracion-de-datos
Grupo PowerData. (2017b). Migración de datos : necesidad y estrategia. Recuperado de
https://landings.powerdata.es/data-migration-necesidad-y-estrategia
15. 15
Jeremy Norman & Co., Inc. (s. f.). Early Library Information Retrieval System (1954).
Recuperado 19 de octubre de 2018, de HistoryofInformation.com website:
http://www.historyofinformation.com/expanded.php?id=923
Kent, A. (ed. ), & Lancour, H. (ed. ) (Eds.). (1975). Encyclopedia of library and
information science, v.14 : Kuwait to librarycommunity relations. New York: M.
Dekker.
Lamb, A. (s. f.). History of Libraries. Recuperado 19 de noviembre de 2018, de History of
Libraries website: https://eduscapes.com/history/contemporary/1950.htm
Lancaster, F. W. (1983). Evaluación y medición de los servicios bibliotecarios / F.W.
Lancaster. México: UNAM, Dirección General de Bibliotecas.
López Yepes, J. (ed. ). (2004). Diccionario enciclopédico de ciencias de la documentación.
Madrid: Síntesis.
Saffady, W. (1999). Introduction to automationfor librarians (4th ed). Chicago: American
Library Association.