Este documento presenta un proyecto de investigación sobre el control de registros bibliográficos duplicados en las bases de datos. El objetivo es identificar las causas de duplicidad y desarrollar un método para detectarlos y corregirlos. Se analizan 1120 registros cargados en Absys y la base de datos de CCPB. Se utiliza Linux, BRS y un script para identificar 125 títulos duplicados. Luego se comprueban las descripciones y 57 registros pasan a ser fondos asociados a CCPB, mientras que otros 22 se mantienen
Este documento describe el protocolo para que las bibliotecas que no catalogan puedan añadir registros a la base de datos AbsysNet. Explica cómo buscar registros en los catálogos de la Biblioteca Nacional de España y Rebeca y cómo descargar la información en formato MARC para enviarla al Servicio de Bibliotecas y que sean añadidos a AbsysNet. También indica los datos necesarios para añadir registros que no se encuentren en otros catálogos.
Gestores personales de bases de datos de referencias bibliográficasJuan pablo Peñuela
El documento analiza y compara cinco gestores personales de bases de datos bibliográficas: Reference Manager, EndNote, ProCite, RefWorks y EndNote Web. Describe sus características comunes como la entrada manual y automática de datos, el control de autoridades y la generación de bibliografías. También destaca sus diferencias en aspectos como el número de tipos de documentos soportados, campos disponibles y conexiones a bases de datos externas.
Este documento analiza y compara las características de cinco gestores personales de bases de datos bibliográficas: Reference Manager, EndNote, ProCite, RefWorks y EndNote Web. Describe las funciones comunes como la entrada de datos en formatos predefinidos, la búsqueda en bases de datos externas y la inserción automática de citas. También destaca las diferencias entre los programas, como el número de tipos de documentos soportados, la capacidad de almacenamiento y la posibilidad de realizar búsquedas simultáneas en varias bases de
El documento presenta una introducción al lenguaje SQL y las bases de datos relacionales. Explica conceptos como tablas, vistas, esquemas, joins, subconsultas, y las instrucciones DDL, DML y DCL de SQL para crear, modificar y consultar bases de datos.
Gestión colectiva de colecciones liliana dumar_sandro_edgar_g3emauriciomorenom
Este documento describe los pasos para desarrollar un catálogo colectivo entre varias bibliotecas. Primero, se debe definir las instituciones participantes y sus criterios de inclusión. Luego, se establecen los objetivos y la estructura organizativa de la red cooperativa. También se definen los formatos, normas y flujos de procesamiento de la información. Finalmente, se implementa el catálogo colectivo en fases piloto para evaluarlo y mejorarlo, permitiendo que los usuarios tengan acceso a un acervo de información más amplio
1) El documento describe la historia y necesidades de la automatización de archivos, incluyendo los primeros usos de computadoras en archivos en la década de 1970 y los desarrollos posteriores de sistemas para gestión documental, descripción, recuperación de información y más. 2) También analiza factores críticos para definir necesidades en proyectos de tecnología de archivos como factores organizacionales, tecnológicos y externos. 3) Finalmente, discute la definición de infraestructura para proyectos de diferentes
Este documento describe el diseño de un sistema de préstamo de libros para la biblioteca de la Unidad Educativa "El Esfuerzo" para mejorar el control y eficiencia del servicio. Actualmente, el sistema de préstamos es manual y lento, lo que causa problemas. El nuevo sistema automatizará los procesos de préstamo, consultas y estadísticas para agilizar el servicio a los usuarios y proteger los datos. El diseño considerará los diferentes tipos de procesos y áreas de la biblioteca para organizar eficientemente la información.
Este documento describe el protocolo para que las bibliotecas que no catalogan puedan añadir registros a la base de datos AbsysNet. Explica cómo buscar registros en los catálogos de la Biblioteca Nacional de España y Rebeca y cómo descargar la información en formato MARC para enviarla al Servicio de Bibliotecas y que sean añadidos a AbsysNet. También indica los datos necesarios para añadir registros que no se encuentren en otros catálogos.
Gestores personales de bases de datos de referencias bibliográficasJuan pablo Peñuela
El documento analiza y compara cinco gestores personales de bases de datos bibliográficas: Reference Manager, EndNote, ProCite, RefWorks y EndNote Web. Describe sus características comunes como la entrada manual y automática de datos, el control de autoridades y la generación de bibliografías. También destaca sus diferencias en aspectos como el número de tipos de documentos soportados, campos disponibles y conexiones a bases de datos externas.
Este documento analiza y compara las características de cinco gestores personales de bases de datos bibliográficas: Reference Manager, EndNote, ProCite, RefWorks y EndNote Web. Describe las funciones comunes como la entrada de datos en formatos predefinidos, la búsqueda en bases de datos externas y la inserción automática de citas. También destaca las diferencias entre los programas, como el número de tipos de documentos soportados, la capacidad de almacenamiento y la posibilidad de realizar búsquedas simultáneas en varias bases de
El documento presenta una introducción al lenguaje SQL y las bases de datos relacionales. Explica conceptos como tablas, vistas, esquemas, joins, subconsultas, y las instrucciones DDL, DML y DCL de SQL para crear, modificar y consultar bases de datos.
Gestión colectiva de colecciones liliana dumar_sandro_edgar_g3emauriciomorenom
Este documento describe los pasos para desarrollar un catálogo colectivo entre varias bibliotecas. Primero, se debe definir las instituciones participantes y sus criterios de inclusión. Luego, se establecen los objetivos y la estructura organizativa de la red cooperativa. También se definen los formatos, normas y flujos de procesamiento de la información. Finalmente, se implementa el catálogo colectivo en fases piloto para evaluarlo y mejorarlo, permitiendo que los usuarios tengan acceso a un acervo de información más amplio
1) El documento describe la historia y necesidades de la automatización de archivos, incluyendo los primeros usos de computadoras en archivos en la década de 1970 y los desarrollos posteriores de sistemas para gestión documental, descripción, recuperación de información y más. 2) También analiza factores críticos para definir necesidades en proyectos de tecnología de archivos como factores organizacionales, tecnológicos y externos. 3) Finalmente, discute la definición de infraestructura para proyectos de diferentes
Este documento describe el diseño de un sistema de préstamo de libros para la biblioteca de la Unidad Educativa "El Esfuerzo" para mejorar el control y eficiencia del servicio. Actualmente, el sistema de préstamos es manual y lento, lo que causa problemas. El nuevo sistema automatizará los procesos de préstamo, consultas y estadísticas para agilizar el servicio a los usuarios y proteger los datos. El diseño considerará los diferentes tipos de procesos y áreas de la biblioteca para organizar eficientemente la información.
Este documento describe el diseño de un sistema informático para la gestión de recursos continuos en la Biblioteca Nacional de Cuba "José Martí". Actualmente, la biblioteca utiliza software obsoleto que causa problemas como la duplicación de datos e impide el seguimiento de registros. El objetivo es diseñar un nuevo sistema que permita un control más efectivo de los recursos continuos, muestre el historial de cada registro y proporcione información sobre el trabajo de cada especialista. Se utilizó la metodología RUP para guiar el desarrollo e incluir el format
Objeto de conferencia
III Simposio Internacional de Bibliotecas Digitales (San Pablo, Brasil)
En este artículo se presentan las estrategias y particularidades encontradas en el proceso de "harvesting" de información académica realizado sobre diecisiete (17) repositorios de información. Esta iniciativa, llevada a cabo en la Universidad Nacional de La Plata, tiene como objetivo el brindar material de valor académico complementario al de propia producción institucional ya residente en la Biblioteca Digital del Portal SeDiCI. En el trabajo se tratan temáticas tales como: dificultades que el protocolo debería considerar para las posibilidades tecnológicas y de conectividad de nuestros países, dificultades en lo referente a la uniformidad de la información que se encuentra en los diferentes repositorios, tanto como los hallazgos y el potencial aprovechamiento máximo que el protocolo puede brindar para el descubrimiento de nuevas fuentes de información.
Ver registro completo en: http://sedici.unlp.edu.ar/handle/10915/5533
Este documento presenta el diseño de un sistema bibliotecario para mejorar el manejo de información en la biblioteca de la Unidad Educativa El Esfuerzo. Describe la creación de una base de datos en Access con tablas, formularios, informes y consultas. El objetivo es implementar un sistema que facilite el control de libros, materiales y usuarios, reemplazando el sistema manual obsoleto. Se concluye que el nuevo sistema permitirá un mejor manejo y administración de la información de la biblioteca.
Este documento describe las diferentes etapas del proceso de migración de sistemas de automatización de bibliotecas. Explica que la migración implica la transferencia de datos de un sistema a otro y puede involucrar un cambio en el formato de los registros. Luego detalla las principales etapas del proceso como descubrimiento de datos, análisis, limpieza y validación de los datos migrados. El objetivo es dar lineamientos generales sobre cómo llevar a cabo con éxito un proyecto de migración entre sistemas de automatización
Este documento resume los conceptos clave de una base de datos, incluyendo que una base de datos es un conjunto de datos almacenados sistemáticamente para su uso posterior, y describe las ventajas como el control de redundancia y la compartición de datos, así como las desventajas como la complejidad y los costos. También describe los diferentes tipos de campos y relaciones que pueden existir en una base de datos.
Trabajo Final ADSI II - Diseñe de Sistemas de Informaciónharr2662
Este documento presenta el diseño de un sistema de información para la biblioteca Compensar. Se describen tres fases principales: 1) el diseño de salida incluyendo pantallas de consulta, informes y formatos de impresión, 2) el diseño de entrada con pantallas para ingresar material e usuarios, y 3) el diseño de archivo y bases de datos con el objetivo de almacenar y recuperar la información de manera eficiente. El sistema propuesto utiliza el software Winisis para facilitar la gestión y consulta de la información de la biblioteca.
Presentación realizada en los talleres para centros cooperantes de la Biblioteca Virtual en Salud de Colombia en el año 2010, sobre la base de datos LILACS y el aplicativo LILDBI-WEB.
Este documento resume un taller para centros cooperantes sobre el uso de LILACS y LILDBI-WEB. Cubre las funciones de los centros cooperantes, el sistema LILDBI-WEB, el proceso de descripción bibliográfica e indización utilizando DeCS, la certificación de registros, y la alimentación y búsqueda en LILACS. El objetivo es proporcionar actualización sobre la descripción bibliográfica, indización y buenas prácticas para enviar información a LILACS.
Este documento describe el sistema CaMPI, un software libre y de código abierto para la automatización de bibliotecas. Se basa en la integración de tres proyectos existentes - Catalis para catalogación, OpacMarc para el catálogo público, y Open MarcoPolo para circulación y estadísticas. El objetivo es consolidar una comunidad de desarrollo y usuarios alrededor de este sistema. Se detallan sus características, metas, implementación, calidad, reuniones, difusión y guía de instalación.
El documento describe un método para detectar áreas de conocimiento similares entre investigadores ecuatorianos utilizando tecnologías de minería de datos y semánticas. Los autores proponen una arquitectura que une múltiples fuentes bibliográficas para identificar áreas de investigación comunes y redes de colaboración potenciales, mediante el uso de ontologías, vocabularios y tecnologías Linked Data. Adicionalmente, presentan un prototipo para proveer un repositorio centralizado con información bibliográfica y encontrar áreas de conocimiento
Este documento describe el protocolo para que las bibliotecas que no catalogan puedan añadir registros a la base de datos AbsysNet. Explica cómo buscar registros en los catálogos de la Biblioteca Nacional de España y Rebeca y cómo descargar la información en formato MARC para enviarla al Servicio de Bibliotecas, que se encargará de cargar los registros en AbsysNet. También indica los datos necesarios para añadir registros que no se encuentren en otros catálogos.
Este documento describe el desarrollo del Catálogo Virtual de Unión de Libros (CatVirL) de la Red de Bibliotecas del Sureste (REBIS). Explica el proceso de conversión de registros bibliográficos de 10 instituciones a un formato estandarizado y su carga al catálogo en OCLC. También resume los avances realizados y las metas pendientes para mejorar el catálogo y ampliar su cobertura a más instituciones.
Este documento describe una actividad teórico-práctica realizada por una estudiante de bibliotecología. La actividad consiste en varias partes: una investigación sobre software de automatización de bibliotecas, prácticas con los sistemas de gestión bibliotecaria OpenBiblio y PMB, e informe sobre las funcionalidades de LogicalDoc. Adicionalmente, incluye ensayos sobre la tecnología y su papel en las unidades de información, así como características de usuarios y fondos de referencia en entornos digitales.
Identificacion y organizacion de archivos90070674911
El documento habla sobre la identificación y organización de archivos en sistemas informáticos. Explica que cada archivo debe tener un nombre único dentro de un directorio y que la ruta completa del archivo lo identifica de manera única. Los archivos se organizan en jerarquías de carpetas que permiten organizarlos de manera lógica. También menciona el uso de extensiones en los nombres de archivo para identificar su tipo.
Este documento describe el diseño de un sistema de préstamo de libros para la biblioteca de la Unidad Educativa "El Esfuerzo" en Ecuador. Actualmente, la biblioteca usa un sistema manual para los préstamos que es lento e ineficiente. El nuevo sistema automatizará los procesos de préstamo para mejorar el servicio a los usuarios y permitir un mejor control de los préstamos y registros bibliográficos. El sistema se diseñará usando la metodología de base de datos ACCESS y se implementará una aplicación para gestionar los préstamos de forma electr
Este documento presenta el diseño de un sistema de información para la Biblioteca Departamental Jorge Garcés Borrero utilizando el software SIABUC 9. Describe los módulos de préstamos, inventarios, adquisiciones, análisis y captura de información, así como el diseño de entradas, controles y salidas de información requeridos para cada módulo y el sistema en general. El objetivo es optimizar los servicios de la biblioteca a través de una estructura tecnológica que facilite el acceso a la información para los usu
traducción Comparing Bibliometric Analysis Using PubMed, Scopus, and Web of S...FabianAraya16
El documento compara el análisis bibliométrico utilizando las bases de datos PubMed, Scopus y Web of Science. Realizó una búsqueda de publicaciones de autores jordanos entre 2013-2017 en cada base de datos. Scopus resultó en el mayor número de documentos (11,444), seguida de Web of Science (10,943) y PubMed (4,363). Cada base de datos tiene características diferentes para el análisis bibliométrico y proporciona diferentes servicios y herramientas.
El documento explica los conceptos básicos de las bases de datos, incluyendo su definición, tipos según la variabilidad y contenido, características como datos relacionados e integrados, ventajas como el control de redundancia y consistencia de datos, y términos como campo, registro, carpeta. También describe desventajas como requerir personal calificado e instalación costosa.
Más contenido relacionado
Similar a Control de calidad de cargas bibliográficas
Este documento describe el diseño de un sistema informático para la gestión de recursos continuos en la Biblioteca Nacional de Cuba "José Martí". Actualmente, la biblioteca utiliza software obsoleto que causa problemas como la duplicación de datos e impide el seguimiento de registros. El objetivo es diseñar un nuevo sistema que permita un control más efectivo de los recursos continuos, muestre el historial de cada registro y proporcione información sobre el trabajo de cada especialista. Se utilizó la metodología RUP para guiar el desarrollo e incluir el format
Objeto de conferencia
III Simposio Internacional de Bibliotecas Digitales (San Pablo, Brasil)
En este artículo se presentan las estrategias y particularidades encontradas en el proceso de "harvesting" de información académica realizado sobre diecisiete (17) repositorios de información. Esta iniciativa, llevada a cabo en la Universidad Nacional de La Plata, tiene como objetivo el brindar material de valor académico complementario al de propia producción institucional ya residente en la Biblioteca Digital del Portal SeDiCI. En el trabajo se tratan temáticas tales como: dificultades que el protocolo debería considerar para las posibilidades tecnológicas y de conectividad de nuestros países, dificultades en lo referente a la uniformidad de la información que se encuentra en los diferentes repositorios, tanto como los hallazgos y el potencial aprovechamiento máximo que el protocolo puede brindar para el descubrimiento de nuevas fuentes de información.
Ver registro completo en: http://sedici.unlp.edu.ar/handle/10915/5533
Este documento presenta el diseño de un sistema bibliotecario para mejorar el manejo de información en la biblioteca de la Unidad Educativa El Esfuerzo. Describe la creación de una base de datos en Access con tablas, formularios, informes y consultas. El objetivo es implementar un sistema que facilite el control de libros, materiales y usuarios, reemplazando el sistema manual obsoleto. Se concluye que el nuevo sistema permitirá un mejor manejo y administración de la información de la biblioteca.
Este documento describe las diferentes etapas del proceso de migración de sistemas de automatización de bibliotecas. Explica que la migración implica la transferencia de datos de un sistema a otro y puede involucrar un cambio en el formato de los registros. Luego detalla las principales etapas del proceso como descubrimiento de datos, análisis, limpieza y validación de los datos migrados. El objetivo es dar lineamientos generales sobre cómo llevar a cabo con éxito un proyecto de migración entre sistemas de automatización
Este documento resume los conceptos clave de una base de datos, incluyendo que una base de datos es un conjunto de datos almacenados sistemáticamente para su uso posterior, y describe las ventajas como el control de redundancia y la compartición de datos, así como las desventajas como la complejidad y los costos. También describe los diferentes tipos de campos y relaciones que pueden existir en una base de datos.
Trabajo Final ADSI II - Diseñe de Sistemas de Informaciónharr2662
Este documento presenta el diseño de un sistema de información para la biblioteca Compensar. Se describen tres fases principales: 1) el diseño de salida incluyendo pantallas de consulta, informes y formatos de impresión, 2) el diseño de entrada con pantallas para ingresar material e usuarios, y 3) el diseño de archivo y bases de datos con el objetivo de almacenar y recuperar la información de manera eficiente. El sistema propuesto utiliza el software Winisis para facilitar la gestión y consulta de la información de la biblioteca.
Presentación realizada en los talleres para centros cooperantes de la Biblioteca Virtual en Salud de Colombia en el año 2010, sobre la base de datos LILACS y el aplicativo LILDBI-WEB.
Este documento resume un taller para centros cooperantes sobre el uso de LILACS y LILDBI-WEB. Cubre las funciones de los centros cooperantes, el sistema LILDBI-WEB, el proceso de descripción bibliográfica e indización utilizando DeCS, la certificación de registros, y la alimentación y búsqueda en LILACS. El objetivo es proporcionar actualización sobre la descripción bibliográfica, indización y buenas prácticas para enviar información a LILACS.
Este documento describe el sistema CaMPI, un software libre y de código abierto para la automatización de bibliotecas. Se basa en la integración de tres proyectos existentes - Catalis para catalogación, OpacMarc para el catálogo público, y Open MarcoPolo para circulación y estadísticas. El objetivo es consolidar una comunidad de desarrollo y usuarios alrededor de este sistema. Se detallan sus características, metas, implementación, calidad, reuniones, difusión y guía de instalación.
El documento describe un método para detectar áreas de conocimiento similares entre investigadores ecuatorianos utilizando tecnologías de minería de datos y semánticas. Los autores proponen una arquitectura que une múltiples fuentes bibliográficas para identificar áreas de investigación comunes y redes de colaboración potenciales, mediante el uso de ontologías, vocabularios y tecnologías Linked Data. Adicionalmente, presentan un prototipo para proveer un repositorio centralizado con información bibliográfica y encontrar áreas de conocimiento
Este documento describe el protocolo para que las bibliotecas que no catalogan puedan añadir registros a la base de datos AbsysNet. Explica cómo buscar registros en los catálogos de la Biblioteca Nacional de España y Rebeca y cómo descargar la información en formato MARC para enviarla al Servicio de Bibliotecas, que se encargará de cargar los registros en AbsysNet. También indica los datos necesarios para añadir registros que no se encuentren en otros catálogos.
Este documento describe el desarrollo del Catálogo Virtual de Unión de Libros (CatVirL) de la Red de Bibliotecas del Sureste (REBIS). Explica el proceso de conversión de registros bibliográficos de 10 instituciones a un formato estandarizado y su carga al catálogo en OCLC. También resume los avances realizados y las metas pendientes para mejorar el catálogo y ampliar su cobertura a más instituciones.
Este documento describe una actividad teórico-práctica realizada por una estudiante de bibliotecología. La actividad consiste en varias partes: una investigación sobre software de automatización de bibliotecas, prácticas con los sistemas de gestión bibliotecaria OpenBiblio y PMB, e informe sobre las funcionalidades de LogicalDoc. Adicionalmente, incluye ensayos sobre la tecnología y su papel en las unidades de información, así como características de usuarios y fondos de referencia en entornos digitales.
Identificacion y organizacion de archivos90070674911
El documento habla sobre la identificación y organización de archivos en sistemas informáticos. Explica que cada archivo debe tener un nombre único dentro de un directorio y que la ruta completa del archivo lo identifica de manera única. Los archivos se organizan en jerarquías de carpetas que permiten organizarlos de manera lógica. También menciona el uso de extensiones en los nombres de archivo para identificar su tipo.
Este documento describe el diseño de un sistema de préstamo de libros para la biblioteca de la Unidad Educativa "El Esfuerzo" en Ecuador. Actualmente, la biblioteca usa un sistema manual para los préstamos que es lento e ineficiente. El nuevo sistema automatizará los procesos de préstamo para mejorar el servicio a los usuarios y permitir un mejor control de los préstamos y registros bibliográficos. El sistema se diseñará usando la metodología de base de datos ACCESS y se implementará una aplicación para gestionar los préstamos de forma electr
Este documento presenta el diseño de un sistema de información para la Biblioteca Departamental Jorge Garcés Borrero utilizando el software SIABUC 9. Describe los módulos de préstamos, inventarios, adquisiciones, análisis y captura de información, así como el diseño de entradas, controles y salidas de información requeridos para cada módulo y el sistema en general. El objetivo es optimizar los servicios de la biblioteca a través de una estructura tecnológica que facilite el acceso a la información para los usu
traducción Comparing Bibliometric Analysis Using PubMed, Scopus, and Web of S...FabianAraya16
El documento compara el análisis bibliométrico utilizando las bases de datos PubMed, Scopus y Web of Science. Realizó una búsqueda de publicaciones de autores jordanos entre 2013-2017 en cada base de datos. Scopus resultó en el mayor número de documentos (11,444), seguida de Web of Science (10,943) y PubMed (4,363). Cada base de datos tiene características diferentes para el análisis bibliométrico y proporciona diferentes servicios y herramientas.
El documento explica los conceptos básicos de las bases de datos, incluyendo su definición, tipos según la variabilidad y contenido, características como datos relacionados e integrados, ventajas como el control de redundancia y consistencia de datos, y términos como campo, registro, carpeta. También describe desventajas como requerir personal calificado e instalación costosa.
Similar a Control de calidad de cargas bibliográficas (20)
1. Universidad de Granada
Facultad: Facultad de Comunicación y Documentación
Departamento: Biblioteconomía y Documentación
Nombre: Josefina Vílchez Pardo
Proyecto de investigación
Control de registros bibliográficos
duplicados en las bases de datos
Nombre: José Mario Martín Rivas
Asignatura: Práctica y Memoria
Curso: 3º B
Fecha:04.07.2011
2. ÍNDICE
INTRODUCCIÓN............................................................................. 3
METODOLOGÍA Y OBJETIVOS ......................................................... 3
DESARROLLO ................................................................................. 4
CONCLUSIONES ........................................................................... 13
BIBLIOGRAFÍA ............................................................................ 15
2
3. INTRODUCCIÓN
En la sociedad del conocimiento en la cual hoy estamos inmersos, la información se
ha convertido en un pilar importante para la generación de dicho conocimiento.
Existen diversas fuentes que posibilitan el acceso a la información. Una de ellas son
los catálogos automatizados de las bibliotecas. En ellos se puede encontrar los
distintos fondos bibliográficos de una biblioteca y las localizaciones de sus registros.
Estos catálogos pueden ser propios de una sola biblioteca o pertenecer a un
colectivo de estas. Tanto en un caso como en otro, se esta produciendo un
problema de graves consecuencias. Este es, la duplicidad de registros bibliográficos.
Esta cuestión produce un aumento cuantitativo del catálogo de la biblioteca de una
manera negativa y de forma paralela, un conflicto para la recuperación de
documentos. Las localizaciones de estos documentos se encontrarán dispersas por
distintos registros bibliográficos.
Esta investigación, tratará sobre la identificación de las causas de esta situación.
Además se desarrollará un método de control para minimizarla. He aquí la
importancia a nivel personal y social de esta investigación.
En esta investigación he buscado conexiones con otros trabajos que me ayuden a
desarrollar los datos obtenidos. He utilizado el artículo con título “Evaluación de la
calidad en la automatización de bibliotecas” (1).
Para este estudio, me baso en mi trabajo en la empresa Baratz, donde he trabajado
con distintas cargas de registros bibliográficos de fondo antiguo, para su posterior
carga en el Catálogo Colectivo del Patrimonio Bibliográfico (a partir de ahora CCPB).
En los siguientes puntos se desarrollarán las aplicaciones utilizadas, los errores
identificados y el método de control.
METODOLOGÍA Y OBJETIVOS
1. Aplicaciones y bases de datos
Se han utilizado las siguientes aplicaciones:
3
4. § Sistema de Gestión Bibliotecaria Absys v.7. Los registros bibliográficos que
se han catalogado y que se van a volcar en la base de datos del CCPB, se ha
realizado con el Sistema de Gestión Bibliográfica Absys v.7, en el módulo de
catalogación. La carga contiene 1120 registros bibliográficos, que antes de
ser realizados, han sido buscados en la base de datos de CCPB (cd de abril
de 2010), para comprobar si ya estaban incluidos.
§ Base de datos de CCPB correspondiente a la última actualización mandada
por CCPB de abril de 2010.
§ Servidor con sistema operativo Linux Red HAT AS4, y se trabajará con el
Editor VI de dicho sistema operativo
2. Técnicas
Se cargarán en Linux tanto la carga de registros nuevos realizados con Absys y la
perteneciente a la base de datos de CCPB. Se trabaja en BRS y con la utilización de
un script, se identificarán los registros duplicados entre las dos cargas. Con el
Editor VI, se corregirá los errores detectados.
3. Objetivos
Los objetivos de esta investigación es identificar las distintas causas de la
duplicidad de registros en la base de datos del CCPB producidas por el volcado de
cargas. Así como desarrollar un método que posibilite la detección de estos casos y
su posterior corrección.
DESARROLLO
1. Casuística
Como se ha comentado anteriormente, en este trabajo, se va a relacionar la
investigación con el artículo de título “Evaluación de la calidad en la automatización
de bibliotecas” (1). En este artículo, entre otros datos, se identifican algunas de las
posibles causas de la existencia de duplicados en las bases de datos bibliográficas.
En él se habla de los volcados de información a las bases de datos, como una de las
causas:
“Las nuevas tecnologías que permiten el volcado de grandes cantidades de información con un escaso
proceso de elaboración, conformando bases de datos bibliográficas que pretenden poner en entredicho la
4
5. necesidad y la validez de los sistemas tradicionales de información, basados en un costoso proceso de
análisis documental”
Otra de las causas identificadas, son los distintos métodos de trabajo, como
consecuencia de los cambios de software, la no elaboración de manuales de
procedimientos, señalando las especificaciones a seguir para conseguir un trabajo
unificado, e incluso la falta de preparación de los centros:
“Los cambios en el software documental que derivan en transvases de información, con las consiguientes
perdidas de datos y errónea distribución de información en los campos marc.
La inexistencia de un manual de procedimiento común de introducción de datos en los centros de
información que permitan recoger toda la casuística surgida para obtener la uniformidad en el proceso.
Los numerosos cambios en los métodos de trabajo, que dificultan la homogeneización en los registros.
La inexperiencia de algunos centros así como la escasa preparación de su personal en procesos de
automatización de fondos bibliográficos”
Una causa más, para la baja calidad de las bases de datos bibliográficas, se
produce con la asignación de puntos de acceso:
“Asignar correctamente los términos de acceso:
§ Autores y entidades
§ Títulos
§ Series
§ Materias
§ Control de clasificación
§ Homogeneización entre clasificación y materia”
La mayor parte de estas causas, han sido identificadas en la investigación, en
relación a la base de datos bibliográficos de CCPB. En un principio, este catálogo se
nutría de las bases de datos de las distintas Comunidades Autónomas. Cada una
con un software, especificaciones de procedimiento y métodos de trabajo
diferentes. Así como algunos centros con inexperiencia y escasa formación de su
personal.
Esto produjo, un volcado de información masivo, donde se observan registros
duplicados, con diferentes descripciones, por ejemplo, en relación a puntos de
acceso o a la reunificación de ediciones distintas.
Hay que decir que por parte de CCPB, existe un proceso exhaustivo para la
identificación de estos duplicados y la posterior asociación de sus localizaciones.
5
6. En esta investigación se han detectado, otras razones para este problema, en
relación a las cargas realizadas en los distintos centros:
Ø Omisión de información en los registros de CCPB. Esto genera el
hecho de que las búsquedas no den los resultados esperados y
por tanto se catalogue de nuevo el documento.
Ø Errores de ortografía y gramaticales, tanto en la sentencia de
búsqueda como en los registros de CCPB, produciendo unos
resultados de búsqueda negativos. No son tanto los errores de
ortografía como los errores de transcripción de los caracteres en
latín de obras de siglos XVI al XVIII, donde la utilización de los
caracteres “v” y “i” en detrimento de la “u” y “j”, producen graves
problemas.
Ø Los plazos de entrega para el volcado de las cargas, demasiado
largos, y que producen que registros ya catalogados, pero aún no
visibles en el catálogo, sean de nuevo descritos.
2. Proceso de detección de duplicados
Este proceso se ha desarrollado para la detección de los registros duplicados y su
posterior corrección, previo a su volcado en la base de datos de CCPB.
Consta de varias fases:
§ Fase 1: se cargan los registros bibliográficos, tanto los realizados con el
Absys 7 y los pertenecientes al CCPB, en el servidor con el sistema operativo
Linux. A partir de este momento todo el trabajo se realizará en este entorno,
con la posterior utilización del gestor documental BRS y del Editor VI.
ABSYS7_CCPB>brsload prue -create -file rae_SD -force -ver
Start of BRS Load Process for PRUE -- Thu Jun 30 10:01:17 2011
Input file is rae_SD
BRS Load Process -- Loading All Documents
************************************************** 50
************************************************** 100
************************************************** 150
************************************************** 200
************************************************** 250
************************************************** 300
************************************************** 350
************************************************** 400
************************************************** 450
************************************************** 500
************************************************** 550
************************************************** 600
6
7. ************************************************** 650
************************************************** 700
************************************************** 750
************************************************** 800
************************************************** 850
************************************************** 900
************************************************** 950
************************************************** 1000
************************************************** 1050
************************************************** 1100
*************************
Text Update Step Statistics:
Documents: Added 1125, Dropped 0, Total in DB 1125
Words: Added 105593, Dropped 0, Stopped 0
Values: Added 5260, Dropped 0, Abbreviations 1820
Amount of Input Processed: 51670 lines
Space left by deleted documents: 0 bytes
Unchanged words dropped from sort process: 0
§ Fase 2: se desarrolla un script 1, el cual ejecutará diversas acciones:
Ø De cada una de las cargas, tomará la primera línea del campo
marc 245.
Ø Eliminará todos los signos de puntuaciones ortográficos y las
mayúsculas.
Ø Realiza una comparativa de caracteres entre las dos cargas e
identifica aquellos que contiene la misma cadena de
caracteres
Ø El resultado será un fichero, el cual contiene los títulos
duplicados y el número de repeticiones
El resultado de este fichero en la muestra utilizada en esta investigación, es
de 125 títulos (10,42 %) con un máximo de tres repeticiones.
-rw-rw-r-- 1 absys absys 1258 may 29 15:45 t245_dup
ABSYS7_CCPB>vi t245_dup
2 a los electores del distrito de los martires
2 asturianadas por bulerias que se va el vapor cantadas por
2 bonito tango de cadiz titulado los gallos dedicado al derribo de las
2 bulla de indulgencia plenaria concedida para las animas de los fieles
3 coleccion de canciones modernas
2 el cantor de las hermosas trovas de amor dedicadas al bello sexo
3 juana la valerosa hechos memorables y atrocidades que cometio esta
2 la tia girula chiste moderno acaecido en el pueblo de almeria con
2 lista de los abogados del llustre colegio de la audiencia de caceres
2 lista de los numeros y doncellas para la extraccion de la real loteria
2 minuete sacramental para gozo del alma y diversion del cuerpo de los
2 noticia de las obras pertenecientes a la direccion de trabajos hidrograficos
2 primera y segunda parte del testamento que ordeno el serenisimo señor
1
Este script es solo uno de los utilizados en el control de calidad por parte de Baratz. A pesar de ser
desarrollados para esta investigación, la propiedad de estos es de la empresa, y por tanto su contenido
no puede ser mostrado.
7
8. 2 soneto
2 trujillo a su excelsa patrona la virgen de la victoria en sus fiestas
5 villancicos que se han de cantar en la santa iglesia cathedral de la
2 villancicos que se han de cantar en la sta iglesia cathedral de la
2 Comedia famosa. El legitimo bastardo
2 Diui Antonini Archiepiscopi florentini
2 I Fantasmi
~
………………………. (hasta 125 títulos)
§ Fase 3: en esta fase se utilizará tanto el BRS como el Editor VI. Con el
fichero de títulos duplicados, se hará la búsqueda de estos títulos en las dos
cargas y se comparará las descripciones bibliográficas. En el caso afirmativo
de ser un duplicado, el registro bibliográfico de la carga de Absys, será
eliminado y su localización, ósea su campo marc 852, pasará a ser un fondo
bibliográfico que estará asociado a un registro de CCPB. En caso negativo el
registro quedará igual.
El resultado final del fichero de duplicados, que contiene 125 títulos, después
de trabajar en esta última fase es el siguiente:
1. 57 registros bibliográficos son duplicados (45,5%), por tanto pasan a ser
fondos bibliográficos.
Ejemplo:
Villancicos que se han de cantar en la santa iglesia catedral
Registro de ccpb:
8
9. Registro de absys:
León Marchante, Manuel de
Villancicos que se han de cantar en la Santa Iglesia Magistral de S. Iusto y Pastor de Alcalá de
Henares la noche de Navidad deste año de 1674. -- [S.l. : s.n.], 1674
8 p. ; 4º
Segun Catalina, nº 1212, el autor es Manuel de León Marchante y figuran en el tomo II de sus
"Poesias". Lo cita como impresor en Alcalá de Henares
Sign.: A4
Texto a dos col.
1. Villancicos españoles--S. XVII.
MISMO TÍTULO /
MISMO AUTOR /
IGUAL EDICIÓN
REGISTRO
DUPLICADO TRANSFORMACIÓN
A REGISTRO DE
FONDO
2. 7 registros bibliográficos no son duplicados (8,75%). Estos presentan el
mismo título, pero pertenecían a autores diferentes. Se mantienen como
registros bibliográficos.
Ejemplo:
Comedia famosa. El legitimo bastardo / de ... Christoval de Morales
Valencia : en la imprenta de la Viuda de Joseph de Orga, 1764
Comedia famosa. El legitimo bastardo / de don Agustin Moreto
Barcelona : por Juan Serra y : Nadal, [s.a.]
9
10. MISMO TÍTULO /
DISTINTAS
EDICIONES
REGISTRO
NO MANTENIMIENTO
DUPLICADO REGISTRO
BIBLIOGRÁFICO
3. 15 registros bibliográficos no son duplicados (18,75%). Estos presentan
el mismo título, pero son obras por volúmenes y con años de publicación
diferentes. Se mantendrán como registros bibliográficos.
Ejemplo:
Diui Antonini Archiepiscopi florentini ... Chronicorum secunda pars : quae a diuo Syluestro Port. Max.
vsque ad Innocentium III ... res toto fere orbe gestas, & vitas ... Sanctorum ... doctorumque maxime
celebrium dicta praeclara complectitur
Lugduni : ex officina Iuntarum et Pauli Guittii, 1586
Diui Antonini Archiepiscopi florentini ... Chronicorum tertia pars : quae ab Innocentio III. Pont. Max. vsque
ad Pium II ... res toto fere orbe gestas exponit ; adiectis etiam aliquot doctorum catholicorum sententiis ...
totius iuris Canonici capitibus, necnon & quorundam Sanctorum ...
Lugduni : ex officina Iuntarum et Pauli Guittii, 1587
MISMO TÍTULO /
DISTINTOS
VOLUMENES
REGISTRO
NO MANTENIMIENTO
DUPLICADO REGISTRO
BIBLIOGRÁFICO
10
11. 4. 46 registros bibliográficos no son duplicados (36,8%). Aunque presentan
el mismo título, son ediciones diferentes. Se mantienen como registros
bibliográficos.
Ejemplo:
I Fantasmi / comedia del S. Hercole Bentiuoglio
In Vinegia : appresso Gabriel Giolito de Ferrari, 1544
I Fantasmi, comedia del S. Hercole Bentivoglio
Vinegia : appresso Gabriel Giolito de Ferrari, 1547
MISMO TÍTULO /
DISTINTAS
EDICIONES
REGISTRO
NO MANTENIMIENTO
DUPLICADO REGISTRO
BIBLIOGRÁFICO
Como último paso de esta investigación, se ha realizado una prueba de control para
evaluar la validez del proceso. Esta consiste en la búsqueda de los registros
bibliográficos de Absys que no están presentes en el fichero de duplicados, un total
de 995 registros, en la base de datos de CCPB. El resultado es el siguiente:
5. 3 registros bibliográficos (0,9%). Aunque presentan el mismo título, son
ediciones diferentes. Se mantienen como registros bibliográficos.
La no localización de estos registros por parte del proceso de control, se debe a la
presencia de errores ortográficos en los títulos de la base de datos de CCPB.
11
12. Gráfico del proceso de detección de duplicados:
CARGA DE ABSYS BASE DE DATOS
DE CCPB
F
A
S
E
LINUX
1
F
SCRIP A
S
E
FICHERO CON TÍTULOS 2
DUPLICADOS
BUSQUEDA DE TÍTULOS
CARGA DE BASE DE
ABSYS DATOS DE
CCPB F
A
S
E
COMPARATIVA DE
3
REGISTROS
SI NO
SE PASA LA SE MANTIENE COMO
LOCALIZACIÓN (852) A REGISTRO BIBLIOGRÁFICO
FONDO BIBLIOGRÁFICO
12
13. CONCLUSIONES
La calidad de las bases de datos lleva consigo un aumento de la calidad de los
distintos procesos que la conforman. El resultado de este avance en la calidad, es la
mejora del sistema de información y por tanto del servicio que se les da a los
usuarios.
En esta investigación, nos hemos centrado en unos de sus puntos más importantes,
como son los registros bibliográficos duplicados y las distintas causas que los
producen.
Pienso que hay soluciones previas al comienzo de cualquier proyecto de
catalogación, que ayudaría a disminuir esta situación. Estas serían:
§ Utilización de un mismo software.
§ Mayor implicación de las personas pertenecientes al proyecto.
§ Elaboración de un manual de especificaciones que contengan todas las
casuísticas que se pueden dar en un proyecto de esta envergadura.
§ Elección de los distintos puntos de acceso.
§ Depuración de registros duplicados en la base de datos de origen.
13
14. MISMO MAYOR
SOFTWARE IMPLICACIÓN
DEL PERSONAL
DEPURACIÓN
REGISTROS
DUPLICADOS MANUAL DE
PROCEDIMIEN
TO
ELECCIÓN
PUNTOS DE
ACCESO
Además de estas soluciones, los procesos de control de calidad en cualquier
proyecto, es unos de los puntos más importantes para su buena finalización. Por
tanto creo, que el proceso que he desarrollado, basándome en los resultados
obtenidos, tiene una gran validez para la detección y corrección de este tipo de
situaciones.
Pienso que con este tipo de proceso, se elimina la posibilidad de aumentar los
registros duplicados en una base de datos. Con un tipo de control como el
desarrollado, la calidad de la base de datos aumenta.
La solución para un futuro próximo, podría ser la utilización de un software para la
catalogación vía web. Este tipo de solución, trae consigo multitud de ventajas:
§ Trabajar sobre una base de datos actualizada.
§ Posibilidad de la conexión de múltiples usuarios.
§ La realización de registros duplicados sería en porcentajes mínimos.
§ La localizaciones se asociarían en el momento
§ Base de datos de autoridades y encabezamientos de materia unificada.
14
15. En conclusión, todos los esfuerzo que se realicen para la mejora de los catálogos,
revierten en una mayor calidad en el acceso a la información y por tanto en un
mejor servicio para el usuario.
BIBLIOGRAFÍA
1. CEREZO LÓPEZ, Eva María, ALONSO CERVERO, Beatriz y GÓMEZ
PÉREZ, Ana María. “Evaluación de la calidad en la automatización de
bibliotecas” [artículo en línea]. El profesional de la información, vol. 11, nº
2, marzo-abril 2002. [Fecha de consulta: 30/06/11]
http://www.elprofesionaldelainformacion.com/contenidos/2002/marzo/7.pdf
15