proyecto de mayo inicial 5 añitos aprender es bueno para tu niño
El futuro del formato Marc como estructura para el intercambio de datos bibliograficos
1. El futuro del formato MARC como estructura para el intercambio de datos
bibliográficos
por
Estela Chahbenderian
estela@udesa.edu.ar
Universidad de San Andrés
Vito Dumas 284
Victoria, Pcia. de Buenos Aires
Argentina
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 1
2. El futuro del formato MARC como estructura para el intercambio de datos bibliográficos
por Estela Chahbenderian
Resumen
Se presentan las características del formato MARC, el actual entorno del control bibliográfico y su
relación con el formato y las posibilidades de desarrollo de MARC en XML junto con otros
proyectos de estructuras para intercambio de datos bibliográficos. Se concluye que el formato
MARC seguirá prevaleciendo como estándar para los recursos que se quieran preservar,
adaptándose al nuevo modelo bibliográfico y los adelantos tecnológicos.
Introducción
Cuando el formato MARC fue creado en la década del sesenta con el fin de automatizar la
generación de fichas para catálogos manuales, el universo bibliográfico estaba regido por recursos
textuales impresos, no existían catálogos en línea ni la posibilidad de intercambiar registros
bibliográficos. Sin embargo, sus creadores, en Library of Congress, supieron anticipar muchas de
las futuras demandas que generaría la irrupción masiva de las computadoras y los sistemas de
comunicación en línea. En estos cuarenta años y con más de un billón de registros MARC
existentes a nivel internacional, el formato ha demostrado ser eficiente no sólo como estructura
para comunicación e intercambio de datos sino también en la recuperación de información, tanto
simple como compleja, en la disminución de costos de catalogación por la posibilidad de compartir
registros y en la automatización integral de todo tipo de bibliotecas. Los distintos avances
tecnológicos si bien generaron la modificación de algunos aspectos del formato no disminuyeron ni
su eficacia ni su estabilidad como estándar, por lo cual MARC continúa predominando con
probado éxito en la comunidad bibliotecaria.
Fiander y Campbell (2003) destacan que la expansión del universo bibliográfico durante
los últimos diez años con el auge de Internet y los sistemas de información, basados en la Web,
creados y utilizados por otras comunidades (gobiernos, empresas, organizaciones, etc.) presentan
un nuevo desafío para los bibliotecarios. Por un lado, estos sectores ajenos a la bibliotecología
comenzaron a reinventar la rueda al intentar organizar los recursos electrónicos, invirtiendo
grandes esfuerzos humanos y financieros en crear estándares para descripciones bibliográficas
(las cuales han pasado a llamarse metadatos) y ontologías (existiendo desde siempre los
vocabularios controlados). Por otro lado, el catálogo de la biblioteca, siendo una herramienta
sumamente detallista, eficiente, precisa, y por lo tanto valiosa, ha quedado aislada por tener una
estructura no compatible con la semántica de la Web.
Los estándares de metadatos de las demás comunidades se han basado en su mayor
parte en la tecnología XML (Extensible Markup Language), lenguaje que permite la
interoperabilidad con Internet y entre distintos formatos. En cambio la estructura ISO 2709 de los
registros en el formato MARC 21 hace que no puedan ser recuperados por los buscadores de la
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 2
3. Web y que se necesite un software especial para manipularlos (sistemas desarrollados
especialmente para bibliotecas y que no han tenido mucha difusión en otros ámbitos). Por estos
motivos se ha comenzado a cuestionar la permanencia de MARC como formato para intercambio
de datos bibliográficos ya que cada vez es mayor la necesidad de integrarse a Internet e
interactuar con las demás comunidades generadoras de metadatos. Sin embargo, el formato tiene
los suficientes aspectos positivos para asegurar su permanencia como estándar si se lo adapta al
actual universo bibliográfico y las posibilidades que brinda la tecnología.
En el presente trabajo se presentan brevemente las principales características de MARC,
para luego puntualizar el contexto actual del control bibliográfico y su relación con el formato,
seguido de algunos desarrollos de MARC para el futuro en XML.
MARC21 y sus principales características
Los formatos MARC 21 son estándares para la comunicación e intercambio de datos
bibliográficos, y de información relacionada, en un entorno automatizado.
Los formatos son cinco de acuerdo al tipo de datos que contienen: bibliográfico, de
autoridades, de fondos o existencias, de clasificación y de información de la comunidad.
McCallum (2000) destaca que en realidad MARC es un nombre genérico de un conjunto
de componentes que se reúnen al crear registros bibliográficos. Estos componentes son tres: la
estructura informática del registro; la designación del contenido (“markup”) y el contenido mismo.
Estos tres elementos deben considerarse por separado cuando se trata de analizar su adecuación
a los recursos electrónicos y su flexibilidad para futuros cambios, ya que tienen posibilidades
distintas.
a) Estructura del registro: está dada por normas externas al formato: la implementación
de la norma nacional de Estados Unidos ANSI Z39.21
y su contraparte internacional
ISO 27092
las cuales establecen que un registro debe tener una cabecera (leader), un
directorio, campos de datos y un código de finalización del registro. Esta estructura ha
permanecido estable por décadas permitiendo la proliferación de sistemas y servicios
relacionados al intercambio y transferencia de registros.
b) Designación del contenido: son los campos, subcampos e indicadores definidos para
el formato.
c) Contenido: se rige por estándares externos al formato: ISBDs, AACR2,
Encabezamientos de materia de Library of Congress, tesauros, Clasificación de
Library of Congress, Clasificación Decimal de Dewey, otros sistemas de clasificación,
registros de autoridades, otros estándares oficiales como ISBN, ISSN.
Radebaugh (2003) destaca el alcance internacional de MARC, ya que alberga la mayor
cantidad de registros bibliográficos y su documentación ha sido traducida a más de nueve idiomas.
El formato se ha ido adaptando a través de los años para considerar las descripciones no sólo de
1
Information Interchange Format.
2
Format for Information Exchange.
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 3
4. libros, revistas, arte, música, objetos, CD-ROMs, etc. sino también, en los últimos años, las
páginas Web, entre otros recursos electrónicos. En 1993, se creó el campo 856 para brindar
acceso a los documentos en Internet desde el mismo registro y recientemente se agregó el
subcampo “$u” a distintos campos tanto del formato bibliográfico como de autoridades para
permitir vínculos hipertextuales a tablas de contenido, bibliografías, reseñas, etc.
MARC 21 surge en 1997, de la armonización de USMARC y Canadian MARC, y toma su
nombre como una referencia al siglo XXI.
Su revisión constante está a cargo de las agencias nacionales de Estados Unidos
(Network Development and MARC Standards Office, Library of Congress) y de Canadá
(Standards Division, Library and Archives Canada). A través de MARC Forum, una lista de
discusión electrónica coordinada por Library of Congress, los usuarios de todo el mundo pueden
hacer llegar sus comentarios y aportes. Dos veces al año se realizan reuniones abiertas donde se
discuten éstas y otras propuestas en el marco de los encuentros organizados por Machine-
Readable Bibliographic Information (MARBI) Committee, ALA, en Estados Unidos y Canadian
Committee on MARC (CCM), en Canadá (MARC development: overview, 2007).
Fortalezas de MARC 21:
- Amplia difusión geográfica, gran aceptación a nivel internacional
- Gran reservorio de registros bibliográficos creados y almacenados por las bibliotecas que
lo utilizan y sistemas cooperativos a nivel mundial.
- Adecuado para describir todo tipo de materiales, incluidos recursos electrónicos.
- Alto nivel de detalle y profundidad.
- Permanencia y estabilidad, requisito muy importante para un estándar.
- Adaptación a los diversos cambios que se han producido desde que se creó el formato.
Debilidades de MARC 21:
- Fuerte dependencia a datos textuales, su división en campos y subcampos tolera
relativamente poca especificidad en la identificación de elementos. Las reseñas, imágenes
y sonidos que podrían agregarse para enriquecer un registro no pueden intercambiarse en
forma estandarizada (Andresen, 2004)
- Falta de flexibilidad, como fue diseñado para fichas impresas no refleja la interacción entre
diferentes sistemas, ciertas modificaciones locales dificultan el intercambio entre un
sistema particular y el cooperativo (Andresen, 2004)
- Limitado para manejar grandes cantidades de datos. Si bien no hay un límite fijo para el
volumen de información, las visualizaciones suelen verse extrañas o truncadas en los
registros que se agregan muchos datos (Andresen, 2004)
- Limitado para relacionar datos entre registros (Andresen, 2004)
- Como estándar específico para bibliotecas es complejo para intercambiar datos con otras
comunidades (Andresen, 2004).
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 4
5. - Alto nivel de detalle y profundidad. McCallum (2006) destaca que el detalle es tanto la
fortaleza como la debilidad de MARC, ya que existen varios campos que rara vez se usan
por la mayoría de las bibliotecas.
Yee (2004) considera que muchas de las críticas realizadas al formato no son adecuadas ya
que responden a problemas ajenos al mismo. Para clarificar lo que corresponde considerar como
limitaciones propias de MARC, establece cuatro categorías de problemas:
1. Problemas que no son debidos a MARC 21 sino a las reglas y prácticas que determinan
su contenido:
Se le ha criticado al formato un énfasis desmedido en la descripción (existiendo en la
actualidad la posibilidad de acceder al texto completo de los documentos), el uso de la entrada
principal y de puntos de acceso controlados por registros de autoridad, etc. Estos problemas si
bien dependen de las reglas y deben ser resueltos a ese nivel, deben ser considerados con
mucho cuidado. Sigue siendo necesario y valioso el uso de vocabularios controlados, puntos
de acceso consistentes y la entrada principal como identificador de una obra para poder
demostrar las relaciones entre obras, expresiones y manifestaciones.
También se le critica al formato que sea lineal y no jerárquico, pero las prácticas actuales
de catalogación cooperativa hacen necesario que se individualice cada registro de una
manifestación para poder compartirlo con otros sistemas. El contenido de MARC 21 es
jerárquico, el problema no es el formato sino la poca utilización de los datos jerárquicos por
parte de los proveedores de software.
2. Problemas que en realidad no son problemas:
Se acusa al formato de ser complejo, sin embargo cada vez es más necesario codificar los
datos diferenciando sus funciones, algo previsto en MARC en diferentes instancias. El formato
es complejo porque sirve a diferentes tipos de bibliotecas, para una biblioteca escolar puede
ser excesivamente detallado mientras que para una biblioteca especializada puede ser poco
granular. La mayor parte de la complejidad de MARC 21 es opcional, cada biblioteca puede
elegir cuántos campos y subcampos usar.
En cuanto a la redundancia, una crítica frecuente al formato, no se considera lo valioso
que es tener un mismo dato en forma codificada, transcripta y normalizada. La forma
codificada permite que el dato se utilice rápidamente en un proceso por lote de millones de
registros; la forma transcripta permite tener la evidencia de cómo varían los nombres de los
autores, los títulos de las obras, etc. para poder identificar históricamente las expresiones y
manifestaciones y decidir la forma de los puntos de acceso; la forma normalizada, por último,
facilita la función de reunión (collocation) de todas las obras de un autor, todas las expresiones
de una obra y todas las obras sobre un tema. A su vez tener el dato estandarizado y
precoordinado como encabezamiento de enlace a otras expresiones, ayuda a establecer las
relaciones con otras entidades (ejemplo: el título uniforme con el subcampo de idioma para las
distintas traducciones). Si MARC no fuera redundante en estas formas, el catálogo no sería
tan efectivo logrando mayor acierto y precisión que los buscadores en la Web.
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 5
6. De la misma forma, la crítica de falta de flexibilidad es desacertada, si el formato
permitiera modificaciones de forma tal que dos catalogadores obtendrían registros muy
diferentes del mismo recurso, se generaría el mismo caos que existe en Internet.
En cuanto a la secuencia de sus campos, se ha criticado que su orden es confuso con
respecto a la descripción y los puntos de acceso y que responde a la era previa de las fichas
impresas. Sin embargo el actual ordenamiento no es obsoleto, tiene el efecto de presentar la
descripción de forma tal que primero se identifica la obra (1XX y 2XX), luego la expresión
manifestación (del 2XX al 5XX), seguidos de los campos que diferencian una
expresión/manifestación de otra (entradas secundarias de editor, traductor, etc.)
3. Problemas relacionados con el actual entorno de catalogación cooperativa:
Los mayores problemas de los catálogos cooperativos son mantener los registros
provenientes de diferentes catálogos bajo control de autoridades y la gestión de las múltiples
versiones (para el usuario no es sencillo diferenciar las manifestaciones de una misma obra que a
veces tienen diferencias mínimas, como por ejemplo la distribución). La comunidad bibliotecaria
deberá resolver estos temas no desde el cambio de formato sino desde una modificación de las
prácticas cooperativas y de los servicios bibliográficos. Si se decide por un modelo donde se
aporta un registro bibliográfico basado en la expresión y se agregan las diferentes manifestaciones
en el registro MARC de existencias, habrá que modificar el formato bibliográfico para que los datos
correspondan sólo a la expresión.
4. Problemas a solucionar de MARC 21:
Esta es la única categoría que corresponde propiamente al formato y que conforma la lista de
sus futuros desarrollos:
- Establecer un método que permita cambiar las formas preferidas de los encabezamientos
(por idioma, por ejemplo). Si bien este cambio depende de que se modifiquen las reglas
de contenido, la estructura del formato debe rediseñarse para sostener las diferentes
formas preferidas de los puntos de acceso.
- Asegurar mejor acceso a los datos actualmente codificados en los campos fijos. Incluir los
datos que actualmente se encuentran en los campos 006, 007 y 008 en otras partes del
registro bibliográfico y de existencias para que pueda accederse fácilmente no sólo por los
bibliotecarios sino también por los usuarios. Este desarrollo dependerá más de los
proveedores de sistemas.
- Asegurar la adecuada designación de contenidos que permita una recuperación calificada
de encabezamientos en los OPACs de las instituciones que así lo deseen. Se debería
poder codificar calificadores en los encabezamientos para facilitar la visualización de los
resultados de búsqueda.
- Diferenciar los nombres propios de otros encabezamientos temáticos. Actualmente hay
encabezamientos temáticos que son nombres propios (personajes ficticios, grupos
étnicos, sistemas de computación, etc.), la creación de un nuevo campo en los 6XX y 7XX
ayudaría a no confundir a los usuarios.
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 6
7. - Establecer un campo para que el catalogador incluya la información que ha reunido sobre
la expresión de una obra y que no corresponde a la descripción bibliográfica.
- Crear un subcampo para diferenciar el nombre del apellido, de esta forma las búsquedas
serán más precisas.
- Asegurar que la puntuación de las ISBD esté incluida lo más posible en el formato para
que no tenga que ser escrita por el catalogador.
- Agregar códigos para el método de distribución (importante para películas, programas de
televisión, recursos en Internet, etc.).
- Añadir designadores de contenido para que se puedan diferenciar las clasificaciones que
cumplen el rol de dispositivo para el estante y aquellas que sólo se incluyen para la
búsqueda temática en la computadora.
Perspectivas del control bibliográfico y su relación con MARC
El entorno tecnológico ha cambiado radicalmente con respecto al que prevalecía cuando
fueron creados los estándares para el control bibliográfico. Es por eso que actualmente se plantea
una buena oportunidad para reconsiderar las mismas bases de las prácticas catalográficas,
corregir errores y beneficiarse con las ventajas que brinda la informática.
FRBR:
El modelo conceptual desarrollado por IFLA en 1998 “Requisitos funcionales para registros
bibliográficos” (FRBR, su sigla en inglés3
) propuso un nueva visión de la estructura del universo
bibliográfico y de las relaciones entre registros. Andresen (2004) destaca que el formato MARC
deberá permitir que los registros contengan información suficiente y precisa que permita identificar
los cuatro niveles establecidos por los FRBR para un recurso: obra, expresión, manifestación e
ítem. De esta forma se podrá facilitar la distinción calificada de estos aspectos en el conjunto de
resultados de una búsqueda.
La Network Development and MARC Standards Office en Library of Congress, ha estado
trabajando desde el 2001 para analizar el formato desde la visión de los FRBR. Existen ya
estudios hechos para el mapeo de los datos de MARC a FRBR; para la visualización en forma
jerárquica de múltiples manifestaciones de una misma obra y la agrupación de obras relacionadas
a nivel de expresión desde datos codificados en MARC 21; como así también estudios para
posibles adaptaciones del formato a estas recomendaciones (repetibilidad de los campos, uso del
campo 008 en lo que concierne a valores relacionados con manifestaciones, etc.)4
.
Para esta compleja red de relaciones entre recursos, Riva (2004) considera los campos de
enlace de MARC 21 (76X-78X) y establece un mapeo bidireccional de esos campos al modelo
3
IFLA Study Group on the Functional Requirements for Bibliographic Records (1998). Functional
requirements for bibliographic records : final report. Recuperado Septiembre 21, 2007, de
http://www.ifla.org/VII/s13/frbr/frbr.pdf
4
Displays for Multiple Versions from MARC 21 and FRBR (2007). Recuperado Junio 28, 2007, de
http://www.loc.gov/marc/marc-functional-analysis/multiple-versions.html
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 7
8. FRBR y a la taxonomía de las relaciones bibliográficas establecida por Tillett (equivalencia,
derivativa, descriptiva, todo-parte, complementaria, secuencial y con características compartidas)
con un agregado de Smiraglia que subdivide la relación derivativa en siete subclases. La precisión
con que responda el formato a estas distinciones entre relaciones determinará el futuro desarrollo
de MARC en estos aspectos. Algunos campos de enlace, como el 775 (otras ediciones) arrojan
resultados ambiguos en el mapeo ya que corresponde a más de un tipo de relación. Por otro lado,
los sistemas automatizados deberán permitir la visualización clara de estas relaciones y efectuar
con facilidad el vínculo de un registro a otro.
El modelo FRBR se tomó como base para revisar y adaptar los principios de París5
, y
también para desarrollar el nuevo código de catalogación que reemplazará en el 2008 a las
AACR2. Siendo MARC la estructura informática cuyo contenido son las reglas de catalogación
deberá adaptarse para reflejar estos futuros cambios.
Metadatos:
En la última década, dentro y fuera de la comunidad bibliotecaria, se ha introducido el
término “metadatos” para la información descriptiva de los recursos electrónicos, especialmente
los que se encuentran en Internet. Si bien el concepto incluye datos bibliográficos (catalogación y
clasificación) va más allá abarcando texto, imágenes, música y hasta el objeto mismo de la
descripción que se encuentra incluido en el registro (El-Sherbini, 2001).
Ante la gran cantidad de recursos electrónicos, distintos sectores necesitados en organizar
la información comenzaron a producir proyectos de creación de metadatos con las siguientes
características: descripciones más sencillas de las que realizan las bibliotecas y que se generen,
en lo posible, en forma automatizada desde el documento o sean aportadas por el mismo autor o
editor del recurso. En Update on major metadata standards (2005) se citan algunos ejemplos de
estas iniciativas: Dublin Core Metadata Initiative (DC); Online Information eXchange (ONIX), para
el sector de la industria editorial; Text Encoding Initiative (TEI) para textos literarios; VRA Core
(Visual Resources Association) para objetos culturales; Learning Object Metadata Standard
(LOMS) para objetos de aprendizaje (colecciones digitales producidas para el aprendizaje a
distancia); Open Archives Initiative (OAI) y su Protocol for Metadata Harvesting (OAI-PMH) para
colecciones digitales; Content Standards for Digital Geospatial Metadata (CSDGM) para datos
geoespaciales; Music Encoding Initiative (MEI) para información musical; Encoded Archival
Description (EAD) para archivos; Open Digital Rights Language (ODRL) Initiative que junto con
Dublin Core han creado ODRL/DCMI para metadatos de derechos de autor; y para datos de
preservación: Preservation Metadata Implementation Strategies (PREMIS), DigiCULT
(desarrollado en Europa), NISO standard Z39.87 Technical Metadata for Digital Still Images (para
imágenes fijas) y Moving Image Collections (MIC) metadata schema (para películas, etc.).
Gorman (2006) cuestiona que los metadatos, así entendidos, sean la respuesta para el
control bibliográfico de los recursos electrónicos. Creados como una “tercera vía” entre la
5
La revisión es llevada a cabo desde 2003 por la Sección de Catalogación de la IFLA a través de una serie de
reuniones regionales.
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 8
9. catalogación completa (costosa en tiempo y recursos) y la facilidad y economía de los motores de
búsqueda (basados en las palabras claves de los textos completos) parten en realidad de falsos
supuestos. El primer mal entendido es que los estándares bibliotecarios, entre ellos MARC, no
pueden aplicarse a los recursos electrónicos, cuando las distintas adaptaciones realizadas a las
reglas y al formato demostraron que pueden usarse eficientemente. El segundo falso supuesto es
que los estándares creados por los bibliotecarios son demasiado difíciles y por lo tanto muy
costosos. La complejidad así planteada parece responder a un capricho de la profesión, cuando
en realidad el formato MARC y las AACR2 son difíciles porque el mundo documental es
sumamente complejo. Cada subcampo, indicador, cada elemento mínimo de la descripción
responde a una necesidad de la realidad. El registro de la creación humana no puede reducirse a
quince elementos (como se planteó originalmente con el formato Dublin Core). Los metadatos han
producido una verdadera Torre de Babel de estándares donde el resultado no augura la
especificidad y la coherencia logradas por los principios, reglas y formatos creados por las
bibliotecas.
MARC fue cuestionado en la primera etapa de generación de metadatos para luego ser
reconsiderado como el formato del que no se puede prescindir para los recursos bibliográficos que
se quieran preservar. Tennant (2004), luego de proclamar dramáticamente en el 2002 que MARC
debía morir6
, reconoce dos años después que lo que debe morir no es el formato sino su
exclusividad. Para responder a las exigencias actuales, propone crear una infraestructura de
metadatos bibliográficos, un sistema que permita ingresar, manipular y recuperar datos de
distintos formatos (MARC, Dublin Core, ONIX, etc.) posiblemente en la estructura XML, con
cruzamientos, mapeos y algoritmos que permitan trasladar los metadatos de un sistema a otro,
según las necesidades de los distintos tipos de usuario. Esta infraestructura de metadatos
bibliográficos deberá ser: versátil (capaz de manipular datos de fuentes y objetos variados),
extensible (que permita al usuario elegir el paquete de metadatos que mejor le convengan), abierto
y transparente (de código abierto y sin restricciones), de bajo umbral y alto tope (que se adapte a
usos más simples y soporte requisitos más complejos), cooperativo (en el proceso de creación y
mantenimiento de metadatos), modular (los elementos individuales deben poder ser reemplazados
sin que se perjudique la totalidad), jerárquico (capaz de organizar la información en forma
jerárquica), granular (que cada elemento de la descripción pueda ser manipulado y recuperado) y
por último, elegante en el fracaso (ofrecer alternativas cuando la recuperación es nula).
En el actual panorama del control bibliográfico, el desafío de la comunidad bibliotecaria es
seguir sosteniendo sus principios, revisando y adaptando sus estándares, entre ellos el formato
MARC, para que mantengan la alta calidad y la eficiencia que los caracteriza.
6
Tennant, R. (2002). MARC must die. Recuperado Septiembre 24, 2007, de
http://www.libraryjournal.com/article/CA250046.html
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 9
10. El futuro del formato MARC en el entorno XML
El desarrollo del formato con una estructura semántica diferente es llevado a cabo por
varias organizaciones, de las cuales Library of Congress se destaca como principal responsable.
Algunos de estos desarrollos son:
MARC DTD (MARC Document Type Definition):
Se trata de una aplicación en SGML (Standard Generalized Markup Language), un
metalenguaje que surge hace ya tres décadas en la industria editorial para intercambiar textos
entre sistemas. SGML brinda un esquema para describir la estructura lógica de los documentos,
una gramática y un método para identificar distintos elementos de un texto y codificar sus
relaciones jerárquicas. De esta manera cada elemento marcado se transforma en un objeto que
puede ser almacenado, recuperado, revisado, borrado, etc. en forma aislada. SGML aporta
además reglas para describir tipos específicos de documentos llamados Document Type Definition
y conocidos como DTDs (Cleveland, 1998).
Library of Congress ha desarrollado un DTD para MARC en 1995 con el objetivo de convertir
datos bibliográficos desde MARC (ISO 2709) a la estructura SGML (aprobado como estándar
internacional, ISO 8879) y viceversa, sin pérdida de información. Entre 1995 y 1996 desarrolló los
DTDs correspondientes a los cinco formatos MARC, y entre 1997 y 1998, las utilidades del
software que realicen la conversión entre los dos estándares. Los cinco formatos MARC fueron
definidos en dos DTDs: MARC format for bibliographic data (que incluye datos del formato MARC
bibliográfico, de fondos o existencias y de información de la comunidad) y el MARC format for
authority data, que incluye elementos del formato de autoridades y el de clasificación (MARC
DTDs Document Type Definitions: background and development, 2007).
MARC XML:
Andresen (2004) señala que originalmente XML fue diseñado para la edición de textos
electrónicos a gran escala pero cada vez fue tomando un rol más importante en el intercambio de
datos de todo tipo en la Web. Fue desarrollado por The World Wide Web Consortium (W3C) junto
con distintas herramientas que permiten convertir varios formatos a una hoja de estilo, de forma tal
que es posible crear registros muy detallados que sean presentados en una estructura simple para
su operabilidad internacional.
McCallum (2004) introduce el tema de MARC en el entorno XML señalando que con la
evolución de la tecnología, SGML fue siendo reemplazado por HTML primero, como DTD para
páginas Webs (mucho más sencillo pero con posibilidades limitadas) y finalmente por XML, el cual
toma la experiencia de ambos y reúne la cualidad de ser menos complejo para desarrollar que
SGML y con más posibilidades y mayor flexibilidad que HTML. Library of Congress ha creado un
esquema (término equivalente a formato en el entorno XML) de MARC 21 en XML, reemplazando
el MARC DTD en SGML. La tecnología XML brinda un gran potencial: manipula datos de
extensiones diversas; brinda mayor estructura jerárquica; permite intercambiar todos los
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 10
11. caracteres posibles a través de Unicode; los softwares que se desarrollan relacionados a XML son
de código abierto, lo que permite que se pueda manipular los datos con mayor facilidad y en forma
económica y que las bibliotecas puedan desarrollar sus propias aplicaciones. Existen miles de
sistemas basados en MARC que realizan operaciones complejas y miles de bibliotecarios
entrenados responsables de la gestión de los recursos bibliográficos, por lo tanto se debe brindar
continuidad y conectividad entre ambos sistemas. La diferencia entre MARC 21 y MARCXML es la
estructura del registro (ISO 2709 vs XML) y no es crítica, lo fundamental es lograr la compatibilidad
de la semántica del contenido de los nuevos registros con los que ya existen. MARCXML usa el
conjunto de elementos MARC con la sintaxis de XML.
Guenther (2007) destaca las razones por las que Library of Congress desarrolla MARC en
XML.
La elección de XML se debe a que:
- Se ha convertido en el estándar por defecto para metadatos en Internet (el uso de
estándares en la Web garantiza la interoperabilidad y el intercambio de objetos digitales).
- Muchos objetos digitales son complejos y están comprimidos en varios archivos.
- Los objetos digitales complejos necesitan para su uso y gestión formas más variadas de
metadatos que los objetos analógicos: metadatos descriptivos, técnicos, punto de origen
digital, estructura, derechos y términos y condiciones de uso.
La elección de MARC en XML se debe a que:
- Más de un billón de registros bibliográficos se encuentran en los sistemas MARC y pueden
ser reutilizados en el entorno XML usando MARCXML.
- Permite la interoperabilidad con otros esquemas XML aprovechando la ventaja de contar
con herramientas gratuitas.
- Brinda continuidad a la información actual y opciones flexibles para la transición.
Un registro en MARCXML es el equivalente exacto de MARC 21. La conversión se puede
llevar a cabo sin pérdida de información y puede realizarse indistintamente, ida y vuelta, de un
formato a otro. El esquema en XML es sencillo y flexible y no necesita modificarse cuando MARC
21 cambia, se utilizan las hojas de estilo de XML para la presentación y Library of Congress brinda
los programas de conversión de código abierto desde su página Web7
.
Keith (2004) describe la arquitectura MARCXML implementada por Library of Congress. El
esquema permite la validación de datos de los registros MARC 21 y está conformado por seis
elementos: colección, registro, cabecera, campos de control, campos de datos y subcampos. Los
componentes colección y registro se crearon para manipular varios registros relacionados en un
solo archivo, el elemento colección es la ruta que relacionaría los registros como proponen las
FRBR. La ventaja de este esquema es que brinda un fácil acceso a piezas discretas de datos
(nivel de subcampo) a través de la creación de las hojas de estilo (el equivalente en XML de los
DTD de SGML) que permiten manipular y modificar los datos. Esto significa que partiendo de un
registro MARC y aplicando diferentes hojas de estilo se puede obtener desde una página Web a
7
El esquema, las hojas de estilo y las herramientas de software están disponibles en:
http://www.loc.gov/standards/marcxml/
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 11
12. documentos más complejos. La facilidad para modificar estas hojas de estilo hace que no se
necesite ningún software en especial y que un bibliotecario sin experiencia en sistemas pueda
realizarlo con muy poca asistencia. MARC 21 no es un formato sencillo desde el punto de vista del
software, son pocos los informáticos especializados en el tema, en cambio las herramientas en
XML son de código abierto, permiten mucha experimentación a bajo costo y existe mucha
capacitación fuera del ámbito bibliotecario.
MODS (Metadata Object Description Schema):
Ante el vertiginoso crecimiento de las publicaciones electrónicas, Library of Congress creó en
el 2002 un nuevo esquema, MODS, como una opción más rápida y sencilla para el control
bibliográfico. McCallum (2004) destaca sus ventajas:
- fue desarrollado como un estándar descriptivo para metadatos en XML: además de los
beneficios que brinda este entorno, MODS puede ser transmitido a través de los
protocolos desarrollados en XML: SRW (Search/Retrieve Web Service), equivalente al
Z39.50, y OAI-PMH (Open Archives Initiative-Protocol for Metadata Harvesting).
- se adapta a las características especiales de los recursos electrónicos: incluye en la
descripción datos relacionados a las condiciones de acceso, etc.
- es un formato menos detallado: no todos los metadatos deben ser iguales en su nivel de
descripción, habrá recursos que deberán ser catalogados en detalle en registros MARC y
otros más efímeros que necesitarán una descripción más sencilla. MODS ha definido
veinte elementos para la descripción (varios de ellos contienen subelementos): Título,
Nombre, Tipo de recurso, Género, Origen de la información, Idioma, Descripción física,
Resumen, Tabla de contenidos, Audiencia, Nota, Tema, Clasificación, Item relacionado,
Identificador, Ubicación, Condiciones de acceso, Parte, Extensión e Información del
registro.
- es un derivado de MARC 21, lo que lo hace altamente compatible: contiene una selección
de elementos de los registros MARC y reagrupa otros para evitar redundancias. Utiliza
etiquetas alfabéticas para los campos, en vez de numéricas. MODS puede derivar datos
tanto de registros MARC como de registros Dublin Core (un formato extremadamente
simple) y de registros ONIX (más complejo y menos compatible con la comunidad
bibliotecaria).
Actualmente se encuentra disponible la versión 3.3 y está disponible, junto al esquema y otras
herramientas en la página Web de Library of Congress8
.
El interés que despiertan los vocabularios controlados y las ontologías en el entorno de los
metadatos fue el impulso para el desarrollo de MADS (Metadata Authority Description Schema) el
equivalente a MODS para registros de autoridades (Update on major metadata standards, 2005).
METS (Metadata Encoding and Transmission Standard):
8
http://www.loc.gov/standards/mods/
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 12
13. Guenther y Radebaugh (2006) definen METS como un esquema XML diseñado con el
objetivo de crear documentos XML que expresen la estructura jerárquica de los objetos de las
bibliotecas digitales, los nombres y ubicaciones de los archivos que contienen esos objetos y los
metadatos asociados. O sea que METS es tanto una unidad de almacenamiento como un formato
de transmisión, codifica en XML metadatos descriptivos, administrativos y estructurales. Sus
características son: ser un estándar de código abierto, desarrollado por la comunidad bibliotecaria,
relativamente sencillo, extensible y modular (utiliza otros esquemas insertos, por ejemplo para
describir los metadatos bibliográficos utiliza MODS como formato).
El estándar fue creado como una iniciativa de Digital Library Federation y es desarrollado y
mantenido por Library of Congress, el esquema, su documentación y las herramientas y utilidades
están disponibles en su página Web9
.
Conclusión
El desarrollo de Internet significó que la información de diferentes sectores sea más visible
y accesible que antes. La organización de los recursos electrónicos se convirtió en una
preocupación para el ambiente no bibliotecario que tuvo que empezar a pensar por primera vez en
cómo controlarlos. Los bibliotecarios contamos con una gran ventaja, sufrimos y trabajamos por
esa preocupación desde hace mucho tiempo atrás, la única diferencia es que ahora tenemos
necesidad de interactuar y compartir los registros bibliográficos con otros estándares y en un
nuevo entorno tecnológico.
El conocimiento y la experiencia ganada en estos años en crear, compartir y utilizar
metadatos es nuestro principal capital intelectual. Aprendimos que se necesitan estándares que
respondan a las necesidades del control bibliográfico y que estén debidamente controlados,
documentados y modificados por consenso (Weiss, 2000).
El formato MARC es un formato eficiente para el intercambio de datos bibliográficos,
ningún otro lo ha superado en permanencia, estabilidad y flexibilidad ante los cambios. Adaptando
su estructura con la sintaxis XML, MARC seguirá prevaleciendo como el estándar más adecuado
para aquellos recursos que se quieran preservar ya que podrá incorporar los conceptos del nuevo
modelo bibliográfico planteado por los FRBR, beneficiarse de los sistemas y herramientas de
código abierto y ser compatible con la semántica de la Web y con los demás estándares de
metadatos aportados por otras comunidades.
Yee (2004) enfatiza que los bibliotecarios somos afortunados por haber contado con la
visión a futuro que tuvieron los creadores de MARC cuatro décadas atrás y que debemos ser
cuidadosos en no destruir rápidamente lo que hemos logrado por imitar a otras comunidades que
están intentando hallar soluciones que el mundo bibliotecario ya tiene.
De alguna manera, las virtudes del formato MARC coinciden con los mejores valores de
nuestra profesión: calidad, profundidad, eficiencia, continuidad, visión de futuro, adaptabilidad y
cooperación.
9
http://www.loc.gov/standards/mets/
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 13
14. Bibliografía
Andresen, L. (2004). After MARC, what then? Library Hi Tech, 22 (1), 40-51.
Cleveland, G. (1998). SGML: an overview and criteria for use. Recuperado Agosto 29, 2007, de
http://www.ifla.org/VI/5/op/udtop9/udtop9.htm
El-Sherbini, M. (2001). Metadata and the future of cataloging. Library review, 50 (1), 16-27.
Fiander, D. J. & Campbell, D. G. (2003). An XML definition for an ISBD-based encoding scheme.
Journal of Internet cataloging, 6 (4), 29-58.
Gorman, M. (2006). Metadata dreaming: the keynote speech at the Canadian Metadata Forum,
September 2005. The Serials librarian, 51 (2), 47-54.
Guenther, R. & Radebaugh, J. (2006). Standards showcase: MODS, METS, MARCXML.
Recuperado Septiembre 25, 2007, de http://www.loc.gov/standards/mods/mods-mets-ala/mods-
mets-ala.ppt
Guenther, R. (2007). Using metadata standards in digital libraries: introduction to implementing
METS, MODS, PREMIS and MIX. Recuperado Agosto 29, 2007, de
http://www.loc.gov/standards/mods/presentations/intro-diglibstandards-ala07/
Keith, C. (2004). Using XSLT to manipulate MARC metadata. Library Hi Tech, 22 (2), 122-130.
MARC development: overview (2007). Recuperado Septiembre 25, 2007, de
http://www.loc.gov/marc/overview.html
MARC DTDs Document Type Definitions: background and development (2007). Recuperado Junio
26, 2007, de http://www.loc.gov/marc/marcdtd/marcdtdback.html
McCallum, S. (2000). Extending MARC for bibliographic control in the Web environment:
challenges and alternatives. Recuperado Julio 3, 2007, de
http://www.loc.gov/catdir/bibcontrol/mccallum.html
McCallum, S. (2004). An introduction to the metadata object description schema (MODS). Library
Hi Tech, 22 (1), 82-88.
McCallum, S. (2006). Pasado, presente y futuro de MARC21. Recuperado Septiembre 7, 2007, de
http://www.siu.edu.ar/infosiu/&edicion=11¬a=70
Radebaugh, J. (2003). MARC goes global, and lite. American libraries, 34 (2), 43-44.
Riva, P. (2004). Mapping MARC 21 linking entry fields to FRBR and Tillett’s taxonomy of
bibliographic relationships. Library resources & technical services, 48 (2), 130-143.
Tennant, R. (2004). A bibliographic metadata infrastructure for the 21st
century. Library Hi Tech, 22
(2), 175-181.
Update on major metadata standards (2005). Library technology reports, 41 (6), 20-33.
Weiss, P. (2000). Comments. Recuperado Julio 3, 2007, de
http://www.loc.gov/catdir/bibcontrol/weiss_paper.html
Yee, M. M. (2004). New perspectives on the shared cataloging environment and MARC 21
shopping list. Library resources & technical services, 48 (3), 165-178.
III Encuentro Internacional de Catalogadores – Buenos Aires – 2007 14