Diferencias entre análisis documental e información
1. Información textual y documental
DIFERENCIAS ENTRE EL ANÁLISIS DOCUMENTAL Y DE INFORMACIÓN
El tratamiento documental es un sistema donde se describe y representa un
documento en forma artificial. Se ocupa de los metadatos y la metainformación, pero
no se remite directamente al autor; posibilita la recuperación documental pero la
metainformación disponible no es decisiva, se rige por normas e indica el contenido
para su posterior recuperación.3
El análisis de información, a diferencia del tratamiento documental, se centra en el
análisis de contenido en un contexto específico, se remite directamente al autor,
produce información para la toma de decisiones, posibilita la recuperación de la
información, está condicionada por la calificación, inteligencia y creatividad del analista
y es capaz de ofrecer, mas que referencias, datos derivados del análisis y la síntesis
de la información evaluada.
Tanto uno como el otro, nacen como respuesta a la necesidad de una metodología
científica para tratar rigurosamente los documentos y la información existente en
diferentes contextos.
Ambos tipos de análisis pasan, en primer lugar por la identificación y localización de lo
que se hace uso, ubican al documento y a la información en un entorno.
Uno, el análisis documental, es el resultado de la necesidad de proporcionar al usuario
un camino para llegar al documento pertinente y el otro, el análisis de la información,
es una forma adecuada para su uso racional y creador en la actividad práctica del
individuo, sea de la clase que ésta sea: investigadora, gerencial, académica, etcétera.
El primero exige del especialista, el conocimiento de las normas establecidas para su
realización, el empleo de tesauros y categorías, para individualizar y especificar la
fuente; el segundo requiere de una calificación, creatividad, inteligencia y conocimiento
del tema, que posibilite el uso, relación y manejo de conceptos, así como la habilidad
para ubicar en un contexto y establecer los nexos necesarios entre la información
procesada y el conocimiento disponible para la solución de un problema.
Son un puente entre el usuario y el conocimiento. Posibilitan la descripción y
representación del documento, a partir de la reproducción en síntesis del documento
real, utilizan taxonomías para procesar la información y vocabularios que recrean el
entorno lingüístico, repercuten en la calidad de los productos y servicios de
información, elevan la capacidad de recuperación y reducen la incertidumbre. En
muchos casos, sus resultados son productos científicos, creativos y polémicos.
En conjunto, ambos procesos presentan un valor sinérgico y holístico como procesos
de la organización de la información y en el ciclo de vida de la información.
Ambos se presentan como requerimientos insoslayables de la práctica cotidiana de los
trabajadores de la información para colocar sus productos y servicios al servicio de sus
usuarios, quienes necesitan de sus resultados para, a su vez, obtener nuevos avances
en sus respectivas actividades, sobre todo, en las condiciones actuales de un mundo
globalizado.
2. Su práctica y utilización rebasa los marcos de los recintos bibliotecarios para estar
presentes en empresas y organizaciones donde definen contextos, idiosincrasia
informacional y favorecen su desarrollo en general.
Base de Datos
Una base de datos es un conjunto de datos pertenecientes a un mismo contexto y
almacenados sistemáticamente para su posterior uso. Actualmente, y debido al
desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de
las bases de datos están en formato digital (electrónico), que ofrece un amplio rango
de soluciones al problema de almacenar datos.
Existen programas denominados sistemas gestores de bases de datos (SGBD),
permiten almacenar y posteriormente acceder a los datos de forma rápida y
estructurada. Las propiedades de estos SGBD, así como su utilización y
administración, se estudian dentro del ámbito de la informática.
Las aplicaciones más usuales son para la gestión de empresas e instituciones
públicas. También son ampliamente utilizadas en entornos científicos con el objeto de
almacenar la información experimental.
Aunque las bases de datos pueden contener muchos tipos de datos, algunos de ellos
se encuentran protegidos por las leyes de varios países. Por ejemplo, en España los
datos personales se encuentran protegidos por la Ley Orgánica de Protección de
Datos de Carácter Personal (LOPD).
1. Centros documentales y bases de datos
La tarea de adquirir las fuentes y organizarlas para un fácil acceso ha correspondido
tradicionalmente a las bibliotecas, a las que hay que añadir en la actualidad los centros
especializados de documentación computarizada, que ofrecen sus servicios mediante
acceso directo y on-line o mediante algún tipo de soporte magnético (generalmente,
CD-ROM). La mayoría de las bibliotecas importantes están conectadas o adscritas a
los servicios de dichos centros.
Las nuevas tecnologías de la documentación dependientes de la informática y la
telemática permiten, de forma relativamente sencilla, el acceso a la documentación
existente sobre un tema determinado, previamente almacenada y clasificada en las
denominadas bases de datos.
Los grandes centros de documentación constituyen entidades especializadas en la
función de aplicar las nuevas tecnologías al tratamiento de la información, que afecta
mínimamente a sus cuatro momentos básicos: obtención, clasificación, recuperación y
distribución de la misma. Su objetivo es generar sistemas automatizados de
documentación (bases de datos) y redes de transporte, que están al servicio del
investigador.
Las bibliotecas suelen incorporar en sus servicios la actuación como centros de
información y documentación, donde el usuario, directamente, o a través de personal
especializado, puede acceder a la información almacenada en los sistemas
magnéticos o bien realizar la conexión y consulta directa a los distribuidores de las
3. bases de datos, según sus necesidades. Los sistemas automatizados de
documentación ofrecen al investigador información permanentemente actualizada
sobre tópicos o temas de su interés. Esto sólo es posible gracias a la aparición de las
computadoras, que permiten clasificar, indizar y recuperar de forma automática la
información.
2. Publicar bases de datos
Hasta hace pocos años, los productores y los distribuidores de bases de datos (estos
últimos en particular) acostumbraban a tener un carácter especializado y a disponer,
por tanto, de una potente estructura empresarial. Esta situación ha cambiado
radicalmente con la eclosión de Internet y el desarrollo de distintas herramientas
fácilmente configurables y adaptables que ponen al alcance de pequeños y medianos
centros de información y documentación, e incluso de usuarios personales, la
posibilidad de convertirse en productores y distribuidores de bases de datos.
Pequeñas y medianas organizaciones que habían creado bases de datos
documentales, y a las que nos hemos referido en el anterior apartado, están llevando a
cabo un proceso generalizado de publicación de sus contenidos en el web. Esto
permite que los usuarios sólo necesiten del navegador para poder acceder a los
registros de forma actualizada y que dispongan, en la mayoría de los casos, de las
mismas prestaciones de consulta y explotación que tienen los sistemas de gestión
documental cuando se consultan localmente o mediante redes de área local
2.1. Elementos
Ahora bien, para que este método de acceso sea posible, es necesario disponer, en el
lado del servidor web, de un programa o un conjunto de programas que permita
establecer la comunicación entre dos entornos en principio incompatibles o distintos: la
base de datos gestionada por el SGD, por un lado, y el servidor web, que es el que
atiende a los navegadores que utilizan los usuarios y que sólo es capaz de interpretar
páginas html transmitidas mediante el protocolo http, por el otro. Estos programas
suelen recibir la denominación de pasarelas web ya que actúan como intermediarios
entre los registros de la base de datos y los datos codificados en html que proceden
del formulario de consulta que ha rellenado un usuario.
4. El siguiente esquema muestra los elementos básicos que intervienen en este proceso
y su funcionamiento.
2.2 Pasarela web e interfaz de consulta.
Pasarela web:Son las piezas de software que comunican el servidor Web (Apache,
IIS, etc.) con el SGD. Es decir, se trata del programa que es capaz de leer e interpretar
las órdenes que se le transmiten desde un formulario html, algunas de ellas
introducidas por el usuario (p. e. los términos de búsqueda) y otras correspondientes a
parámetros generales (p. e. la ubicación del programa y de la base de datos en el
servidor, el formato de visualización, el número de documentos a visualizar, etc.). A
continuación, los ejecuta y el resultado lo transfiere al usuario en formato html (es el
listado con el resultado).
Estos programas pueden cumplir diversos protocolos o sistemas de comunicación con
el servidor web. El más antiguo es el protocolo CGI, pero también existen los
protocolos ASP (desarrollado por Microsoft), JSP (de Java y que es de código abierto)
y se está preparando la tecnología.NET (una evolución de ASP y de VisualBasic de
Microsoft).
El protocolo CGI sirve para comunicar un servidor web (httpd) con programas externos
y funciona incorporando, dentro de la página web, una llamada a un fichero ejecutable
(el programa CGI) que está situado en el directorio cgi-bin, o equivalente, de un
servidor y que es capaz de procesar los datos que se envían con la página (es decir,
una consulta a una base de datos). Este modelo de funcionamiento no acaba de
satisfacer a muchos webmasters porque implica ir instalando en el servidor distintos
programas CGI (uno para cada SGD o aplicación específica que se quiera conectar
con el servidor web), de los cuales se desconoce si van a ser totalmente compatibles
entre ellos o cuantos recursos de la máquina del servidor van a consumir. El
funcionamiento de ASP o JSP es distinto, ya que los scripts están incluidos en la
página web y se ejecutan en el propio servidor antes de enviar la página, siendo un
sistema más robusto porque está más integrado con el servidor web. Así pues, si un
5. servidor Web y unSGD soportan esta tecnología estándar, se pueden comunicar
directamente sin tener que instalar un programa CGI aparte. Por otro lado, estos
sistemas utilizan un lenguaje de programación estándar, el propio ASP o JSP,que da
más facilidades en la manipulación de los datos.
La interfaz de consulta: es el conjunto de páginas que facilitan la realización de la
consulta por parte del usuario y que indican el formato de presentación de los
resultados. Se construye con el lenguaje de programación propietario de la pasarela
web en caso del CGI o con código estándar ASP o JSP, entremezclada con código
html y consta básicamente de tres elementos: formulario de consulta; pantalla de
visualización de resultados (listado); y pantalla de visualización del documento
completo. Las prestaciones que se analizan en el próximo apartado son,
fundamentalmente, las que nos ayudan a generar ese código de forma asistida.
Gestión de Datos
El sistema de Gestión Documental, puede trabajar con información procedente de
diferentes fuentes: papel, ficheros informáticos de diversos formatos, documentos
manuscritos o de formato gráfico capturados por medio de escáner, vídeos,
imágenes... Para gestionar estas fuentes de datos el sistema es capaz de procesar
información de tres tipos:
Información estructurada: Aquella sobre la que se puede aplicar un índice o una
relación determinada. Por ejemplo, fechas, números o códigos alfanuméricos.
Información textual: Aquélla de tipo texto libre constituida por caracteres
alfanuméricos. Por ejemplo, comentarios o descripciones largas.
Objetos no relacionales: Aquella información que no se puede relacionar ni tampoco
estructurar fácilmente, pero que se puede asociar a un clasificador de datos. Es el
caso de las imágenes documentales, archivos de texto, animaciones, etc.
La gestión de datos contempla los siguientes conceptos:
Archivadores la unidad estructural sobre la que se basa el Gestor Documental
para organizar la información.
Carpetas puede incluir información estructurada, textual y objetos de información
no codificados.
Clasificador es una estructura lógica que agrupa la información no relacional de
una carpeta según los criterios que más se ajusten a las necesidades del usuario
documentos con ficheros asociados.
6. Documento Los documentos clasifican los ficheros no relacionales asociados a una
carpeta según diferentes criterios.
Página representan cada uno de los ficheros no relacionales incluidos en una
carpeta y capturados previamente mediante un escáner o a través del sistema de
selección de ficheros desde las respectivas aplicaciones.
Gestión de Repositorios Documentales
Para un correcto almacenamiento de la información es preciso definir los siguientes
elementos:
Repositorios: estructura lógica que agrupa una serie de características físicas que
heredarán todos los volúmenes que se incluyan en ellos.
Volúmenes: lugar donde se van a almacenar los ficheros de las carpetas de
archivadores de las aplicaciones SIGEM.
Listas: serie ordenada de volúmenes. Al incluir un fichero en una carpeta de un
archivador determinado vía escáner o vía fichero, en el momento en que se guarda la
carpeta, el fichero se guardará en el primer volumen de almacenamiento disponible de
la lista de volúmenes asociada al archivador.
Páginas visitadas:
http://es.wikipedia.org/wiki/Base_de_datos
http://bibliopress.wordpress.com/2007/06/11/las-fuentes-documentales-y-el-tratamiento-de-
la-informacion-en-el-proceso-de-investigacion/
http://www.upf.edu/hipertextnet/numero-3/bases-datos.html
http://bvs.sld.cu/revistas/aci/vol12_2_04/aci11204.htm
http://www.capazita.com/es/nuevas-tecnologias-administracion-publica-gestion-
documental.zhtm?SID