El tesauro: elementos, estructura y modo de uso ALBERTO GALÁN LAHOZ
1. El tesauro en un Sistema de Información Documental (SID) 1.1 Definición de tesauro. 1.2 Funciones de los tesauros. 1.3 Principios de construcción de un tesauro.  1.4 Normas sobre tesauros. 2. Estructura de un tesauro. 2.1 Base léxica. Unidades léxicas. 2.2 Las relaciones semánticas. 3. Presentación de un tesauro. Formato papel y digital. 4. Modo de uso de un tesauro. 5. Análisis de un tesauro. El tesauro Snipes. 6. Bibliografía
ISO 2788-1986  Un tesauro es un instrumento de control terminológico que  traduce a un lenguaje sistémico o documental el lenguaje natural  empleado en los documentos y por los usuarios. Consiste en un  vocabulario controlado y dinámico  de términos relacionados semántica y jerárquicamente, que se aplica a un campo específico del conocimiento .  George Van Slype  Lista estructurada de conceptos, destinados a  representar de manera unívoca  el contenido de los documentos y de las consultas dentro de un sistema documental determinado, y a ayudar al usuario en la  indización de los documentos y de las consultas ; los conceptos son extraídos de una  lista finita, establecida a priori ; sólo los términos que figuran en esa lista pueden ser utilizados para indizar los documentos y las consultas; la ayuda al usuario la proporciona la estructura semántica del tesauro, fundamentalmente las  relaciones de equivalencia, de jerarquía y de asociación.
Representar el contenido del documento Ayudar a realizar la indización Ayudar al usuario en la recuperación de información Normalización del vocabulario: Sinonimia, polisemia, género y número. Inducción: Varias alternativas. Referencias  cruzadas a través de relaciones. Representación: Correspondencia términos-conceptos
Basado en el conocimiento: Dominio de la realidad que transmiten las disciplinas. Basado en la literatura: Términos del tesauro derivados del  vocabulario de los documentos. Basado en el uso: Necesidades informativas y léxico de los usuarios Control   semántico :  Significación   de   los   términos   y   las   relaciones  Control   léxico :  Presentación   normalizada   de   los   términos . Control   estructural :  Estructura   horizontal   y   vertical   basándose   en   cómo   se   agrupan   en   campos .
Normativa para la elección de términos de indización que nos permita el uso correcto del tesauro:  UNE 50-121-90 “Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización” Normativa relacionada con la construcción y desarrollo de tesauros. UNE-50-106 (ISO 2788-1986). Documentación: Directrices para el establecimiento y desarrollo de tesauros monolingües (1990).   UNE-50-125 (ISO 5964-1985). Documentación: Directrices para la creación y desarrollo de tesauros multilingües (1997).
ESTRUCTURA DEL TESAURO
Descriptores o términos preferentes Palabras o expresiones que se han escogido de un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento. Se debe asegurar la univocidad. Eliminación de la sinonimia Eliminación de la polisemia Relaciones de equivalencia Pertenencia a un determinado grupo semántico Preferencia de uso de una expresión antes que un término aislado impreciso Acompañamiento de una nota explicativa
 
 
No descriptores o términos no preferentes Sinónimos o cuasi-sinónimos de los descriptores. No pueden ser utilizados para indizar documentos ni para formular consultas, pero cada uno de ellos reenvía a uno o dos descriptores, por lo que aumenta la tasa de precisión, es decir, la pertinencia de los documentos que responden a una consulta.  Notas de aplicación Se adjuntan a algunos términos para precisar su significado para evitar posibles ambigüedades. Su notación es en castellano  NA  (Nota de Aplicación) y en inglés  SN  (Scope Note).
Relación establecida entre un término descriptor y un no descriptor cuando existe sinonimia. USE , precediendo al término descriptor o preferente. En inglés UF UP  (usado por), precediendo al no descriptor o término no preferente. En inglés UFC
Relación   asimétrica   entre   dos   descriptores   de   los   que   uno   es   superior   a   otro TG,   término   genérico,   que   corresponde   al   término   superordenado. En inglés BT TE,   término   específico,   que   corresponde   al   término   subordinado. En inglés NT
 
Relación simétrica entre dos descriptores que designan conceptos que, aunque no ligados entre sí por una equivalencia semántica o una jerarquía, son susceptibles de evocarse mutuamente por asociación de ideas. TR,   término relacionado. En inglés RT
Descriptor Nota   de   aplicación No Descriptor Término   genérico Término   específico Término   relacionado
 
PRESENTACIÓN ALFABÉTICA Los términos,  preferentes y no preferentes, se organizan en una secuencia alfabética única
PRESENTACIÓN SISTEMÁTICA Contiene los descriptores estructurados en función de categorías o jerarquías
PRESENTACIÓN GRÁFICA ARBORESCENTE Forma de árbol. En ella el término principal se sitúa en una posición destacada del gráfico. A continuación los términos específicos se sitúan en función de los diferentes grados de jerarquía que poseen. Este tipo de presentación sólo permite visualizar las relaciones jerárquicas siendo necesario el índice alfabético para entender el resto de relaciones que se dan entre los términos
PRESENTACIÓN DIAGRAMA DE FLECHAS En el centro del rectángulo se encuentra el campo semántico o término principal y a su alrededor aparecen los descriptores que pertenecen a dicho campo semántico, así como las relaciones jerárquicas y asociativas que se establecen entre ellos. Las relaciones jerárquicas se indican por medio de flechas que van de los términos más genéricos hacia los más específicos y las relaciones asociativas se fijan a través de líneas rectas que conectan con los descriptores relacionados.
TESAUROS DIGITALES Factores de desarrollo
 
Recordatorio : Antes de usar un tesauro se debe realizar un examen del documento prestando atención a sus partes principales y escoger los conceptos básicos de los que trata el documento. Título. Sumario. Resumen, si lo hay. Introducción, párrafos iniciales y conclusiones de los apartados. Enunciados de las tablas o ilustraciones. Palabras o frases destacadas mediante tipografías distintas como subrayados o negritas.
Expresión del concepto Descriptor Listado de indización Expresión del concepto No-descriptor Término preferente Elegidos y enumerados los conceptos, su expresión en lenguaje natural debe ser traducida en descriptores. Llegados a este punto, en la búsqueda de términos dentro del tesauro pueden darse tres casos
La expresión del concepto no coincide con ninguna entrada Evocar otro término similar del concepto en lenguaje natural Definir la clase o clases generales (disciplinas) que más se ajusten al concepto y revisar los descriptores y no-descriptores que las componen para utilizar el que represente mejor al concepto tomado en lenguaje natural.  Petición vía electrónica o postal de la inclusión de un término nuevo no existente.
TESAURO SPINES
 
Normalización y el control de términos que se ha utilizado para la construcción del tesauro Definición de los descriptores y no-descriptores Reglas sobre la forma como el uso del plural, utilización de siglas y abreviaturas. Reglas de empleo de caracteres
 
Lista alfabética estructurada Es la parte principal. Contiene todos los descriptores y no descriptores ordenados de manera alfabética. Cada descriptor figura acompañado de su código numérico, de una nota de aplicación si es necesario y de sus relaciones semánticas (equivalencia, alternativas, jerárquicas y asociativas). Detrás de cada término aparece un número que corresponde al grupo o grupos temáticos en que está incluido.  PRESENTACIÓN DEL TESAURO
Lista temática de los descriptores. Presenta los descriptores reagrupados por temas. El tesauro aparece dividido en 34 grupos temáticos a cada uno de los cuales les corresponde el código numérico que aparece detrás de cada descriptor o no descriptor de la lista alfabética. Un descriptor puede pertenecer a más de un grupo temático. Dentro de cada uno de estos grupos, los descriptores aparecen ordenados alfabéticamente.  PRESENTACIÓN DEL TESAURO
Lista de palabras significativas de los descriptores. Esta lista complementa a la lista alfabética y su función es facilitar el acceso a los descriptores compuestos a partir de sus elementos tomados de uno en uno por orden alfabético. PRESENTACIÓN DEL TESAURO
Vocabulario de descriptores inglés-español. Permite encontrar los descriptores en español a partir del inglés. Vocabulario de descriptores francés-español. Permite encontrar los descriptores en español a partir del francés. Lista de organizaciones y de los programas internacionales.  Recoge, en orden alfabético, la lista de las organizaciones y de los programas internacionales indicándose también la forma abreviada que debe emplearse al indizarlas. Ejemplo:  En la lista alfabética: UNESCO (ORGANIZACIÓN DE LAS NACIONES UNIDAS PARA LA EDUCACIÓN, LA CIENCIA Y LA CULTURA) En la lista de organizaciones y de los programas internacionales: ORGANIZACIÓN DE LAS NACIONES UNIDAS PARA LA EDUCACIÓN, LA CIENCIA Y LA CULTURA => UNESCO PRESENTACIÓN DEL TESAURO
CONCLUSIÓN Lenguaje documental  Control de términos  Representa de manera unívoca el contenido A través de unos términos preferentes y no preferentes Y las relaciones que se establecen entre ellos Ayuda a sus usuarios a realizar tanto tareas de indización como de recuperación de información.  
GIL URDICIAIN, Blanca.  Manual de lenguajes documentales.  2ª ed. Gijón: Trea, 2004. Biblioteconomía y administración cultural. Incluye cuestionarios de autoevaluación y glosario terminológico.  LAGUENS GARCÍA, José Luis. "Tesauros y lenguajes controlados en Internet". En Anales De Documentación, 9 pp. 105-121.  http:// dialnet.unirioja.es//servlet/extart?codigo =2039541 MOCHÓN BEZARES, Gonzalo; Sorli Rojo. Ángela.  "Tesauros en acceso abierto en Internet. Un análisis cuantitativo". En  Revista Española De Documentación Científica, 33, pp. 643-663.  http:// dialnet.unirioja.es // servlet / extart?codigo =3348478 VAN SLYPE, Georges.  Los lenguajes de indización: concepción, construcción y utilización en los sistemas documentales . Madrid etc.: Fundación Germán Sánchez Ruipérez, 1991. Biblioteca del libro. Traducción del francés, Pedro Hípola, Félix de Moya.  ISO 5963 1985 (E) Documentation - Methods for examining documents, determining their subjects, and selecting indexing terms.  (Métodos para examinar los documentos, determinar su materia y seleccionar los términos de indización.) ISO 2788 1986 (E) Documentation - Guidelines for the establishment and development of monolingual thesauri.  (Directrices para el establecimiento y el desarrollo de tesauros monolingües.) CURRAS, Emilia.  Ontologías, taxonomía y tesauros: manual de construcción y uso . Vol. 3ª act. Y amp. ed. Gijón: Trea, 2005. Biblioteconomía y administración cultural ESTEBAN NAVARRO, Miguel Angel. “Principios, reglas y técnicas para la gestión del vocabulario y la estructura de los lenguajes documentales”. En  Organización del conocimiento en sistemas de información y documentación: Actas del II Encuentro de ISKO-España, Getafe, 16 y 17 de noviembre de 1995.  http:// dialnet.unirioja.es//servlet/extart?codigo =595075
FIN

El tesauro: elementos, estructura y modo de uso

  • 1.
    El tesauro: elementos,estructura y modo de uso ALBERTO GALÁN LAHOZ
  • 2.
    1. El tesauroen un Sistema de Información Documental (SID) 1.1 Definición de tesauro. 1.2 Funciones de los tesauros. 1.3 Principios de construcción de un tesauro. 1.4 Normas sobre tesauros. 2. Estructura de un tesauro. 2.1 Base léxica. Unidades léxicas. 2.2 Las relaciones semánticas. 3. Presentación de un tesauro. Formato papel y digital. 4. Modo de uso de un tesauro. 5. Análisis de un tesauro. El tesauro Snipes. 6. Bibliografía
  • 3.
    ISO 2788-1986 Un tesauro es un instrumento de control terminológico que traduce a un lenguaje sistémico o documental el lenguaje natural empleado en los documentos y por los usuarios. Consiste en un vocabulario controlado y dinámico de términos relacionados semántica y jerárquicamente, que se aplica a un campo específico del conocimiento . George Van Slype Lista estructurada de conceptos, destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado, y a ayudar al usuario en la indización de los documentos y de las consultas ; los conceptos son extraídos de una lista finita, establecida a priori ; sólo los términos que figuran en esa lista pueden ser utilizados para indizar los documentos y las consultas; la ayuda al usuario la proporciona la estructura semántica del tesauro, fundamentalmente las relaciones de equivalencia, de jerarquía y de asociación.
  • 4.
    Representar el contenidodel documento Ayudar a realizar la indización Ayudar al usuario en la recuperación de información Normalización del vocabulario: Sinonimia, polisemia, género y número. Inducción: Varias alternativas. Referencias cruzadas a través de relaciones. Representación: Correspondencia términos-conceptos
  • 5.
    Basado en elconocimiento: Dominio de la realidad que transmiten las disciplinas. Basado en la literatura: Términos del tesauro derivados del vocabulario de los documentos. Basado en el uso: Necesidades informativas y léxico de los usuarios Control semántico : Significación de los términos y las relaciones Control léxico : Presentación normalizada de los términos . Control estructural : Estructura horizontal y vertical basándose en cómo se agrupan en campos .
  • 6.
    Normativa para laelección de términos de indización que nos permita el uso correcto del tesauro: UNE 50-121-90 “Métodos para el análisis de documentos, determinación de su contenido y selección de los términos de indización” Normativa relacionada con la construcción y desarrollo de tesauros. UNE-50-106 (ISO 2788-1986). Documentación: Directrices para el establecimiento y desarrollo de tesauros monolingües (1990). UNE-50-125 (ISO 5964-1985). Documentación: Directrices para la creación y desarrollo de tesauros multilingües (1997).
  • 7.
  • 8.
    Descriptores o términospreferentes Palabras o expresiones que se han escogido de un conjunto de términos equivalentes para representar sin ambigüedad una noción contenida en un documento. Se debe asegurar la univocidad. Eliminación de la sinonimia Eliminación de la polisemia Relaciones de equivalencia Pertenencia a un determinado grupo semántico Preferencia de uso de una expresión antes que un término aislado impreciso Acompañamiento de una nota explicativa
  • 9.
  • 10.
  • 11.
    No descriptores otérminos no preferentes Sinónimos o cuasi-sinónimos de los descriptores. No pueden ser utilizados para indizar documentos ni para formular consultas, pero cada uno de ellos reenvía a uno o dos descriptores, por lo que aumenta la tasa de precisión, es decir, la pertinencia de los documentos que responden a una consulta. Notas de aplicación Se adjuntan a algunos términos para precisar su significado para evitar posibles ambigüedades. Su notación es en castellano NA (Nota de Aplicación) y en inglés SN (Scope Note).
  • 12.
    Relación establecida entreun término descriptor y un no descriptor cuando existe sinonimia. USE , precediendo al término descriptor o preferente. En inglés UF UP (usado por), precediendo al no descriptor o término no preferente. En inglés UFC
  • 13.
    Relación asimétrica entre dos descriptores de los que uno es superior a otro TG, término genérico, que corresponde al término superordenado. En inglés BT TE, término específico, que corresponde al término subordinado. En inglés NT
  • 14.
  • 15.
    Relación simétrica entredos descriptores que designan conceptos que, aunque no ligados entre sí por una equivalencia semántica o una jerarquía, son susceptibles de evocarse mutuamente por asociación de ideas. TR, término relacionado. En inglés RT
  • 16.
    Descriptor Nota de aplicación No Descriptor Término genérico Término específico Término relacionado
  • 17.
  • 18.
    PRESENTACIÓN ALFABÉTICA Lostérminos, preferentes y no preferentes, se organizan en una secuencia alfabética única
  • 19.
    PRESENTACIÓN SISTEMÁTICA Contienelos descriptores estructurados en función de categorías o jerarquías
  • 20.
    PRESENTACIÓN GRÁFICA ARBORESCENTEForma de árbol. En ella el término principal se sitúa en una posición destacada del gráfico. A continuación los términos específicos se sitúan en función de los diferentes grados de jerarquía que poseen. Este tipo de presentación sólo permite visualizar las relaciones jerárquicas siendo necesario el índice alfabético para entender el resto de relaciones que se dan entre los términos
  • 21.
    PRESENTACIÓN DIAGRAMA DEFLECHAS En el centro del rectángulo se encuentra el campo semántico o término principal y a su alrededor aparecen los descriptores que pertenecen a dicho campo semántico, así como las relaciones jerárquicas y asociativas que se establecen entre ellos. Las relaciones jerárquicas se indican por medio de flechas que van de los términos más genéricos hacia los más específicos y las relaciones asociativas se fijan a través de líneas rectas que conectan con los descriptores relacionados.
  • 22.
  • 23.
  • 24.
    Recordatorio : Antesde usar un tesauro se debe realizar un examen del documento prestando atención a sus partes principales y escoger los conceptos básicos de los que trata el documento. Título. Sumario. Resumen, si lo hay. Introducción, párrafos iniciales y conclusiones de los apartados. Enunciados de las tablas o ilustraciones. Palabras o frases destacadas mediante tipografías distintas como subrayados o negritas.
  • 25.
    Expresión del conceptoDescriptor Listado de indización Expresión del concepto No-descriptor Término preferente Elegidos y enumerados los conceptos, su expresión en lenguaje natural debe ser traducida en descriptores. Llegados a este punto, en la búsqueda de términos dentro del tesauro pueden darse tres casos
  • 26.
    La expresión delconcepto no coincide con ninguna entrada Evocar otro término similar del concepto en lenguaje natural Definir la clase o clases generales (disciplinas) que más se ajusten al concepto y revisar los descriptores y no-descriptores que las componen para utilizar el que represente mejor al concepto tomado en lenguaje natural. Petición vía electrónica o postal de la inclusión de un término nuevo no existente.
  • 27.
  • 28.
  • 29.
    Normalización y elcontrol de términos que se ha utilizado para la construcción del tesauro Definición de los descriptores y no-descriptores Reglas sobre la forma como el uso del plural, utilización de siglas y abreviaturas. Reglas de empleo de caracteres
  • 30.
  • 31.
    Lista alfabética estructuradaEs la parte principal. Contiene todos los descriptores y no descriptores ordenados de manera alfabética. Cada descriptor figura acompañado de su código numérico, de una nota de aplicación si es necesario y de sus relaciones semánticas (equivalencia, alternativas, jerárquicas y asociativas). Detrás de cada término aparece un número que corresponde al grupo o grupos temáticos en que está incluido. PRESENTACIÓN DEL TESAURO
  • 32.
    Lista temática delos descriptores. Presenta los descriptores reagrupados por temas. El tesauro aparece dividido en 34 grupos temáticos a cada uno de los cuales les corresponde el código numérico que aparece detrás de cada descriptor o no descriptor de la lista alfabética. Un descriptor puede pertenecer a más de un grupo temático. Dentro de cada uno de estos grupos, los descriptores aparecen ordenados alfabéticamente. PRESENTACIÓN DEL TESAURO
  • 33.
    Lista de palabrassignificativas de los descriptores. Esta lista complementa a la lista alfabética y su función es facilitar el acceso a los descriptores compuestos a partir de sus elementos tomados de uno en uno por orden alfabético. PRESENTACIÓN DEL TESAURO
  • 34.
    Vocabulario de descriptoresinglés-español. Permite encontrar los descriptores en español a partir del inglés. Vocabulario de descriptores francés-español. Permite encontrar los descriptores en español a partir del francés. Lista de organizaciones y de los programas internacionales. Recoge, en orden alfabético, la lista de las organizaciones y de los programas internacionales indicándose también la forma abreviada que debe emplearse al indizarlas. Ejemplo: En la lista alfabética: UNESCO (ORGANIZACIÓN DE LAS NACIONES UNIDAS PARA LA EDUCACIÓN, LA CIENCIA Y LA CULTURA) En la lista de organizaciones y de los programas internacionales: ORGANIZACIÓN DE LAS NACIONES UNIDAS PARA LA EDUCACIÓN, LA CIENCIA Y LA CULTURA => UNESCO PRESENTACIÓN DEL TESAURO
  • 35.
    CONCLUSIÓN Lenguaje documental Control de términos Representa de manera unívoca el contenido A través de unos términos preferentes y no preferentes Y las relaciones que se establecen entre ellos Ayuda a sus usuarios a realizar tanto tareas de indización como de recuperación de información.  
  • 36.
    GIL URDICIAIN, Blanca. Manual de lenguajes documentales. 2ª ed. Gijón: Trea, 2004. Biblioteconomía y administración cultural. Incluye cuestionarios de autoevaluación y glosario terminológico. LAGUENS GARCÍA, José Luis. "Tesauros y lenguajes controlados en Internet". En Anales De Documentación, 9 pp. 105-121. http:// dialnet.unirioja.es//servlet/extart?codigo =2039541 MOCHÓN BEZARES, Gonzalo; Sorli Rojo. Ángela. "Tesauros en acceso abierto en Internet. Un análisis cuantitativo". En Revista Española De Documentación Científica, 33, pp. 643-663. http:// dialnet.unirioja.es // servlet / extart?codigo =3348478 VAN SLYPE, Georges. Los lenguajes de indización: concepción, construcción y utilización en los sistemas documentales . Madrid etc.: Fundación Germán Sánchez Ruipérez, 1991. Biblioteca del libro. Traducción del francés, Pedro Hípola, Félix de Moya. ISO 5963 1985 (E) Documentation - Methods for examining documents, determining their subjects, and selecting indexing terms. (Métodos para examinar los documentos, determinar su materia y seleccionar los términos de indización.) ISO 2788 1986 (E) Documentation - Guidelines for the establishment and development of monolingual thesauri. (Directrices para el establecimiento y el desarrollo de tesauros monolingües.) CURRAS, Emilia. Ontologías, taxonomía y tesauros: manual de construcción y uso . Vol. 3ª act. Y amp. ed. Gijón: Trea, 2005. Biblioteconomía y administración cultural ESTEBAN NAVARRO, Miguel Angel. “Principios, reglas y técnicas para la gestión del vocabulario y la estructura de los lenguajes documentales”. En Organización del conocimiento en sistemas de información y documentación: Actas del II Encuentro de ISKO-España, Getafe, 16 y 17 de noviembre de 1995. http:// dialnet.unirioja.es//servlet/extart?codigo =595075
  • 37.