El documento describe los lenguajes controlados y su uso en la organización y recuperación de contenidos en la Web. Explica que los lenguajes controlados proporcionan una indización más coherente que los lenguajes naturales, y que sistemas como SKOS, los metadatos, las ontologías y las folksonomías han permitido representar mejor el conocimiento en la Web Semántica. También analiza el papel de las etiquetas y la indización social en la organización de información.
6° SEM30 WORD PLANEACIÓN PROYECTOS DARUKEL 23-24.docx
Lenguajes controlados recuperación contenidos Web
1. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Los lenguajes controlados en
la organización y
recuperación de contenidos
en la Web
Wilmer Arturo Moyano Grimaldo
Catedra para el curso:
Organización y acceso a la información
Instituto Tecnológico de Monterrey
Febrero 21 de 2012
2. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Agenda a tratar:
1. Organización de la información
– Lenguaje y conocimiento
– Lenguajes naturales vs. Lenguajes controlados
2. Lenguajes controlados y organización web
– Knowledge organization systems y System
Knowledge Organization systems
– Folcsonomías y etiquetado
3. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguaje y conocimiento
Lenguaje
4. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Tendencias en la organización
Control
Bibliográfico
Estructuralista
• Catalogación tradicional
• Estándares bibliográficos
• Esquemas de clasificación
• XML
• RDF
• Ontologías
Organización en la
Web
Web
Semántica
5. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Organización de Información
• Fundamentos
– Filosofía de los sistemas
• El todo, las partes y sus relaciones
– Filosofía de la ciencia
• Positivismo y dialéctica
– Filosofía del lenguaje
• Uso de las palabras
6. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
• Obstáculos
– Variedad del universo de información
– Cambios políticos
• Estandarización internacional
– Cambios tecnológicos
• Componentes
– Humano
– Tecnológico
Organización de Información
7. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes naturales Vs. Lenguajes
artificiales
VIZCAYA, D. A. (2000). Lenguajes documentales. p. 92
8. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Ventajas de los lenguajes controlados
• El apoyo en la coherencia de la indización
• El aumento de la probabilidad de adecuación entre los términos
escogidos por los indizadores y aquellos escogidos por el
investigador
• El proveer una estructura sindética que ayuda a la navegación y al
refinamiento de conceptos
• El control de la sinonimia y de la polisemia
• La discriminación de las palabras homógrafas
• El proveer unas notas de aplicación
• El permitir una recuperación más global dentro de un ambiente
multilingüe
• El permitir la reagrupación de los elementos dispersos por sus
características comunes
(Arsenaut, 2006)
9. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Desventajas de los lenguajes
controlados
• La ausencia de expresividad
• La limitación de la cantidad de puntos de acceso
• La ausencia de exhaustividad
• La dificultad de representar nuevos conceptos
• La dificultad de representar conceptos complejos
• Las limitaciones del aprendizaje de las reglas sintéticas
• La representación artificial de la realidad
• La incompatibilidad entre los diferentes vocabularios
controlados
• El costo de su desarrollo y utilización
(Arsenaut, 2006).
10. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes naturales y Lenguajes
documentales en la organización de
información
Fuente: VIZCAYA, D. A. (2000)
11. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Lenguajes documentales de acuerdo a
su rol en los catálogos
Universo bibliográfico
Lenguajes de obras Lenguajes de Documentos
De autor
De título
De edición
De materias
De clasificación
De indización
De producción
De soporte
De ubicación
Svenonius, E. (2000). Intellectual foundation of
information organization. p. 54
12. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
KOS: Knowledge Organization Systems
• Término propuesto en
1998 por el Networked
Knowledge Organization
Systems Working Group
como remplazo a los
Lenguajes documentales.
• Para todo tipo de
esquemas de
organización de
información: Ej.
Metadatos, ontologías.
• Características:
– Imponen una visión
particular del mundo en
una colección y sus
elementos.
– Permiten caracterizar las
entidades de diferentes
formas dependiendo el
KOS.
– Facilitan para que una
persona pueda asociar el
término del KOS con el
objeto del mundo real al
que representan
13. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Tipos de KOS
1. Listas de términos
a. Archivos de autoridades
b. Glosarios
c. Diccionarios
d. Diccionarios geográficos (Gazeteers)
2. Clasificaciones y categorías
a. Listas de encabezamientos
b. Esquemas de clasificación, de categorización y taxonomías
3. Listas de relaciones
a. Tesauros
b. Redes semánticas
c. Ontologías
14. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
SKOS: Simple Knowledge Organization
System
• Recomendación de la W3C
• Para la representación de KOS en la Web,
potenciando los lenguajes documentales
tradicionales a un ambiente de Web
Semántica.
– Estructura basada en RDF para representación de
conceptos, sus relaciones y sus definiciones.
15. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
LÉNART, M. SKOS, un langage de représentation de schémas de concepts
SKOS: Simple Knowledge Organization
System
AGROVOC
16. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos
• “Datos sobre datos”
• Para la organización, gestión, descripción y
recuperación de información en formato
digital. Ej. Fotografía
• No son específicos del ambiente bibliotecario
• Para diferentes campos:
– Bibliotecas digitales: Dublin core
– Archivos: Encoded Archival Description
– Museos: VRA core
17. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos en la vida diaria
18. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Metadatos en la vida diaria
19. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Ontologías
• Vocabulario común a
máquinas y personas
– Mejoran la especificidad en
las búsquedas Web
– Recuperación de
información automatizada
por fuera de los motores
de búsqueda.
– Representan la estructura
de un documentos a través
de la abstracción y relación
de conceptos.
20. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
OWL: Web Ontology Language
• OWL= 2004; OWL2 = 2009 (basado en XML)
• Para permitir la descripción de clases y las
relaciones entre estas que son inherentes a
aplicaciones y documentos en la Web.
– OWL2: especialmente para esquemas de clasificación
• Permite describir las clases
• Mejora las relaciones entre las clases
• Construcción de varias clases de reglas para nuevos números
de clasificación.
• Ejemplo:
http://www.regesta.com/xdams/ontologie/owl/Biblioteca.owl
22. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Folcsonomías
• Por Thomas Vander Wal en 2004
– “Taxonomías creadas por la gente”
• Indización social a base de etiquetas
– Lenguaje natural
– No existen relaciones entre términos
– Las etiquetas permiten la organización y
recuperación
• Ejemplos de uso: www.delicious.com
23. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Aplicación del etiquetado
24. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Aplicación del etiquetado
25. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• El lenguaje es el estándar que usa la
comunicación para transmitir un mensaje y
crear conocimiento.
• La recuperación más efectiva de información
depende del uso de los lenguajes naturales y
los lenguajes controlados.
• La nueva forma de definir los lenguajes
documentales es como Sistemas de
Organización de conocimientos (KOS)
26. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• SKOS es el lenguaje que permite representar
los lenguajes documentales en un ambiente
Web mejorando la representación del
conocimiento como apoyo a la Web
Semántica
• Los metadatos y las ontologías son sistemas
de organización del conocimiento en un
ambiente digital y Web
27. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
En resumen…
• Las folcsonomías son estructuras temáticas
basadas en lenguaje natural y creadas por los
usuarios finales para la organización,
descripción y recuperación de información por
medio de etiquetas.
• El etiquetado ha permitido la creación de
sistemas y servicios que facilitan la interacción
entre el usuario y el sistema.
28. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Wilmer Arturo Moyano
29. Los lenguajes controlados en la organización y recuperación de contenidos en la Web
Bibliografía recomendada…
• SVENONIUS, E. (2000). The intellectual foundation of
information organization. Cambridge: The MIT press, 2000.
255 p. Serie Digital libraries and electronic publishing.
• ARSENAULT, C. (2006). “L’utilisation des langages
documentaires pour la recherche d’information” En:
Documentation et bibliothèques, avril-juin, 2006, pp. 139-
149
• HODGE, G. (2000). Systems of Knowledge Organization for
Digital Libraries: Beyond Traditional Authority Files.
http://www.clir.org/pubs/reports/pub91
• PETERS, I. (2009). Folksonomies: indexing and retrieval in
Web 2.0 (Disponible parcialmente a través de Google
Books)