El documento presenta un modelo de enriquecimiento semántico de recursos de información para identificar detalles de interés en documentos que permitan su extracción y consulta por máquinas. Propone marcar documentos con estructura, entidades y URIs para hacerlos legibles por máquinas y extraer datos que puedan usarse en visualizaciones e informes. El modelo requiere herramientas de procesamiento de lenguaje natural para anotar automáticamente los documentos.
Presentación de Fernando García Ruiz (IGN) en la Jornada Controller Bilbao: "Las funciones del controller" en las organizaciones; organizada por IGN y APD.
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasGuillermo Álvaro Rey
Lección "Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas" del Curso de Verano 2010 de la UPM: "Linked Data: ¿Una oportunidad o un riesgo?"
Web search engines are constantly being developed in order to answer to user needs. This development process focuses not only on lexical pattern matching, but also on processing the sense of the query. There are two ways of doing this. The first is to extract content through Natural Language Processing (NLP); the second is to assign semantic descriptors from controlled languages. Therefore, the technological options available are either free text analysis, or semantic annotation. In the first case human interaction is essential; in the second one the quality of semantic retrieval by means of NLP is still under discussion. Although these solutions represent contrasting positions in the traditional debate on this matter, these methodologies are now mixing. In fact, semantic Web search engines need many pages to be annotated (which requires an enormous effort), so NLP represents an important help for automatic or semi-automatic annotation. At the same time, the precision of text analysis can be optimized by techniques of assignment applied by users and professionals. In conclusion, the trend is the development of collective knowledge systems that improve as more people participate, as they are based on human contributions. All of this will possibly be integrated by chunking, clustering, parsing, spell-checker and other NLP algorithms.
Presentación Segundo Taller: Mapa Mundial de Bibliotecas. Presencia LAC
El 2021 fue declarado Año Iberoamericano de las Bibliotecas en la pasada XX Conferencia Iberoamericana de Ministras y Ministros de Cultura de Iberoamérica, realizada en 2019.
Para ello la Sección de IFLA LAC con la finalidad de incrementar la presencia de las bibliotecas en el Mapa Mundial de Bibliotecas de IFLA
Sección América Latina y el Caribe IFLA LAC en el marco de las actividades conmemorativas del “Año Iberoamericano de las Bibliotecas” realizará el taller “Mapa Mundial de Bibliotecas. Presencia LAC ”
El taller se ejecutará de manera virtual, los días martes 19 y miércoles 20 de enero, su objetivo es la presencia de las bibliotecas latinoamericanas y caribeñas en el Mapa Mundial de Bibliotecas.
Más información:
https://www.ifla.org/node/93580?og=68
Más contenido relacionado
Similar a Modelo de enriquecimiento semántico de recursos de información
Presentación de Fernando García Ruiz (IGN) en la Jornada Controller Bilbao: "Las funciones del controller" en las organizaciones; organizada por IGN y APD.
Desarrollo práctico de aplicaciones Linked Data: metodología y herramientasGuillermo Álvaro Rey
Lección "Desarrollo práctico de aplicaciones Linked Data: metodología y herramientas" del Curso de Verano 2010 de la UPM: "Linked Data: ¿Una oportunidad o un riesgo?"
Web search engines are constantly being developed in order to answer to user needs. This development process focuses not only on lexical pattern matching, but also on processing the sense of the query. There are two ways of doing this. The first is to extract content through Natural Language Processing (NLP); the second is to assign semantic descriptors from controlled languages. Therefore, the technological options available are either free text analysis, or semantic annotation. In the first case human interaction is essential; in the second one the quality of semantic retrieval by means of NLP is still under discussion. Although these solutions represent contrasting positions in the traditional debate on this matter, these methodologies are now mixing. In fact, semantic Web search engines need many pages to be annotated (which requires an enormous effort), so NLP represents an important help for automatic or semi-automatic annotation. At the same time, the precision of text analysis can be optimized by techniques of assignment applied by users and professionals. In conclusion, the trend is the development of collective knowledge systems that improve as more people participate, as they are based on human contributions. All of this will possibly be integrated by chunking, clustering, parsing, spell-checker and other NLP algorithms.
Presentación Segundo Taller: Mapa Mundial de Bibliotecas. Presencia LAC
El 2021 fue declarado Año Iberoamericano de las Bibliotecas en la pasada XX Conferencia Iberoamericana de Ministras y Ministros de Cultura de Iberoamérica, realizada en 2019.
Para ello la Sección de IFLA LAC con la finalidad de incrementar la presencia de las bibliotecas en el Mapa Mundial de Bibliotecas de IFLA
Sección América Latina y el Caribe IFLA LAC en el marco de las actividades conmemorativas del “Año Iberoamericano de las Bibliotecas” realizará el taller “Mapa Mundial de Bibliotecas. Presencia LAC ”
El taller se ejecutará de manera virtual, los días martes 19 y miércoles 20 de enero, su objetivo es la presencia de las bibliotecas latinoamericanas y caribeñas en el Mapa Mundial de Bibliotecas.
Más información:
https://www.ifla.org/node/93580?og=68
El Comité del seminario web de la Mesa Redonda de Relaciones Internacionales (IRRT) de ALA llevó a cabo una serie de seminarios web gratuitos centrados en las perspectivas de las bibliotecas de todo el mundo que se ocupan de COVID-19 en el que el Dr. Juan Miguel Palma, representó el 04 de junio a la Sección de América Latina y el Caribe.
Intervención de Ricardo Enrique Ortiz en el #ForoVirtual ¿Cómo las bibliotecas pueden extender sus servicios durante las cuarentenas? organizado con INFOTECARIOS, IFLA LAC y ASCOLBI.
Intervención de Jessica Castaño de la Asociación de Bibliotecarios Graduados de la República Argentina en el #ForoVirtual ¿Cómo las bibliotecas pueden extender sus servicios durante las cuarentenas? organizado con INFOTECARIOS, IFLA LAC y ASCOLBI.
Intervención del Fernando Gabriel Gutierrez, especialista en educación y nuevas tecnologías, máster en redes sociales y aprendizaje digital. Bibliotecario y docente especializado en tecnologías digitales.
Ponente del Foro Virtual ¿Cómo las bibliotecas pueden extender sus servicios durante las cuarentenas? organizado por #Infotecarios con el apoyo de la #SecciónIFLALAC y #ASCOLBI
Intervención del Dr. Jesús Lau en el #ForoVirtual ¿Cómo las bibliotecas pueden extender sus servicios durante las cuarentenas? organizado con INFOTECARIOS, IFLA LAC y ASCOLBI.
Presentación de Rodrigo Obrador Castro, Rodrigo Bermúdez Soto y Allen Guerra Bustamante para el Seminario Científico de IFLA LAC en Santiago, Chile (13-17, Marzo 2017).
Presentación de R. Bermúdez, R. Millán, A. Quiroz, P. Santibánez y L. Muñoz, de Biblioteca del Congreso Nacional de Chile (BCN) para el Seminario Científico de IFLA LAC en Santiago, Chile (13-17, Marzo 2017).
Presentación de Violeta Bertolini, de IFLA Advocacy Communications Officer, para el webinar "Las bibliotecas y la implementación de Agenda 2030 para el desarrollo sostenible" (https://youtu.be/jBsQlj1auzk)
Presentación de Loida Garcia-Febo para el webinar "Las bibliotecas e la implementación de la Agenda 2030 para el Desarrollo Sostenible" (https://youtu.be/jBsQlj1auzk)
Presentación de Ana María Talavera Ibarra para el webinar "Las bibliotecas y la implementación de la Agenda 2030 para el desarollo sostenible" https://youtu.be/jBsQlj1auzk
Más de IFLA Latin America and the Caribbean Section (13)
En esta segunda entrega, el periódico Tierra se adentra en la operación «Inherent Resolve», una de las dos en las que participa el Ejército de Tierra en Irak. Personal de las Fuerzas Aeromóviles del Ejército de Tierra y del Mando de Operaciones Especiales forman parte de la coalición internacional para la lucha contra el Dáesh.
Este documento presenta una guía para encontrar soluciones a problemas complejos. Explica qué es un problema público, cómo podríamos definir un problema público, cómo podríamos definir un problema público de forma innovadora, cómo podríamos resolver un problema público con herramientas de pensamiento sistémico, sistemas complejos y pensamiento sistémico: ¿con qué herramientas contamos?
Con esta píldora formativa podrás comprender cómo implementar herramientas como el Arco del proceso de resolución de problemas (Beth S. Noveck / The GovLab), GovLab's Public Problem Solving Canvas o la Guía Un conjunto de herramientas introductorias al pensamiento sistémico para funcionarios públicos del Government Office for Science del Gobierno de Reino Unido.
Transcripción. S.E. el Presidente de la República, Gabriel Boric Font, realiz...Andrés Retamales
Transcripción. S.E. el Presidente de la República, Gabriel Boric Font, realiza Cuenta Pública 2024 [1 de junio de 2024].
Disponible en:
https://prensa.presidencia.cl/lfi-content/uploads/2024/06/01.06.2024-cuenta-publica-ante-congreso-nacional.docx.pdf
Transcripción. S.E. el Presidente de la República, Gabriel Boric Font, realiz...
Modelo de enriquecimiento semántico de recursos de información
1. Modelo de enriquecimiento semántico de recursos de
información
Francisco Cifuentes Silva
fcifuentes <at> bcn.cl
14 de marzo de 2017
2. Qué es Enriquecimiento Semántico de Recursos de
Información - ESRI
Ampliar el ámbito de utilización de un RI (recurso de información) desde leíble por humanos
hasta legible por máquinas con la idea de identificar en detalle todo aquello que sea de
interés para su posterior extracción y consulta
Ejemplos
Para humano
Para máquina
fcifuentes <at> bcn.cl 2017-03-14 2/27
3. Por qué un modelo de ESRI
Para proveer un marco de referencia
Permite identificar a priori
fcifuentes <at> bcn.cl 2017-03-14 3/27
4. Un modelo de referencia habilita diversos mecanismos de provisión tecnológica:
Por qué un modelo de ESRI
fcifuentes <at> bcn.cl 2017-03-14 4/27
5. Permite recoger las mejores prácticas de diversos modelos existentes, como por ejemplo:
Por qué un modelo de ESRI
Schema.org OAI
AkomaNtoso
Modelo ESRI
Estándar documentos legales
Vocabulario
metadatos Web
Estándar para gestión
de repositorios
fcifuentes <at> bcn.cl 2017-03-14 5/27
6. Ventajas del enriquecimiento semántico
Marcaje
estructural
Nivel de
enriquecimiento
del recurso de
información
Texto plano
Marcaje
semántico
inteligente
Metadatos
básicos
Manual Semi-automático Automático
Naturaleza del proceso
Contenido no
estructurado
Leíble por humano
Contenido
estructurado
Leíble por humano y
reusable por máquina a
nivel de presentación
Contenido semántico
Leíble por humano,
reusable e interpretable
por máquina
Fuente: Clarke et al [1]
Contenido de
uso específico
Contenido
reutilizable
Contenido multi-
propósito
fcifuentes <at> bcn.cl 2017-03-14 6/27
7. ¿Qué se puede identificar en un recurso de
información?
URIs para entidades
Estructura del documento
Palabras clave
Sentimiento del
contenido
Documentos
relacionados
Lugares geográficos
en el contenido
Entidades
presentes
Recurso de información
fcifuentes <at> bcn.cl 2017-03-14 7/27
8. Por qué es necesario el uso de TI
Observación empírica en procesamiento de marcaje de documentos usando XML en BCN
fcifuentes <at> bcn.cl 2017-03-14 8/27
9. Conversores
Arquitectura TI de referencia para ESRI
SSL
XML
Modelos de datos / vocabularios
OCR
Speech to text
Análisis semántico
Analizador
Sentimiento
Asignación de
URI
Reconocedor de
entidades
Georeferencia-
ción semántica
Marcador
estructural
Extractor
palabras clave
Relacionador
elementos
Editor de
recursos
Linked Open Data
Big Data
fcifuentes <at> bcn.cl 2017-03-14 9/27
10. ¿Qué se puede identificar en un recurso de
información?
fcifuentes <at> bcn.cl 2017-03-14 10/27
11. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
fcifuentes <at> bcn.cl 2017-03-14 11/27
12. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Metadatos del documento
fcifuentes <at> bcn.cl 2017-03-14 12/27
13. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Ficha FRBR
fcifuentes <at> bcn.cl 2017-03-14 13/27
14. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Información
generada
fcifuentes <at> bcn.cl 2017-03-14 14/27
15. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Estructura básica
de contenido
fcifuentes <at> bcn.cl 2017-03-14 15/27
16. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Contenido marcado
fcifuentes <at> bcn.cl 2017-03-14 16/27
17. Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Metadatos de la
Sección
fcifuentes <at> bcn.cl 2017-03-14 17/27
18. Consideraciones a la hora de implementar
! Se requiere la implementación previa de una base de datos mínima de entidades
(ejemplo, una bd de autoridades).
! Las herramientas automáticas generalmente no son 100% precisas, facilitan la
labor humana pero no la reemplazan totalmente.
! Visión a mediano-largo plazo en la organización: se requiere espacio y tiempo
para ver resultados
fcifuentes <at> bcn.cl 2017-03-14 18/27
19. Extraer la información
" Extraer esta información
permitirá obtener datos granulares
" Un modelo basado en Linked
Open Data permitirá obtener
Linked Open Data
" Un recurso de información
enriquecido es solo un medio
fcifuentes <at> bcn.cl 2017-03-14 19/27
20. Ejemplos de productos utilizando ESRI
" Informes basados en estadística descriptiva: de qué político hablan más los
medios, qué lugar se menciona más, hablan cosas positivas o negativas, etc.
" Visualizaciones de datos: despliegue de información sobre el mapa, en líneas
de tiempo, grafos de relaciones u otros.
" Desarrollo de productos o servicios a la medida
fcifuentes <at> bcn.cl 2017-03-14 20/27
21. Ejemplos de productos utilizando ESRI
Documento enriquecido
Marcaje estructural, de
entidades y URIs para de
cada diario de sesión
fcifuentes <at> bcn.cl 2017-03-14 21/27
22. Ejemplos de productos utilizando ESRI
http://datos.bcn.cl/global-legislative-hackathon-2016/Hackaton/www/html/master.html
Menciones a
una región en
sesiones del
Congreso
Nacional
Utiliza diarios de
sesiones del
sistema Labor
Parlamentaria
fcifuentes <at> bcn.cl 2017-03-14 22/27
23. Ejemplos de productos utilizando ESRI
Sistema Historia de la Ley
Base de datos a partir de
intervenciones de
parlamentarios en diarios de
sesiones
http://www.bcn.cl/historiadelaley
fcifuentes <at> bcn.cl 2017-03-14 23/27
24. Ejemplos de productos utilizando ESRI
Es posible obtener un
dossier con intervenciones
de solo un parlamentario
asociado a la tramitación de
la ley
fcifuentes <at> bcn.cl 2017-03-14 24/27
25. Ejemplos de productos utilizando ESRI
http://tcqdev.edina.ac.uk/search/commodity/
Análisis de
consecuencias
históricas del
comercio
Se utilizaron
documentos de
comercio del siglo 19
para realizar análisis y
explicar el por qué
actual de la economía
Fuente: Hinrichs et al [2]
fcifuentes <at> bcn.cl 2017-03-14 25/27
26. Referencias
[1] How Smart Is Your Content? Using Semantic Enrichment to Improve Your User Experience
and Your Bottom Line - Michael Clarke and Pam Harley - Science Editor 2014, Vol 37, No 2,
pag 41
[2] Trading Consequences: A Case Study of Combining Text Mining and Visualization to
Facilitate Document Exploration - Uta Hinrichs Beatrice Alex Jim Clifford Andrew Watson
Aaron Quigley Ewan Klein Colin M. Coates - Digital Scholarship Humanities.
2015;30(suppl_1):i50-i75. doi:10.1093/llc/fqv046
fcifuentes <at> bcn.cl 2017-03-14 26/27