SlideShare una empresa de Scribd logo
1 de 29
Modelo de enriquecimiento semántico de recursos de
información
Francisco Cifuentes Silva
fcifuentes <at> bcn.cl
14 de marzo de 2017
Motivación
En el contexto de la meta 16.10 de la Agenda 2030 de las Naciones Unidas:
“Asegurar el acceso público a la información y proteger las libertades
fundamentales, de conformidad con las legislaciones nacionales y los
acuerdos internacionales”
La extracción de conocimientos desde documentos no
estructurados permite ampliar el acceso público a la información.
fcifuentes <at> bcn.cl 2017-03-14 2/29
Qué es Enriquecimiento Semántico de Recursos de
Información - ESRI
Ampliar el ámbito de utilización de un RI (recurso de información) desde leíble por humanos
hasta legible por máquinas con la idea de identificar en detalle todo aquello que sea de
interés para su posterior extracción y consulta
Ejemplos
Para humano
Para máquina
fcifuentes <at> bcn.cl 2017-03-14 3/29
Por qué un modelo de ESRI
Para proveer un marco de referencia
Permite identificar a priori
fcifuentes <at> bcn.cl 2017-03-14 4/29
Un modelo de referencia habilita diversos mecanismos de provisión tecnológica:
Por qué un modelo de ESRI
fcifuentes <at> bcn.cl 2017-03-14 5/29
Permite recoger las mejores prácticas de diversos modelos existentes, como por ejemplo:
Por qué un modelo de ESRI
Schema.org OAI
AkomaNtoso
Modelo ESRI
Estándar documentos legales
Vocabulario
metadatos Web
Estándar para gestión
de repositorios
fcifuentes <at> bcn.cl 2017-03-14 6/29
Ventajas del enriquecimiento semántico
Marcaje
estructural
Nivel de
enriquecimiento
del recurso de
información
Texto plano
Marcaje
semántico
inteligente
Metadatos
básicos
Manual Semi-automático Automático
Naturaleza del proceso
Contenido no
estructurado
Leíble por humano
Contenido
estructurado
Leíble por humano y
reusable por máquina a
nivel de presentación
Contenido semántico
Leíble por humano,
reusable e interpretable
por máquina
Fuente: Clarke et al [1]
Contenido de
uso específico
Contenido
reutilizable
Contenido multi-
propósito
fcifuentes <at> bcn.cl 2017-03-14 7/29
¿Qué se puede identificar en un recurso de
información?
URIs para entidades
Estructura del documento
Palabras clave
Sentimiento del
contenido
Documentos
relacionados
Lugares geográficos
en el contenido
Entidades
presentes
Recurso de información
fcifuentes <at> bcn.cl 2017-03-14 8/29
Por qué es necesario el uso de TI
Observación empírica en procesamiento de marcaje de documentos usando XML en BCN
fcifuentes <at> bcn.cl 2017-03-14 9/29
Conversores
Arquitectura TI de referencia para ESRI
SSL
XML
Modelos de datos / vocabularios
OCR
Speech to text
Análisis semántico
Analizador
Sentimiento
Asignación de
URI
Reconocedor de
entidades
Georeferencia-
ción semántica
Marcador
estructural
Extractor
palabras clave
Relacionador
elementos
Editor de
recursos
Linked Open Data
Big Data
fcifuentes <at> bcn.cl 2017-03-14 10/29
¿Qué se puede identificar en un recurso de
información?
fcifuentes <at> bcn.cl 2017-03-14 11/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
fcifuentes <at> bcn.cl 2017-03-14 12/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Metadatos del documento
fcifuentes <at> bcn.cl 2017-03-14 13/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Ficha FRBR
fcifuentes <at> bcn.cl 2017-03-14 14/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Información
generada
fcifuentes <at> bcn.cl 2017-03-14 15/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Estructura básica
de contenido
fcifuentes <at> bcn.cl 2017-03-14 16/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Contenido marcado
fcifuentes <at> bcn.cl 2017-03-14 17/29
Esquema XML de referencia para marcaje enriquecido
Borrador 1.0
Metadatos de la
Sección
fcifuentes <at> bcn.cl 2017-03-14 18/29
Consideraciones a la hora de implementar
 Se requiere la implementación previa de una base de datos mínima de
entidades (ejemplo, una bd de autoridades).
 Las herramientas automáticas generalmente no son 100% precisas, facilitan la
labor humana pero no la reemplazan totalmente.
 Visión a mediano-largo plazo en la organización: se requiere espacio y tiempo
para ver resultados
fcifuentes <at> bcn.cl 2017-03-14 19/29
Extraer la información
 Extraer esta información
permitirá obtener datos granulares
 Un modelo basado contenido
semántico permitirá obtener
Linked Open Data
 Un recurso de información
enriquecido es solo un medio
fcifuentes <at> bcn.cl 2017-03-14 20/29
Ejemplos de productos utilizando ESRI
 Informes basados en estadística descriptiva: de qué político hablan más los
medios, qué lugar se menciona más, hablan cosas positivas o negativas, etc.
 Visualizaciones de datos: despliegue de información sobre el mapa, en líneas
de tiempo, grafos de relaciones u otros.
 Desarrollo de productos o servicios a la medida
fcifuentes <at> bcn.cl 2017-03-14 21/29
Ejemplos de productos utilizando ESRI
Documento enriquecido
Marcaje estructural, de
entidades y URIs para
cada diario de sesión
fcifuentes <at> bcn.cl 2017-03-14 22/29
Ejemplos de productos utilizando ESRI
http://datos.bcn.cl/global-legislative-hackathon-2016/Hackaton/www/html/master.html
Menciones a
una región en
sesiones del
Congreso
Nacional
Utiliza diarios de
sesiones del
sistema Labor
Parlamentaria
fcifuentes <at> bcn.cl 2017-03-14 23/29
Ejemplos de productos utilizando ESRI
Sistema Historia de la Ley
Base de datos a partir de
intervenciones de
parlamentarios en diarios de
sesiones
http://www.bcn.cl/historiadelaley
fcifuentes <at> bcn.cl 2017-03-14 24/29
Ejemplos de productos utilizando ESRI
Es posible obtener un
dossier con intervenciones
de solo un parlamentario
asociado a la tramitación de
la ley
fcifuentes <at> bcn.cl 2017-03-14 25/29
Ejemplos de productos utilizando ESRI
fcifuentes <at> bcn.cl 2017-03-14 26/29
Dirección de Bibliotecas y Centro Documental del Poder Judicial
Plataforma de minería de
texto y extracción de
información desde
sentencias dictadas por
la Excma. Corte Suprema
Ejemplos de productos utilizando ESRI
http://tcqdev.edina.ac.uk/search/commodity/
Análisis de
consecuencias
históricas del
comercio
Se utilizaron
documentos de
comercio del siglo 19
para realizar análisis y
explicar el por qué
actual de la economía
Fuente: Hinrichs et al [2]
fcifuentes <at> bcn.cl 2017-03-14 27/29
Referencias
[1] How Smart Is Your Content? Using Semantic Enrichment to Improve Your User Experience
and Your Bottom Line - Michael Clarke and Pam Harley - Science Editor 2014, Vol 37, No 2,
pag 41
[2] Trading Consequences: A Case Study of Combining Text Mining and Visualization to
Facilitate Document Exploration - Uta Hinrichs Beatrice Alex Jim Clifford Andrew Watson
Aaron Quigley Ewan Klein Colin M. Coates - Digital Scholarship Humanities.
2015;30(suppl_1):i50-i75. doi:10.1093/llc/fqv046
fcifuentes <at> bcn.cl 2017-03-14 28/29
Fin
fcifuentes <at> bcn.cl 2017-03-14 29/29

Más contenido relacionado

Destacado

Hoe krijgen we ze over de brug VELON 2009
Hoe krijgen we ze over de brug VELON 2009Hoe krijgen we ze over de brug VELON 2009
Hoe krijgen we ze over de brug VELON 2009Ale Gercama
 
Serikat Buruh dan Media Propaganda
Serikat Buruh dan Media PropagandaSerikat Buruh dan Media Propaganda
Serikat Buruh dan Media PropagandaPindai Media
 
Nuevas formas de aprender en siglo xxi
Nuevas formas de aprender en siglo xxiNuevas formas de aprender en siglo xxi
Nuevas formas de aprender en siglo xxiMiguel Dupox
 
Corrientes historiográficas
Corrientes historiográficasCorrientes historiográficas
Corrientes historiográficaskarina_fabiola
 
Evaluación en el marco de la lomce. presentación de María Luisa Suárez Álvarez
Evaluación en el marco de la lomce. presentación de María Luisa Suárez ÁlvarezEvaluación en el marco de la lomce. presentación de María Luisa Suárez Álvarez
Evaluación en el marco de la lomce. presentación de María Luisa Suárez ÁlvarezCPR Oviedo
 
Evaluation of focus groups thoughts on our documentary
Evaluation of focus groups thoughts on our documentaryEvaluation of focus groups thoughts on our documentary
Evaluation of focus groups thoughts on our documentaryA2 Media Column D
 

Destacado (13)

defensive
defensivedefensive
defensive
 
Hoe krijgen we ze over de brug VELON 2009
Hoe krijgen we ze over de brug VELON 2009Hoe krijgen we ze over de brug VELON 2009
Hoe krijgen we ze over de brug VELON 2009
 
Serikat Buruh dan Media Propaganda
Serikat Buruh dan Media PropagandaSerikat Buruh dan Media Propaganda
Serikat Buruh dan Media Propaganda
 
Orientacion pro
Orientacion proOrientacion pro
Orientacion pro
 
Ci
CiCi
Ci
 
Nuevas formas de aprender en siglo xxi
Nuevas formas de aprender en siglo xxiNuevas formas de aprender en siglo xxi
Nuevas formas de aprender en siglo xxi
 
Corrientes historiográficas
Corrientes historiográficasCorrientes historiográficas
Corrientes historiográficas
 
Interview
InterviewInterview
Interview
 
Documentary moodboard
Documentary moodboardDocumentary moodboard
Documentary moodboard
 
Channels
ChannelsChannels
Channels
 
ΜΙΚΡΟΒΙΟΛΟΓΙΚΕΣ ΜΕΘΟΔΟΙ ΔΙΑΓΝΩΣΗΣ
ΜΙΚΡΟΒΙΟΛΟΓΙΚΕΣ ΜΕΘΟΔΟΙ ΔΙΑΓΝΩΣΗΣ ΜΙΚΡΟΒΙΟΛΟΓΙΚΕΣ ΜΕΘΟΔΟΙ ΔΙΑΓΝΩΣΗΣ
ΜΙΚΡΟΒΙΟΛΟΓΙΚΕΣ ΜΕΘΟΔΟΙ ΔΙΑΓΝΩΣΗΣ
 
Evaluación en el marco de la lomce. presentación de María Luisa Suárez Álvarez
Evaluación en el marco de la lomce. presentación de María Luisa Suárez ÁlvarezEvaluación en el marco de la lomce. presentación de María Luisa Suárez Álvarez
Evaluación en el marco de la lomce. presentación de María Luisa Suárez Álvarez
 
Evaluation of focus groups thoughts on our documentary
Evaluation of focus groups thoughts on our documentaryEvaluation of focus groups thoughts on our documentary
Evaluation of focus groups thoughts on our documentary
 

Similar a Modelo de enriquecimiento semántico de recursos de información

Apresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - PeruApresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - PeruFrederico Bortolato
 
Conferencia Datos Abiertos Regionales, Montevideo, 2013
Conferencia Datos Abiertos Regionales, Montevideo, 2013Conferencia Datos Abiertos Regionales, Montevideo, 2013
Conferencia Datos Abiertos Regionales, Montevideo, 2013Christian Sifaqui
 
Soluciones de búsqueda corporativa
Soluciones de búsqueda corporativaSoluciones de búsqueda corporativa
Soluciones de búsqueda corporativaraulpri
 
Revistas e internet
Revistas e internetRevistas e internet
Revistas e internetLatindex
 
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...Biblioteca Nacional de España
 
Cómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosCómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosGobierno Local
 
Interacción con la Web Semántica mediante Rhizomer
Interacción con la Web Semántica mediante RhizomerInteracción con la Web Semántica mediante Rhizomer
Interacción con la Web Semántica mediante RhizomerRoberto García
 
Web 2.0 capitulo 3
Web 2.0 capitulo 3Web 2.0 capitulo 3
Web 2.0 capitulo 3Martha Solis
 
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas DigitalesAprender 3C
 
Software libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de CádizSoftware libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de CádizAntonio García-Domínguez
 
Presentacion Construmatica Simo
Presentacion Construmatica SimoPresentacion Construmatica Simo
Presentacion Construmatica Simoladrillosybits
 
Open Data: ¿por qué? y ¿cómo?
Open Data: ¿por qué? y ¿cómo?Open Data: ¿por qué? y ¿cómo?
Open Data: ¿por qué? y ¿cómo?Open Data @ CTIC
 

Similar a Modelo de enriquecimiento semántico de recursos de información (20)

Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Apresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - PeruApresentação - II Jornada Nacional de Investigación - ULADECH - Peru
Apresentação - II Jornada Nacional de Investigación - ULADECH - Peru
 
Ensayo usos de los buscadores en internet
Ensayo usos de los buscadores en internetEnsayo usos de los buscadores en internet
Ensayo usos de los buscadores en internet
 
Conferencia Datos Abiertos Regionales, Montevideo, 2013
Conferencia Datos Abiertos Regionales, Montevideo, 2013Conferencia Datos Abiertos Regionales, Montevideo, 2013
Conferencia Datos Abiertos Regionales, Montevideo, 2013
 
Web3.0.docx
Web3.0.docxWeb3.0.docx
Web3.0.docx
 
Soluciones de búsqueda corporativa
Soluciones de búsqueda corporativaSoluciones de búsqueda corporativa
Soluciones de búsqueda corporativa
 
Herramienta del controller: BI
Herramienta del controller: BIHerramienta del controller: BI
Herramienta del controller: BI
 
Revistas e internet
Revistas e internetRevistas e internet
Revistas e internet
 
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...
Espacios de colaboración para la gestión documental. Intranet de la BNE. Ana ...
 
Cómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datosCómo desarrollar bienes y servicios públicos con datos
Cómo desarrollar bienes y servicios públicos con datos
 
Interacción con la Web Semántica mediante Rhizomer
Interacción con la Web Semántica mediante RhizomerInteracción con la Web Semántica mediante Rhizomer
Interacción con la Web Semántica mediante Rhizomer
 
Web 2.0 capitulo 3
Web 2.0 capitulo 3Web 2.0 capitulo 3
Web 2.0 capitulo 3
 
Induccion
InduccionInduccion
Induccion
 
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
#Aprender3C - Métricas y estadísticas en Repositorios y Bibliotecas Digitales
 
web 1.0, 2.0 ,3.0
web 1.0, 2.0 ,3.0web 1.0, 2.0 ,3.0
web 1.0, 2.0 ,3.0
 
Aporte Internet
Aporte InternetAporte Internet
Aporte Internet
 
Software libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de CádizSoftware libre para la integración de información en la Universidad de Cádiz
Software libre para la integración de información en la Universidad de Cádiz
 
Presentacion Construmatica Simo
Presentacion Construmatica SimoPresentacion Construmatica Simo
Presentacion Construmatica Simo
 
Open Data: ¿por qué? y ¿cómo?
Open Data: ¿por qué? y ¿cómo?Open Data: ¿por qué? y ¿cómo?
Open Data: ¿por qué? y ¿cómo?
 
Web of data y los repositorios institucionales
Web of data y los repositorios institucionalesWeb of data y los repositorios institucionales
Web of data y los repositorios institucionales
 

Más de Francisco Cifuentes Silva

Más de Francisco Cifuentes Silva (11)

Tecnologías Semánticas para análisis político y legislativo
Tecnologías Semánticas para análisis político y legislativoTecnologías Semánticas para análisis político y legislativo
Tecnologías Semánticas para análisis político y legislativo
 
Experiencias con tecnologías de Web Semántica en la Biblioteca del Congreso N...
Experiencias con tecnologías de Web Semántica en la Biblioteca del Congreso N...Experiencias con tecnologías de Web Semántica en la Biblioteca del Congreso N...
Experiencias con tecnologías de Web Semántica en la Biblioteca del Congreso N...
 
Service-Oriented Architecture for automatic markup of documents
Service-Oriented Architecture for automatic markup of documentsService-Oriented Architecture for automatic markup of documents
Service-Oriented Architecture for automatic markup of documents
 
Introduccion a OpenData
Introduccion a OpenDataIntroduccion a OpenData
Introduccion a OpenData
 
Curso ontologías - Modelando en E-R y RDF Schema
Curso ontologías - Modelando en E-R y RDF SchemaCurso ontologías - Modelando en E-R y RDF Schema
Curso ontologías - Modelando en E-R y RDF Schema
 
Introduccion - Curso Ontologías
Introduccion - Curso OntologíasIntroduccion - Curso Ontologías
Introduccion - Curso Ontologías
 
Presentacion tfm
Presentacion tfmPresentacion tfm
Presentacion tfm
 
Presentación Linked data BCN - Red linked data españa
Presentación Linked  data BCN  - Red linked data españaPresentación Linked  data BCN  - Red linked data españa
Presentación Linked data BCN - Red linked data españa
 
Cuántos Rostros!
Cuántos Rostros!Cuántos Rostros!
Cuántos Rostros!
 
Prototipe v2
Prototipe v2Prototipe v2
Prototipe v2
 
Usability Fails
Usability FailsUsability Fails
Usability Fails
 

Último

KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersIván López Martín
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfSergioMendoza354770
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...AlanCedillo9
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...FacuMeza2
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 

Último (19)

KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 TestcontainersSalmorejoTech 2024 - Spring Boot <3 Testcontainers
SalmorejoTech 2024 - Spring Boot <3 Testcontainers
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdfPARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
PARTES DE UN OSCILOSCOPIO ANALOGICO .pdf
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
Instrumentación Hoy_ INTERPRETAR EL DIAGRAMA UNIFILAR GENERAL DE UNA PLANTA I...
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
ATAJOS DE WINDOWS. Los diferentes atajos para utilizar en windows y ser más e...
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 

Modelo de enriquecimiento semántico de recursos de información

  • 1. Modelo de enriquecimiento semántico de recursos de información Francisco Cifuentes Silva fcifuentes <at> bcn.cl 14 de marzo de 2017
  • 2. Motivación En el contexto de la meta 16.10 de la Agenda 2030 de las Naciones Unidas: “Asegurar el acceso público a la información y proteger las libertades fundamentales, de conformidad con las legislaciones nacionales y los acuerdos internacionales” La extracción de conocimientos desde documentos no estructurados permite ampliar el acceso público a la información. fcifuentes <at> bcn.cl 2017-03-14 2/29
  • 3. Qué es Enriquecimiento Semántico de Recursos de Información - ESRI Ampliar el ámbito de utilización de un RI (recurso de información) desde leíble por humanos hasta legible por máquinas con la idea de identificar en detalle todo aquello que sea de interés para su posterior extracción y consulta Ejemplos Para humano Para máquina fcifuentes <at> bcn.cl 2017-03-14 3/29
  • 4. Por qué un modelo de ESRI Para proveer un marco de referencia Permite identificar a priori fcifuentes <at> bcn.cl 2017-03-14 4/29
  • 5. Un modelo de referencia habilita diversos mecanismos de provisión tecnológica: Por qué un modelo de ESRI fcifuentes <at> bcn.cl 2017-03-14 5/29
  • 6. Permite recoger las mejores prácticas de diversos modelos existentes, como por ejemplo: Por qué un modelo de ESRI Schema.org OAI AkomaNtoso Modelo ESRI Estándar documentos legales Vocabulario metadatos Web Estándar para gestión de repositorios fcifuentes <at> bcn.cl 2017-03-14 6/29
  • 7. Ventajas del enriquecimiento semántico Marcaje estructural Nivel de enriquecimiento del recurso de información Texto plano Marcaje semántico inteligente Metadatos básicos Manual Semi-automático Automático Naturaleza del proceso Contenido no estructurado Leíble por humano Contenido estructurado Leíble por humano y reusable por máquina a nivel de presentación Contenido semántico Leíble por humano, reusable e interpretable por máquina Fuente: Clarke et al [1] Contenido de uso específico Contenido reutilizable Contenido multi- propósito fcifuentes <at> bcn.cl 2017-03-14 7/29
  • 8. ¿Qué se puede identificar en un recurso de información? URIs para entidades Estructura del documento Palabras clave Sentimiento del contenido Documentos relacionados Lugares geográficos en el contenido Entidades presentes Recurso de información fcifuentes <at> bcn.cl 2017-03-14 8/29
  • 9. Por qué es necesario el uso de TI Observación empírica en procesamiento de marcaje de documentos usando XML en BCN fcifuentes <at> bcn.cl 2017-03-14 9/29
  • 10. Conversores Arquitectura TI de referencia para ESRI SSL XML Modelos de datos / vocabularios OCR Speech to text Análisis semántico Analizador Sentimiento Asignación de URI Reconocedor de entidades Georeferencia- ción semántica Marcador estructural Extractor palabras clave Relacionador elementos Editor de recursos Linked Open Data Big Data fcifuentes <at> bcn.cl 2017-03-14 10/29
  • 11. ¿Qué se puede identificar en un recurso de información? fcifuentes <at> bcn.cl 2017-03-14 11/29
  • 12. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 fcifuentes <at> bcn.cl 2017-03-14 12/29
  • 13. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Metadatos del documento fcifuentes <at> bcn.cl 2017-03-14 13/29
  • 14. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Ficha FRBR fcifuentes <at> bcn.cl 2017-03-14 14/29
  • 15. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Información generada fcifuentes <at> bcn.cl 2017-03-14 15/29
  • 16. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Estructura básica de contenido fcifuentes <at> bcn.cl 2017-03-14 16/29
  • 17. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Contenido marcado fcifuentes <at> bcn.cl 2017-03-14 17/29
  • 18. Esquema XML de referencia para marcaje enriquecido Borrador 1.0 Metadatos de la Sección fcifuentes <at> bcn.cl 2017-03-14 18/29
  • 19. Consideraciones a la hora de implementar  Se requiere la implementación previa de una base de datos mínima de entidades (ejemplo, una bd de autoridades).  Las herramientas automáticas generalmente no son 100% precisas, facilitan la labor humana pero no la reemplazan totalmente.  Visión a mediano-largo plazo en la organización: se requiere espacio y tiempo para ver resultados fcifuentes <at> bcn.cl 2017-03-14 19/29
  • 20. Extraer la información  Extraer esta información permitirá obtener datos granulares  Un modelo basado contenido semántico permitirá obtener Linked Open Data  Un recurso de información enriquecido es solo un medio fcifuentes <at> bcn.cl 2017-03-14 20/29
  • 21. Ejemplos de productos utilizando ESRI  Informes basados en estadística descriptiva: de qué político hablan más los medios, qué lugar se menciona más, hablan cosas positivas o negativas, etc.  Visualizaciones de datos: despliegue de información sobre el mapa, en líneas de tiempo, grafos de relaciones u otros.  Desarrollo de productos o servicios a la medida fcifuentes <at> bcn.cl 2017-03-14 21/29
  • 22. Ejemplos de productos utilizando ESRI Documento enriquecido Marcaje estructural, de entidades y URIs para cada diario de sesión fcifuentes <at> bcn.cl 2017-03-14 22/29
  • 23. Ejemplos de productos utilizando ESRI http://datos.bcn.cl/global-legislative-hackathon-2016/Hackaton/www/html/master.html Menciones a una región en sesiones del Congreso Nacional Utiliza diarios de sesiones del sistema Labor Parlamentaria fcifuentes <at> bcn.cl 2017-03-14 23/29
  • 24. Ejemplos de productos utilizando ESRI Sistema Historia de la Ley Base de datos a partir de intervenciones de parlamentarios en diarios de sesiones http://www.bcn.cl/historiadelaley fcifuentes <at> bcn.cl 2017-03-14 24/29
  • 25. Ejemplos de productos utilizando ESRI Es posible obtener un dossier con intervenciones de solo un parlamentario asociado a la tramitación de la ley fcifuentes <at> bcn.cl 2017-03-14 25/29
  • 26. Ejemplos de productos utilizando ESRI fcifuentes <at> bcn.cl 2017-03-14 26/29 Dirección de Bibliotecas y Centro Documental del Poder Judicial Plataforma de minería de texto y extracción de información desde sentencias dictadas por la Excma. Corte Suprema
  • 27. Ejemplos de productos utilizando ESRI http://tcqdev.edina.ac.uk/search/commodity/ Análisis de consecuencias históricas del comercio Se utilizaron documentos de comercio del siglo 19 para realizar análisis y explicar el por qué actual de la economía Fuente: Hinrichs et al [2] fcifuentes <at> bcn.cl 2017-03-14 27/29
  • 28. Referencias [1] How Smart Is Your Content? Using Semantic Enrichment to Improve Your User Experience and Your Bottom Line - Michael Clarke and Pam Harley - Science Editor 2014, Vol 37, No 2, pag 41 [2] Trading Consequences: A Case Study of Combining Text Mining and Visualization to Facilitate Document Exploration - Uta Hinrichs Beatrice Alex Jim Clifford Andrew Watson Aaron Quigley Ewan Klein Colin M. Coates - Digital Scholarship Humanities. 2015;30(suppl_1):i50-i75. doi:10.1093/llc/fqv046 fcifuentes <at> bcn.cl 2017-03-14 28/29
  • 29. Fin fcifuentes <at> bcn.cl 2017-03-14 29/29