SlideShare una empresa de Scribd logo
1 de 36
Descargar para leer sin conexión
Utilidad de los datos enlazados
para la terminología
Jorge Gracia
Ontology Engineering Group
Dpto. de Inteligencia Artificial
Universidad Politécnica de Madrid
jgracia@fi.upm.es
Jornada sobre “TERMINESP y la terminología del español”
Representación de la Comisión Europea en España, Madrid
28 de octubre de 2016
Recursos lingüísticos
en la Web
2
2
Recursos lingüísticos en la Web
Recursos Lingüísticos Electrónicos
• corpus
• lexicones
• diccionarios
• “wordnets”
• terminologías
• etc.
3
Recursos lingüísticos en la Web
Actualmente…
• En formatos heterogéneos
• Diferentes esquemas de representación
• APIs no estándar
• Aislados entre sí (“data silos”)
• Diferentes niveles de acceso (desde “mándame un email” a servicios
web)
• Múltiples catálogos de recursos lingüísticos con diferentes metadatos y
esquemas de representación
Por tanto... el descubrimiento y reutilización de RLs resulta costoso en
tiempo y esfuerzo
4
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
“Red” (de
ordenadores)
5
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
Información
complementaria
pero no conectada
6
Datos enlazados para los
recursos lingüísticos
7
Datos enlazados
Prinicipos de los Datos Enlazados
(linked data principles)
1. Usar URIs (Uniform Resource Identifiers) para identificar
“cosas” en la Web
2. Usar HTTP URIs para que la gente pueda acceder a
esos identificadores y obtener algo
3. Cuando alguien accede a una URI, debe proporcionarse
información útil sobre el recurso que identifica (en RDF)
4. Incluir enlaces a otras URIs, para que se puedan
descubrir más cosas.
8
8
Datos enlazados
9
9
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
10
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
11
Datos enlazados
Algunos BENEFICIOS de los recursos lingüísticos
como datos enlazados
• Agregación e integración de recursos lingüísticos
• Los datos se exponen de manera estandarizada (SPARQL)
• Se facilita el descubrimiento de los datos
• Uso de vocabularios acordados para representar contenido
lingüístico
NIF
NLP Interchange Format
12
12
Datos enlazados
Linguistic Linked Data Cloud
Aparición de la “nube de datos lingüísticos enlazados”
Linguistic Linked Open Data (LLOD) cloud
13
http://linguistic-lod.org/llod-cloud
13
El modelo lemon-ontolex
14
lemon-ontolex
15
El núcleo del modelo
https://www.w3.org/2016/05/ontolex/
lemon-ontolex
16
El módulo vartrans
Datos enlazados en
terminologías:
Terminoteca RDF
17
Terminesp TERMCAT IATE
Otras
terminologías
Terminoteca RDF
18
Terminoteca RDF
TERMINOTECA RDF como demostrador del potencial de los datos
enlazados en terminologías
• Basado en Terminesp y Termcat
• Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín
http://linguistic.linkeddata.es/terminoteca/
19
Terminesp
TERMINESP es la base de datos terminológica creada por AETER
(Asociación Española de Terminología) en base a la terminología
contenida en las normas UNE (AENOR)
>30,000 términos técnicos con definiciones (en español)
Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, …
Traducciones al Inglés, francés, alemán, italiano, sueco
Denominación científica (latín)
20
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
Terminesp
4
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
21
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
TERMCAT es el centro de terminología de la lengua catalana,
responsable de la Terminologia Oberta:
Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad
de la información, Telecomunicaciones, Industria electrónica]
Traducciones al español, inglés y francés
Siglas, abreviaturas, sinónimos,…
22
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
23
Terminoteca RDF
Conversión de TERMINESP y TERMCAT a datos enlazados:
De acuerdo al modelo lemon-ontolex
Cada elemento lingüístico (lexical entry, lexical form, lexical sense,
translation, …) identificado con una URI
Creación de conceptos en skos para dar cuenta de la información
semántica
En TERMINESP:
>30000 conceptos creados
Añadida información de categorías gramaticales (part-of-speech)
Añadido el tipo de sintagma (nominal, adjetival, preposicional, …)
En TERMCAT:
> 7000 conceptos creados (tres dominios)
24
Terminoteca RDF
25
DE ES
SV
IT
FR
EN
ES
FR
EN
CA
Terminoteca RDF
26
DE ES
SV
IT
FR
EN
CA
Terminoteca-RDF
Terminoteca RDF
27
Terminoteca RDF
28
Terminoteca RDF
29
Terminoteca RDF
Interfaz web para obtener traducciones directas
http://linguistic.linkeddata.es/terminoteca/search/
30
Terminoteca RDF
31
Motor SPARQL para búsquedas semánticas más complejas
http://linguistic.linkeddata.es/terminoteca/sparql-editor/
Terminoteca RDF
Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp]
del término en español ‘amplificador’, indicando el origen de los datos y el
dominio de aplicación.”
32
wr_target provenance subject
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Telecomunicacions"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Telecomunicacions"@ca
"Verstärker"@de http://www.wikilengua.org
"Verstärket"@de http://www.wikilengua.org
Terminoteca RDF
33
Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés
que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].”
label initialism
"code division multiple access"@en "CDMA"@en
"time division multiple access"@en "TDMA"@en
"light-emitting diode"@en "LED"@en
"unipolar transistor"@en "FET"@en
"N-channel field-effect transistor"@en "N-FET"@en
"database management system"@en "DBMS"@en
"frequency division multiple access"@en "FDMA"@en
"low-noise amplifier"@en "LNA"@en
"automatic gain control"@en "AGC"@en
"programmable logic controller"@en "PLC"@en
"alternating current"@en "AC"@en
"direct current"@en "DC"@en
"programmable logic device"@en "PLD"@en
Conclusiones
Conclusiones
• Los datos enlazados pueden ser de utilidad para los recursos
lingüísticos en general y las terminologías en particular
• Iniciativa Terminoteca RDF: crear un grafo unificado de
terminologías en España basado en técnicas de datos enlazados
• Validación y enriquecimiento de los datos, y enlazado a otras
fuentes
• Futuros pasos:
• Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia,
Apertium)
• Evolución más allá de estado de “prototipo” de investigación
• Interacción más directa con los propios procesos de
creación/validación/publicación de datos de Terminesp y Termcat
35
¡Gracias!
36Ontology Engineering Group

Más contenido relacionado

Destacado

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseJorge Gracia
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton FacilitiesJulie Paton
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica powersara gomez
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestrepablovelascof
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxBorjafa
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitalesBenito Espinal
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de googlenahiarati
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflowSal D'Ambrosia
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 Shekhar Ibhrampurkar
 

Destacado (20)

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities
 
00008830
0000883000008830
00008830
 
Teatreeoil
TeatreeoilTeatreeoil
Teatreeoil
 
Ley lleras
Ley llerasLey lleras
Ley lleras
 
Can You Understand Me
Can You Understand MeCan You Understand Me
Can You Understand Me
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica power
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestre
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docx
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Lição 3 aluno
Lição 3 alunoLição 3 aluno
Lição 3 aluno
 
Cindys profile new 2017-rev1
Cindys profile new 2017-rev1Cindys profile new 2017-rev1
Cindys profile new 2017-rev1
 
Impresionismo
ImpresionismoImpresionismo
Impresionismo
 
Argentina mi país
Argentina mi paísArgentina mi país
Argentina mi país
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de google
 
Whassath
WhassathWhassath
Whassath
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflow
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Hsa portfolio 2017
Hsa portfolio 2017Hsa portfolio 2017
Hsa portfolio 2017
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11
 

Similar a Utilidad de los datos enlazados para la terminología

Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03jenorevi
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03GloriaTinoco
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosUCAB
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarDiego López-de-Ipiña González-de-Artaza
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales característicasPollis Morales
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasCarlos Arroyo
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1catecara
 

Similar a Utilidad de los datos enlazados para la terminología (20)

Ontologias
OntologiasOntologias
Ontologias
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de Datos
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicas
 
Web semántica
Web semánticaWeb semántica
Web semántica
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Dbpedia
DbpediaDbpedia
Dbpedia
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1
 

Último

Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosssuser948499
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfEDUARDO MAMANI MAMANI
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresamerca6
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfIrapuatoCmovamos
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria deCalet Cáceres Vergara
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfJC Díaz Herrera
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfIrapuatoCmovamos
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalIngrid459352
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicaciónJonathanAntonioMaldo
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfRodrigoBenitez38
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfJC Díaz Herrera
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfGEINER22
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitariachayananazcosimeon
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)estebancitoherrera
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...israel garcia
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfluisccollana
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaSilvia García
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,juberrodasflores
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechojuliosabino1
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciaferg6120
 

Último (20)

Data Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datosData Warehouse.gestion de bases de datos
Data Warehouse.gestion de bases de datos
 
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdfCUESTIONARIO A ADICCION A REDES SOCIALES.pdf
CUESTIONARIO A ADICCION A REDES SOCIALES.pdf
 
La importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresaLa importancia de las pruebas de producto para tu empresa
La importancia de las pruebas de producto para tu empresa
 
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdfREPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
REPORTE-HEMEROGRÁFICO-MARZO-2024-IRAPUATO-¿CÓMO VAMOS?.pdf
 
bases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria debases-cye-2024(2) una sola descarga en base de feria de
bases-cye-2024(2) una sola descarga en base de feria de
 
Las mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdfLas mujeres más ricas del mundo (2024).pdf
Las mujeres más ricas del mundo (2024).pdf
 
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdfREPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
REPORTE DE INCIDENCIA DELICTIVA MARZO 2024.pdf
 
Técnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dentalTécnica palatina baja, anestesiología dental
Técnica palatina baja, anestesiología dental
 
tipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicacióntipos de organización y sus objetivos y aplicación
tipos de organización y sus objetivos y aplicación
 
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdfCritica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
Critica 1 Grupo 10 RodrigoBenitez_GinaGadea_AlexisGonzález.pdf
 
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdfLos artistas mexicanos con más ventas de discos en la historia (2024).pdf
Los artistas mexicanos con más ventas de discos en la historia (2024).pdf
 
HABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdfHABILESASAMBLEA Para negocios independientes.pdf
HABILESASAMBLEA Para negocios independientes.pdf
 
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior UniversitariaSUNEDU - Superintendencia Nacional de Educación superior Universitaria
SUNEDU - Superintendencia Nacional de Educación superior Universitaria
 
El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)El Teatro musical (qué es, cuál es su historia y trayectoria...)
El Teatro musical (qué es, cuál es su historia y trayectoria...)
 
Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...Cuáles son las características biológicas que están marcadas en tu individual...
Cuáles son las características biológicas que están marcadas en tu individual...
 
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdfPREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
PREGRADO-PRESENCIAL-FASE-C-202401 (1).pdf
 
Unidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y químicaUnidad 3 Elementos y compuestos. Física y química
Unidad 3 Elementos y compuestos. Física y química
 
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
Ivu- taller de diseño arquitectonico l , adicion y sustraccion de cubos,
 
LA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derechoLA LEY DE LAS XII TABLAS en el curso de derecho
LA LEY DE LAS XII TABLAS en el curso de derecho
 
triptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescenciatriptico-de-las-drogas en la adolescencia
triptico-de-las-drogas en la adolescencia
 

Utilidad de los datos enlazados para la terminología

  • 1. Utilidad de los datos enlazados para la terminología Jorge Gracia Ontology Engineering Group Dpto. de Inteligencia Artificial Universidad Politécnica de Madrid jgracia@fi.upm.es Jornada sobre “TERMINESP y la terminología del español” Representación de la Comisión Europea en España, Madrid 28 de octubre de 2016
  • 3. Recursos lingüísticos en la Web Recursos Lingüísticos Electrónicos • corpus • lexicones • diccionarios • “wordnets” • terminologías • etc. 3
  • 4. Recursos lingüísticos en la Web Actualmente… • En formatos heterogéneos • Diferentes esquemas de representación • APIs no estándar • Aislados entre sí (“data silos”) • Diferentes niveles de acceso (desde “mándame un email” a servicios web) • Múltiples catálogos de recursos lingüísticos con diferentes metadatos y esquemas de representación Por tanto... el descubrimiento y reutilización de RLs resulta costoso en tiempo y esfuerzo 4
  • 5. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web “Red” (de ordenadores) 5
  • 6. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web Información complementaria pero no conectada 6
  • 7. Datos enlazados para los recursos lingüísticos 7
  • 8. Datos enlazados Prinicipos de los Datos Enlazados (linked data principles) 1. Usar URIs (Uniform Resource Identifiers) para identificar “cosas” en la Web 2. Usar HTTP URIs para que la gente pueda acceder a esos identificadores y obtener algo 3. Cuando alguien accede a una URI, debe proporcionarse información útil sobre el recurso que identifica (en RDF) 4. Incluir enlaces a otras URIs, para que se puedan descubrir más cosas. 8 8
  • 10. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 10
  • 11. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 11
  • 12. Datos enlazados Algunos BENEFICIOS de los recursos lingüísticos como datos enlazados • Agregación e integración de recursos lingüísticos • Los datos se exponen de manera estandarizada (SPARQL) • Se facilita el descubrimiento de los datos • Uso de vocabularios acordados para representar contenido lingüístico NIF NLP Interchange Format 12 12
  • 13. Datos enlazados Linguistic Linked Data Cloud Aparición de la “nube de datos lingüísticos enlazados” Linguistic Linked Open Data (LLOD) cloud 13 http://linguistic-lod.org/llod-cloud 13
  • 15. lemon-ontolex 15 El núcleo del modelo https://www.w3.org/2016/05/ontolex/
  • 19. Terminoteca RDF TERMINOTECA RDF como demostrador del potencial de los datos enlazados en terminologías • Basado en Terminesp y Termcat • Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín http://linguistic.linkeddata.es/terminoteca/ 19
  • 20. Terminesp TERMINESP es la base de datos terminológica creada por AETER (Asociación Española de Terminología) en base a la terminología contenida en las normas UNE (AENOR) >30,000 términos técnicos con definiciones (en español) Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, … Traducciones al Inglés, francés, alemán, italiano, sueco Denominación científica (latín) 20 http://www.wikilengua.org/index.php/Wikilengua:Terminesp
  • 22. Termcat http://www.termcat.cat/en/Terminologia_Oberta/ TERMCAT es el centro de terminología de la lengua catalana, responsable de la Terminologia Oberta: Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad de la información, Telecomunicaciones, Industria electrónica] Traducciones al español, inglés y francés Siglas, abreviaturas, sinónimos,… 22
  • 24. Terminoteca RDF Conversión de TERMINESP y TERMCAT a datos enlazados: De acuerdo al modelo lemon-ontolex Cada elemento lingüístico (lexical entry, lexical form, lexical sense, translation, …) identificado con una URI Creación de conceptos en skos para dar cuenta de la información semántica En TERMINESP: >30000 conceptos creados Añadida información de categorías gramaticales (part-of-speech) Añadido el tipo de sintagma (nominal, adjetival, preposicional, …) En TERMCAT: > 7000 conceptos creados (tres dominios) 24
  • 30. Terminoteca RDF Interfaz web para obtener traducciones directas http://linguistic.linkeddata.es/terminoteca/search/ 30
  • 31. Terminoteca RDF 31 Motor SPARQL para búsquedas semánticas más complejas http://linguistic.linkeddata.es/terminoteca/sparql-editor/
  • 32. Terminoteca RDF Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp] del término en español ‘amplificador’, indicando el origen de los datos y el dominio de aplicación.” 32 wr_target provenance subject "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Telecomunicacions"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Telecomunicacions"@ca "Verstärker"@de http://www.wikilengua.org "Verstärket"@de http://www.wikilengua.org
  • 33. Terminoteca RDF 33 Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].” label initialism "code division multiple access"@en "CDMA"@en "time division multiple access"@en "TDMA"@en "light-emitting diode"@en "LED"@en "unipolar transistor"@en "FET"@en "N-channel field-effect transistor"@en "N-FET"@en "database management system"@en "DBMS"@en "frequency division multiple access"@en "FDMA"@en "low-noise amplifier"@en "LNA"@en "automatic gain control"@en "AGC"@en "programmable logic controller"@en "PLC"@en "alternating current"@en "AC"@en "direct current"@en "DC"@en "programmable logic device"@en "PLD"@en
  • 35. Conclusiones • Los datos enlazados pueden ser de utilidad para los recursos lingüísticos en general y las terminologías en particular • Iniciativa Terminoteca RDF: crear un grafo unificado de terminologías en España basado en técnicas de datos enlazados • Validación y enriquecimiento de los datos, y enlazado a otras fuentes • Futuros pasos: • Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia, Apertium) • Evolución más allá de estado de “prototipo” de investigación • Interacción más directa con los propios procesos de creación/validación/publicación de datos de Terminesp y Termcat 35