SlideShare una empresa de Scribd logo
Utilidad de los datos enlazados
para la terminología
Jorge Gracia
Ontology Engineering Group
Dpto. de Inteligencia Artificial
Universidad Politécnica de Madrid
jgracia@fi.upm.es
Jornada sobre “TERMINESP y la terminología del español”
Representación de la Comisión Europea en España, Madrid
28 de octubre de 2016
Recursos lingüísticos
en la Web
2
2
Recursos lingüísticos en la Web
Recursos Lingüísticos Electrónicos
• corpus
• lexicones
• diccionarios
• “wordnets”
• terminologías
• etc.
3
Recursos lingüísticos en la Web
Actualmente…
• En formatos heterogéneos
• Diferentes esquemas de representación
• APIs no estándar
• Aislados entre sí (“data silos”)
• Diferentes niveles de acceso (desde “mándame un email” a servicios
web)
• Múltiples catálogos de recursos lingüísticos con diferentes metadatos y
esquemas de representación
Por tanto... el descubrimiento y reutilización de RLs resulta costoso en
tiempo y esfuerzo
4
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
“Red” (de
ordenadores)
5
*Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell
“Red”
Etimología: Del latin “rete”
Género: “f”
Definición: “Conjunto de
ordenadores o de equipos
informáticos conectados entre
sí….”
“Red”
Traducciones: “xarxa”(ca), “rede”(ga), …
“Red”
Norma: UNE 21302-131
Inglés: network
Alemán: Netzwerk
“Red”
Pronunciation: [red]
Grammar category: sustantivo femenino
Singular: “red”
Plural: “redes”
“Red_de_computadores”
Category: redes informáticas
Image
Recursos lingüísticos en la Web
Información
complementaria
pero no conectada
6
Datos enlazados para los
recursos lingüísticos
7
Datos enlazados
Prinicipos de los Datos Enlazados
(linked data principles)
1. Usar URIs (Uniform Resource Identifiers) para identificar
“cosas” en la Web
2. Usar HTTP URIs para que la gente pueda acceder a
esos identificadores y obtener algo
3. Cuando alguien accede a una URI, debe proporcionarse
información útil sobre el recurso que identifica (en RDF)
4. Incluir enlaces a otras URIs, para que se puedan
descubrir más cosas.
8
8
Datos enlazados
9
9
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
10
Datos enlazados
Red
Phonetic form
Form
number
singular
[RED]
Form
plural
[REDES]
Phonetic form
number
Red
Sense
written form
“red”@es
Sense
written form
“xarxa”@ca
translation
Red
image
Red
Sense Sense
translation written form
“red” “network”
written form
Red
written form
Form
gender
femenine
“red”
11
Datos enlazados
Algunos BENEFICIOS de los recursos lingüísticos
como datos enlazados
• Agregación e integración de recursos lingüísticos
• Los datos se exponen de manera estandarizada (SPARQL)
• Se facilita el descubrimiento de los datos
• Uso de vocabularios acordados para representar contenido
lingüístico
NIF
NLP Interchange Format
12
12
Datos enlazados
Linguistic Linked Data Cloud
Aparición de la “nube de datos lingüísticos enlazados”
Linguistic Linked Open Data (LLOD) cloud
13
http://linguistic-lod.org/llod-cloud
13
El modelo lemon-ontolex
14
lemon-ontolex
15
El núcleo del modelo
https://www.w3.org/2016/05/ontolex/
lemon-ontolex
16
El módulo vartrans
Datos enlazados en
terminologías:
Terminoteca RDF
17
Terminesp TERMCAT IATE
Otras
terminologías
Terminoteca RDF
18
Terminoteca RDF
TERMINOTECA RDF como demostrador del potencial de los datos
enlazados en terminologías
• Basado en Terminesp y Termcat
• Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín
http://linguistic.linkeddata.es/terminoteca/
19
Terminesp
TERMINESP es la base de datos terminológica creada por AETER
(Asociación Española de Terminología) en base a la terminología
contenida en las normas UNE (AENOR)
>30,000 términos técnicos con definiciones (en español)
Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, …
Traducciones al Inglés, francés, alemán, italiano, sueco
Denominación científica (latín)
20
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
Terminesp
4
http://www.wikilengua.org/index.php/Wikilengua:Terminesp
21
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
TERMCAT es el centro de terminología de la lengua catalana,
responsable de la Terminologia Oberta:
Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad
de la información, Telecomunicaciones, Industria electrónica]
Traducciones al español, inglés y francés
Siglas, abreviaturas, sinónimos,…
22
Termcat
http://www.termcat.cat/en/Terminologia_Oberta/
23
Terminoteca RDF
Conversión de TERMINESP y TERMCAT a datos enlazados:
De acuerdo al modelo lemon-ontolex
Cada elemento lingüístico (lexical entry, lexical form, lexical sense,
translation, …) identificado con una URI
Creación de conceptos en skos para dar cuenta de la información
semántica
En TERMINESP:
>30000 conceptos creados
Añadida información de categorías gramaticales (part-of-speech)
Añadido el tipo de sintagma (nominal, adjetival, preposicional, …)
En TERMCAT:
> 7000 conceptos creados (tres dominios)
24
Terminoteca RDF
25
DE ES
SV
IT
FR
EN
ES
FR
EN
CA
Terminoteca RDF
26
DE ES
SV
IT
FR
EN
CA
Terminoteca-RDF
Terminoteca RDF
27
Terminoteca RDF
28
Terminoteca RDF
29
Terminoteca RDF
Interfaz web para obtener traducciones directas
http://linguistic.linkeddata.es/terminoteca/search/
30
Terminoteca RDF
31
Motor SPARQL para búsquedas semánticas más complejas
http://linguistic.linkeddata.es/terminoteca/sparql-editor/
Terminoteca RDF
Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp]
del término en español ‘amplificador’, indicando el origen de los datos y el
dominio de aplicación.”
32
wr_target provenance subject
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Electrònica"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Societat de la informació"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s
ocietat%20de%20la%20informacio.xml
"Telecomunicacions"@ca
"amplificador"@ca
http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr
onica%20i%20dels%20materials%20electrics.xml
"Telecomunicacions"@ca
"Verstärker"@de http://www.wikilengua.org
"Verstärket"@de http://www.wikilengua.org
Terminoteca RDF
33
Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés
que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].”
label initialism
"code division multiple access"@en "CDMA"@en
"time division multiple access"@en "TDMA"@en
"light-emitting diode"@en "LED"@en
"unipolar transistor"@en "FET"@en
"N-channel field-effect transistor"@en "N-FET"@en
"database management system"@en "DBMS"@en
"frequency division multiple access"@en "FDMA"@en
"low-noise amplifier"@en "LNA"@en
"automatic gain control"@en "AGC"@en
"programmable logic controller"@en "PLC"@en
"alternating current"@en "AC"@en
"direct current"@en "DC"@en
"programmable logic device"@en "PLD"@en
Conclusiones
Conclusiones
• Los datos enlazados pueden ser de utilidad para los recursos
lingüísticos en general y las terminologías en particular
• Iniciativa Terminoteca RDF: crear un grafo unificado de
terminologías en España basado en técnicas de datos enlazados
• Validación y enriquecimiento de los datos, y enlazado a otras
fuentes
• Futuros pasos:
• Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia,
Apertium)
• Evolución más allá de estado de “prototipo” de investigación
• Interacción más directa con los propios procesos de
creación/validación/publicación de datos de Terminesp y Termcat
35
¡Gracias!
36Ontology Engineering Group

Más contenido relacionado

Destacado

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Jorge Gracia
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities
Julie Paton
 
00008830
0000883000008830
Teatreeoil
TeatreeoilTeatreeoil
Teatreeoil
Aleš Kuklínek
 
Ley lleras
Ley llerasLey lleras
Ley lleras
pablovelascof
 
Can You Understand Me
Can You Understand MeCan You Understand Me
Can You Understand Me
Alexa MacBride
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica power
sara gomez
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestre
pablovelascof
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docx
Borjafa
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
Benito Espinal
 
Lição 3 aluno
Lição 3 alunoLição 3 aluno
Lição 3 aluno
Demerval Fernandes
 
Cindys profile new 2017-rev1
Cindys profile new 2017-rev1Cindys profile new 2017-rev1
Cindys profile new 2017-rev1
CINDY'S RESTAURANT
 
Impresionismo
ImpresionismoImpresionismo
Impresionismo
Mafer Valdes
 
Argentina mi país
Argentina mi paísArgentina mi país
Argentina mi país
Leonor Corradi
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de google
nahiarati
 
Whassath
WhassathWhassath
Whassath
Alison Cajas
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflow
Sal D'Ambrosia
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
Pabliyo Jimenez
 
Hsa portfolio 2017
Hsa portfolio 2017Hsa portfolio 2017
Hsa portfolio 2017
Selim Benchedli
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11
Shekhar Ibhrampurkar
 

Destacado (20)

Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF caseMethodology for Linguistic Linked Open Data generation. The Apertium RDF case
Methodology for Linguistic Linked Open Data generation. The Apertium RDF case
 
2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities2017 UpdatedCV Julie Paton Facilities
2017 UpdatedCV Julie Paton Facilities
 
00008830
0000883000008830
00008830
 
Teatreeoil
TeatreeoilTeatreeoil
Teatreeoil
 
Ley lleras
Ley llerasLey lleras
Ley lleras
 
Can You Understand Me
Can You Understand MeCan You Understand Me
Can You Understand Me
 
Contaduria publica power
Contaduria publica powerContaduria publica power
Contaduria publica power
 
Proyecto integral de semestre
Proyecto integral de semestreProyecto integral de semestre
Proyecto integral de semestre
 
Cuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docxCuestionario previo clases sexualidad pp.doc.docx
Cuestionario previo clases sexualidad pp.doc.docx
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Lição 3 aluno
Lição 3 alunoLição 3 aluno
Lição 3 aluno
 
Cindys profile new 2017-rev1
Cindys profile new 2017-rev1Cindys profile new 2017-rev1
Cindys profile new 2017-rev1
 
Impresionismo
ImpresionismoImpresionismo
Impresionismo
 
Argentina mi país
Argentina mi paísArgentina mi país
Argentina mi país
 
Practico de rodriguez claudia de google
Practico de rodriguez claudia de googlePractico de rodriguez claudia de google
Practico de rodriguez claudia de google
 
Whassath
WhassathWhassath
Whassath
 
Model to scan workflow
Model to scan workflowModel to scan workflow
Model to scan workflow
 
Herramientas digitales
Herramientas digitalesHerramientas digitales
Herramientas digitales
 
Hsa portfolio 2017
Hsa portfolio 2017Hsa portfolio 2017
Hsa portfolio 2017
 
English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11 English Premier League Player Awards 2010/ 11
English Premier League Player Awards 2010/ 11
 

Similar a Utilidad de los datos enlazados para la terminología

Ontologias
OntologiasOntologias
Ontologias
Metalco Panama
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
GloriaTinoco
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
GloriaTinoco
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
GloriaTinoco
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
luisaguilardx
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03
jenorevi
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de Datos
UCAB
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
Diego López-de-Ipiña González-de-Artaza
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
Pollis Morales
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicas
Carlos Arroyo
 
Web semántica
Web semánticaWeb semántica
Web semántica
Karis Jimenes
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
Eduardo Flores
 
Dbpedia
DbpediaDbpedia
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1
catecara
 

Similar a Utilidad de los datos enlazados para la terminología (20)

Ontologias
OntologiasOntologias
Ontologias
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Web semanticasidar 03
Web semanticasidar 03Web semanticasidar 03
Web semanticasidar 03
 
Web Semantica Y las Bases de Datos
Web Semantica Y las Bases de DatosWeb Semantica Y las Bases de Datos
Web Semantica Y las Bases de Datos
 
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios EstándarROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
ROH: Proceso de Ingeniería Ontológica & Uso y Extensión de Vocabularios Estándar
 
Web semántica y sus principales características
Web semántica y sus principales característicasWeb semántica y sus principales características
Web semántica y sus principales características
 
Web 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicasWeb 3.0 y herramientas tecnologicas
Web 3.0 y herramientas tecnologicas
 
Web semántica
Web semánticaWeb semántica
Web semántica
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Websemanticasidar03
Websemanticasidar03Websemanticasidar03
Websemanticasidar03
 
Dbpedia
DbpediaDbpedia
Dbpedia
 
Agrovoc cswb training_1
Agrovoc cswb training_1Agrovoc cswb training_1
Agrovoc cswb training_1
 

Último

La MALA ATENCION EN LOS CENTROS DE SALUD
La MALA ATENCION EN LOS CENTROS DE SALUDLa MALA ATENCION EN LOS CENTROS DE SALUD
La MALA ATENCION EN LOS CENTROS DE SALUD
meylaura6
 
metodología de la investigación para la propuesta de una tesina
metodología de la investigación para la propuesta de una tesinametodología de la investigación para la propuesta de una tesina
metodología de la investigación para la propuesta de una tesina
LexooIAac
 
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
manuelulloa23
 
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptxLa_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
frenyergt23
 
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
IrapuatoCmovamos
 
Países ganadores de mundiales de futbol (corregido) (2024).pdf
Países ganadores de mundiales de futbol  (corregido)  (2024).pdfPaíses ganadores de mundiales de futbol  (corregido)  (2024).pdf
Países ganadores de mundiales de futbol (corregido) (2024).pdf
JC Díaz Herrera
 
Taller Programacion estudiante tecnico academico
Taller Programacion estudiante tecnico academicoTaller Programacion estudiante tecnico academico
Taller Programacion estudiante tecnico academico
jesusotho2102
 
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptxLA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
milerfuentestello1
 
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLESCUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
cygrateron
 
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptxABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
mjgonzales2789
 
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONALCUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
cygrateron
 
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
cygrateron
 
Informe sobre la Elaboración del yogurt de fresa
Informe sobre la Elaboración del yogurt de fresaInforme sobre la Elaboración del yogurt de fresa
Informe sobre la Elaboración del yogurt de fresa
YuverVicen
 
UNIDAD 3 - 2024 institución educativa virgen de fátima juliaca
UNIDAD 3 - 2024 institución educativa  virgen de fátima juliacaUNIDAD 3 - 2024 institución educativa  virgen de fátima juliaca
UNIDAD 3 - 2024 institución educativa virgen de fátima juliaca
PieroQuispe9
 
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
NAYELIANGUELLOAIZAAL
 
mapa conceptual competencias del area de comunicacion
mapa conceptual competencias del area de comunicacionmapa conceptual competencias del area de comunicacion
mapa conceptual competencias del area de comunicacion
keneerduck
 
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
mukeshagarwal5411
 
Inmunohematologia tarjetas de gel biorad
Inmunohematologia tarjetas de gel bioradInmunohematologia tarjetas de gel biorad
Inmunohematologia tarjetas de gel biorad
MarianaMartinezOsuna1
 
645025955-Cedula-colombiana-en-blanco.pdf
645025955-Cedula-colombiana-en-blanco.pdf645025955-Cedula-colombiana-en-blanco.pdf
645025955-Cedula-colombiana-en-blanco.pdf
SantiagoPuentes12
 
camelidos sudamericanos , fibra de alpaca
camelidos sudamericanos , fibra de alpacacamelidos sudamericanos , fibra de alpaca
camelidos sudamericanos , fibra de alpaca
yanetmc124
 

Último (20)

La MALA ATENCION EN LOS CENTROS DE SALUD
La MALA ATENCION EN LOS CENTROS DE SALUDLa MALA ATENCION EN LOS CENTROS DE SALUD
La MALA ATENCION EN LOS CENTROS DE SALUD
 
metodología de la investigación para la propuesta de una tesina
metodología de la investigación para la propuesta de una tesinametodología de la investigación para la propuesta de una tesina
metodología de la investigación para la propuesta de una tesina
 
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
25 SECRETOS DE LA SEXUALIDAD-LEONARDO FE
 
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptxLa_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
La_Arquitectura_en_Europa_1750-1900_Mark_Torres_Guillen.pptx
 
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdfREPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
REPORTE-HEMEROGRÁFICO-JUNIO 2024-IRAPUATO.pdf
 
Países ganadores de mundiales de futbol (corregido) (2024).pdf
Países ganadores de mundiales de futbol  (corregido)  (2024).pdfPaíses ganadores de mundiales de futbol  (corregido)  (2024).pdf
Países ganadores de mundiales de futbol (corregido) (2024).pdf
 
Taller Programacion estudiante tecnico academico
Taller Programacion estudiante tecnico academicoTaller Programacion estudiante tecnico academico
Taller Programacion estudiante tecnico academico
 
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptxLA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
LA BIOMECANICA DE CODO Y SU ESTUDIO.pptx
 
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLESCUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
CUESTIONARIO N°1. CLASIFICACIÓN DE LAS CUENTAS CONTABLES
 
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptxABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
ABORTO-Una mirada ética al dilema de nuestro tiempo.pptx
 
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONALCUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
CUESTIONARIO N°5. ESTRUCTURA ORGANIZACIONAL
 
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
CUESTIONARIO N°3. FORMAS DE COMERCIALIZACIÓN Y DISTRIBUCIÓN: LOGÍSTICA DEL ME...
 
Informe sobre la Elaboración del yogurt de fresa
Informe sobre la Elaboración del yogurt de fresaInforme sobre la Elaboración del yogurt de fresa
Informe sobre la Elaboración del yogurt de fresa
 
UNIDAD 3 - 2024 institución educativa virgen de fátima juliaca
UNIDAD 3 - 2024 institución educativa  virgen de fátima juliacaUNIDAD 3 - 2024 institución educativa  virgen de fátima juliaca
UNIDAD 3 - 2024 institución educativa virgen de fátima juliaca
 
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
OBJETIVOS DEL TURISMO RURAL COMUNITARIO UNIDAD 2
 
mapa conceptual competencias del area de comunicacion
mapa conceptual competencias del area de comunicacionmapa conceptual competencias del area de comunicacion
mapa conceptual competencias del area de comunicacion
 
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
Girls Call Hyderabad 000XX00000 Provide Best And Top Girl Service And No1 in ...
 
Inmunohematologia tarjetas de gel biorad
Inmunohematologia tarjetas de gel bioradInmunohematologia tarjetas de gel biorad
Inmunohematologia tarjetas de gel biorad
 
645025955-Cedula-colombiana-en-blanco.pdf
645025955-Cedula-colombiana-en-blanco.pdf645025955-Cedula-colombiana-en-blanco.pdf
645025955-Cedula-colombiana-en-blanco.pdf
 
camelidos sudamericanos , fibra de alpaca
camelidos sudamericanos , fibra de alpacacamelidos sudamericanos , fibra de alpaca
camelidos sudamericanos , fibra de alpaca
 

Utilidad de los datos enlazados para la terminología

  • 1. Utilidad de los datos enlazados para la terminología Jorge Gracia Ontology Engineering Group Dpto. de Inteligencia Artificial Universidad Politécnica de Madrid jgracia@fi.upm.es Jornada sobre “TERMINESP y la terminología del español” Representación de la Comisión Europea en España, Madrid 28 de octubre de 2016
  • 3. Recursos lingüísticos en la Web Recursos Lingüísticos Electrónicos • corpus • lexicones • diccionarios • “wordnets” • terminologías • etc. 3
  • 4. Recursos lingüísticos en la Web Actualmente… • En formatos heterogéneos • Diferentes esquemas de representación • APIs no estándar • Aislados entre sí (“data silos”) • Diferentes niveles de acceso (desde “mándame un email” a servicios web) • Múltiples catálogos de recursos lingüísticos con diferentes metadatos y esquemas de representación Por tanto... el descubrimiento y reutilización de RLs resulta costoso en tiempo y esfuerzo 4
  • 5. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web “Red” (de ordenadores) 5
  • 6. *Picture attribution: http://commons.wikimedia.org/wiki/User:Gugerell “Red” Etimología: Del latin “rete” Género: “f” Definición: “Conjunto de ordenadores o de equipos informáticos conectados entre sí….” “Red” Traducciones: “xarxa”(ca), “rede”(ga), … “Red” Norma: UNE 21302-131 Inglés: network Alemán: Netzwerk “Red” Pronunciation: [red] Grammar category: sustantivo femenino Singular: “red” Plural: “redes” “Red_de_computadores” Category: redes informáticas Image Recursos lingüísticos en la Web Información complementaria pero no conectada 6
  • 7. Datos enlazados para los recursos lingüísticos 7
  • 8. Datos enlazados Prinicipos de los Datos Enlazados (linked data principles) 1. Usar URIs (Uniform Resource Identifiers) para identificar “cosas” en la Web 2. Usar HTTP URIs para que la gente pueda acceder a esos identificadores y obtener algo 3. Cuando alguien accede a una URI, debe proporcionarse información útil sobre el recurso que identifica (en RDF) 4. Incluir enlaces a otras URIs, para que se puedan descubrir más cosas. 8 8
  • 10. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 10
  • 11. Datos enlazados Red Phonetic form Form number singular [RED] Form plural [REDES] Phonetic form number Red Sense written form “red”@es Sense written form “xarxa”@ca translation Red image Red Sense Sense translation written form “red” “network” written form Red written form Form gender femenine “red” 11
  • 12. Datos enlazados Algunos BENEFICIOS de los recursos lingüísticos como datos enlazados • Agregación e integración de recursos lingüísticos • Los datos se exponen de manera estandarizada (SPARQL) • Se facilita el descubrimiento de los datos • Uso de vocabularios acordados para representar contenido lingüístico NIF NLP Interchange Format 12 12
  • 13. Datos enlazados Linguistic Linked Data Cloud Aparición de la “nube de datos lingüísticos enlazados” Linguistic Linked Open Data (LLOD) cloud 13 http://linguistic-lod.org/llod-cloud 13
  • 15. lemon-ontolex 15 El núcleo del modelo https://www.w3.org/2016/05/ontolex/
  • 19. Terminoteca RDF TERMINOTECA RDF como demostrador del potencial de los datos enlazados en terminologías • Basado en Terminesp y Termcat • Multilingüe: inglés, catalán, francés, italiano, sueco, alemán, latín http://linguistic.linkeddata.es/terminoteca/ 19
  • 20. Terminesp TERMINESP es la base de datos terminológica creada por AETER (Asociación Española de Terminología) en base a la terminología contenida en las normas UNE (AENOR) >30,000 términos técnicos con definiciones (en español) Variedad de dominios: aeronáutica, agricultura, ingeniería eléctrica, … Traducciones al Inglés, francés, alemán, italiano, sueco Denominación científica (latín) 20 http://www.wikilengua.org/index.php/Wikilengua:Terminesp
  • 22. Termcat http://www.termcat.cat/en/Terminologia_Oberta/ TERMCAT es el centro de terminología de la lengua catalana, responsable de la Terminologia Oberta: Gran variedad de dominios. [En nuestro prototipo: Internet y sociedad de la información, Telecomunicaciones, Industria electrónica] Traducciones al español, inglés y francés Siglas, abreviaturas, sinónimos,… 22
  • 24. Terminoteca RDF Conversión de TERMINESP y TERMCAT a datos enlazados: De acuerdo al modelo lemon-ontolex Cada elemento lingüístico (lexical entry, lexical form, lexical sense, translation, …) identificado con una URI Creación de conceptos en skos para dar cuenta de la información semántica En TERMINESP: >30000 conceptos creados Añadida información de categorías gramaticales (part-of-speech) Añadido el tipo de sintagma (nominal, adjetival, preposicional, …) En TERMCAT: > 7000 conceptos creados (tres dominios) 24
  • 30. Terminoteca RDF Interfaz web para obtener traducciones directas http://linguistic.linkeddata.es/terminoteca/search/ 30
  • 31. Terminoteca RDF 31 Motor SPARQL para búsquedas semánticas más complejas http://linguistic.linkeddata.es/terminoteca/sparql-editor/
  • 32. Terminoteca RDF Ejemplo: “Dame traducciones al catalán [Termcat] y al alemán [Terminesp] del término en español ‘amplificador’, indicando el origen de los datos y el dominio de aplicación.” 32 wr_target provenance subject "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Electrònica"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Societat de la informació"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126104034_TO%20Internet%20i%20s ocietat%20de%20la%20informacio.xml "Telecomunicacions"@ca "amplificador"@ca http://www.termcat.cat/Thor/files/terminologiaOberta/20101126103843_TO%20Industria%20electr onica%20i%20dels%20materials%20electrics.xml "Telecomunicacions"@ca "Verstärker"@de http://www.wikilengua.org "Verstärket"@de http://www.wikilengua.org
  • 33. Terminoteca RDF 33 Ejemplo: “Dame las siglas [de Termcat] asociadas a las entradas en inglés que vengan de Terminesp [y que no tenían siglas asociadas, inicialmente].” label initialism "code division multiple access"@en "CDMA"@en "time division multiple access"@en "TDMA"@en "light-emitting diode"@en "LED"@en "unipolar transistor"@en "FET"@en "N-channel field-effect transistor"@en "N-FET"@en "database management system"@en "DBMS"@en "frequency division multiple access"@en "FDMA"@en "low-noise amplifier"@en "LNA"@en "automatic gain control"@en "AGC"@en "programmable logic controller"@en "PLC"@en "alternating current"@en "AC"@en "direct current"@en "DC"@en "programmable logic device"@en "PLD"@en
  • 35. Conclusiones • Los datos enlazados pueden ser de utilidad para los recursos lingüísticos en general y las terminologías en particular • Iniciativa Terminoteca RDF: crear un grafo unificado de terminologías en España basado en técnicas de datos enlazados • Validación y enriquecimiento de los datos, y enlazado a otras fuentes • Futuros pasos: • Enlace con otras terminologías y fuentes de datos (ej.: IATE, DBpedia, Apertium) • Evolución más allá de estado de “prototipo” de investigación • Interacción más directa con los propios procesos de creación/validación/publicación de datos de Terminesp y Termcat 35