TeRRAS

Técnicas de Recomendación de
Recursos Anotados Semánticamente

24 Junio 2009

Director: José Emilio Labra Gayo
Autor: Iván Mínguez Pérez Codirector: Diego Berrueta Muñoz

Tabla de contenidos

Objetivos del proyecto
Estado del arte
Deﬁniciones y características
Aproximaciones realizadas
Estudio del rendimiento
Resultados: Caso de uso y publicaciones
Conclusiones y trabajo futuro

Motivación

Ofrecer a las aplicaciones un sistema de
recomendación de recursos que permita la
personalización de los servicios ofrecidos en función de
las preferencias del usuario

¿Qué es un sistema de
recomendación?
Deﬁnición:
Un sistema de recomendación busca encontrar los
mejores recursos para el usuario.

Para ello, puede utilizar diferentes aspectos, como, por
ejemplo, las preferencias del usuario
Puede ser utilizado en diferentes dominios: alquiler de
coches y alojamientos, sugerencia de recursos
turísticos, búsqueda de artículos de compra, etc.

Objetivos del proyecto
Estudio de diferentes técnicas de recomendación de
recursos
Deﬁnición de una propuesta de función de
recomendación
Independiente del dominio, es decir, puede ser
utilizado para realizar recomendaciones sobre
cualquier tema
Basada en tecnologías semánticas, como RDF,
OWL o SPARQL

Tecnologías semánticas
Resumen
RDF: Lenguaje para la representación de grafos

OWL: Lenguaje para la representación de ontologías
basado en lógica descriptiva

SPARQL: Lenguaje de consulta sobre grafos en RDF

Estado del arte

Podemos dividir el estado del arte en dos partes:
Métricas de similitud
Técnicas de toma de decisiones

Estado del arte
Basadas en:
la información contenida
la estructura
en sistemas colaborativos
en lógica descriptiva
en lenguajes de consulta

Estado del arte
Basadas en lógica descriptiva

Utilizan lenguajes de lógica descriptiva
Representación de los recursos y demandas como
conceptos lógicos
Uso de los razonadores para comprobar la inclusión de
los conceptos en las demandas

[Borg 05], [Paol 02], [Colu 03], [Rago 07]

Estado del arte
Basadas en lenguajes de consulta

Uso de lenguajes de consulta como SQL o SPARQL
para la comprobación de las preferencias
Enriquecer las consultas según el contexto
Por ejemplo, en función de los gustos del usuario

[Chu 96], [Pahl 07], [Kief 07], [Seab 08]

Estado del arte
Técnicas de toma de decisiones

Técnica de toma de decisiones multicriterio
Comparación de aspectos representados en diferentes
escalas
Ayuda para la valoración de las preferencias por parte
del usuario
Uso de la técnica de AHP (Analytic Hierarchy Process)
para ayudar al usuario a valorar las preferencias

Nuestra propuesta
Sistema de recomendación de recursos en función
de las preferencias del usuario
Independiente del dominio
Basada en tecnologías semánticas
Requisitos:
Disponer de descripciones semánticas de los
recursos a recomendar
Resultados:
Conjunto de recursos más útiles para el
usuario en función de sus preferencias

Representación semántica de los
recursos

Preferencias
Deﬁnición:
Cada una de las características que los usuarios
desean que tengan los recursos

Representación como fórmulas lógicas utilizando
operadores lógicos disponibles en lógica descriptiva

Preferencias
Tipos de preferencias

Preferencias obligatorias:
Nos sirven para ﬁltrar los resultados de la
consulta
Preferencias opcionales:
Nos sirven para puntuar la utilidad del recurso

Demanda del usuario

Deﬁnición:
Petición por parte del usuario para que se le
recomienden recursos. Formada por preferencias
obligatorias y opcionales

Ejemplo de demanda

Quiero películas interpretadas por un actor con algún
premio. Además...
Preﬁero las películas de Tim Roth
Me gustan mucho las películas de crimen
También me gustan las comedias
Mejor si tiene una puntuación > 8 sobre 10
Preﬁero que sea corta, no más de 120 minutos

Ejemplo de demanda
Preferencias Obligatorias
Quiero películas interpretadas por un actor con algún
premio. Además...
Preﬁero las películas de Tim Roth
Me gustan mucho las películas de crimen
También me gustan las comedias
Mejor si tiene una puntuación > 8 sobre 10
Preﬁero que sea corta, no más de 120 minutos
Preferencias Opcionales

Demanda expresada como
fórmulas lógicas

Demanda expresada como
fórmulas lógicas

Preferencias Obligatorias

Preferencias Opcionales

Lenguaje QIL
Lenguaje deﬁnido en este proyecto para facilitar la
escritura de las demandas del usuario
Elimina la necesidad de agregar símbolos lógicos,
sustituyéndolos por palabras clave que ayudan a su
lectura
Uso de este lenguaje como lenguaje intermedio entre
posibles representaciones de las preferencias y
nuestros métodos

Demanda usando el
lenguaje QIL

Función de Matchmaking
Deﬁnición:
Calcular la utilidad de los recursos para el usuario

Está dividida en 2 partes:
Función match: Comprobación de las
preferencias del usuario que cumple un recurso
Función utility: Utilidad del recurso en función
de las preferencias que cumple


Función match:
Método basado en lógica descriptiva
Método basado en lenguaje de consulta
Función utility:
Utilización de la técnica de toma de decisiones
AHP


Demand (QIL)

PREFIX
(...)
OBLIGATORY
dbowl:Film.
skos:subject some {dbpedia:Gangter_ﬁlms} .
OPTIONAL
dbowl:starring some {dbpedia:Tim_Roth}, 8.
dbowl:directed some {dbpedia:Tarantino}, 4.

Transformación
en conceptos

Demand (QIL)

PREFIX
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en conceptos
DL Concepts

R = Film ! "subject.{Gangster_ﬁlms}
P1 = "starring.{Tim_Roth}
P2 = "directed.{Tarantino}

Demand (QIL)

PREFIX
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)

PREFIX
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
PREFIX
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
Matriz de instancias y
PREFIX Condiciones que cumple
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Transformación
en SPARQL

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

SPARQL Query
SELECT ?x ?x1 ?x2
WHERE{
?x rdf:type Film .
?x subject Gadget_ﬁlms .
OPTIONAL{
?x1 starring Tim_Roth . FILTER (?x=?x1)
}.
Transformación OPTIONAL{
?x2 directed Tarantino . FILTER (?x=?x2)
en SPARQL }

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

SPARQL Query Ejecutar
SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Base de
conocimiento

Transformación
en conceptos
DL Concepts


Instance

Checking

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Calcular

utilidad

SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Base de
conocimiento

Transformación
en conceptos
DL Concepts


Instance

Checking Vector de pesos
µ(Pi)

Demand (QIL)
Razonador
(...)
OBLIGATORY
dbowl:Film.
OPTIONAL

Calcular

utilidad

SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Base de
conocimiento

Transformación
en conceptos
DL Concepts


Instance

µ(Pi)

Demand (QIL)
Razonador Lista de sugerencias
(...)
score(!1) 1
OBLIGATORY
dbowl:Film. score(!2) 0.7
skos:subject some {dbpedia:Gangter_ﬁlms} . score(!3) 0.5
OPTIONAL
...
Calcular

utilidad

SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Base de
conocimiento

Funcionamiento
D = { PR } , { PO1, PO2, PO3 }
Marketplace

Funcionamiento
D = { PR } , { PO1, PO2, PO3 }
Marketplace

PR

Funcionamiento
D = { PR } , { PO1, PO2, PO3 }
PO2
Marketplace
PO1

PR

PO3 Pesos de las Preferencias
PO1 = 6
PO2 = 9
PO3 = 3

Funcionamiento
D = { PR } , { PO1, PO2, PO3 }
PO2
Marketplace
PO1

0,91 0,68

1
0,23 0,75
0,3

0,07
0
PR

PO3 Pesos de las Preferencias
PO1 = 6
PO2 = 9
PO3 = 3

Función match
(basado en Instance Checking)

Utilización de preferencias representadas por fórmulas
lógicas para construir conceptos en lógica descriptiva
Utilización de la equivalencia lógica
No es necesaria ninguna transformación

Función match
(basado en Instance Checking)

Utilización de un razonador para comprobar qué
preferencias cumplen los recursos
Operación Instance Checking

Función match
(basado en SPARQL)

Transformación de las preferencias en patrones de
grafo
Utilización de motor de SPARQL para ejecutarlas

Reglas de transformación de
QIL a SPARQL

Interpretación de los
resultados de la consulta
Una variable para los recursos (?result)
Y una variable extra (?pi) por cada preferencia opcional
representando el cumplimiento o no de la preferencia
asociada

Función utility
Utilización de la puntuación base del recurso y de las
preferencias que cumple (función match) para calcular
la utilidad del recurso para el usuario

Función utility
Utilización de la puntuación base del recurso y de las
preferencias que cumple (función match) para calcular
la utilidad del recurso para el usuario

Puntuación base Puntuación de
del recurso cada preferencia

Función utility
Puntuación de los recursos y preferencias

Puntuación base para los recursos
Puntuación de la importancia de cada preferencia. Uso
de los métodos de toma de decisiones:
Método AHP

Recordemos
Transformación
en conceptos
DL Concepts


Instance

µ(Pi)

Demand (QIL)
Razonador Lista de sugerencias
(...)
score(!1) 1
OBLIGATORY
dbowl:Film. score(!2) 0.7
skos:subject some {dbpedia:Gangter_ﬁlms} . score(!3) 0.5
OPTIONAL
...
Calcular

utilidad

SELECT ?x ?x1 ?x2
WHERE{
consulta
?x rdf:type Film .
OPTIONAL{
}.
en SPARQL }

Base de
conocimiento

Rendimiento
(en función del nº de preferencias opcionales)

basado en
SPARQL

basado en
DL

Rendimiento
(en función del nº de recursos)

basado en
SPARQL

basado en
DL

Rendimiento

El tiempo de respuesta se comporta bien en función
del número de preferencias
Pero, el comportamiento del algoritmo en función del
número de instancias no es satisfactorio
Existen posibles mejoras haciendo uso de repositorios
RDF profesionales, pero esto queda fuera del alcance
del proyecto

Ventajas
Independiente del dominio
Nivel de expresividad de las preferencias
Valoración númerica tanto de las preferencias y como
de los recursos
Puntuación numérica para la utilidad ﬁnal del recurso
Compromiso entre rendimiento y expresividad
(dependiendo de la implementación elegida)

Inconvenientes

Comunes a las 2 implementaciones
Rendimiento insatisfactorio

Especiﬁcas de la implementación usando DL
No soporta restricciones sobre tipos de datos

Especiﬁcas de la implementación usando SPARQL
No todos los operadores lógicos tienen transformación

Pérdida de la inferencia

Operadores soportados
Operador DL Sparql
Clase
Enumeraciones
Existencial
Universal
Cardinalidad
Tipo de dato
Intersección
Unión

Resultados
Caso de uso: CruZar

Aplicación realizada por la Fundación CTIC para el
Ayuntamiento de Zaragoza para la EXPO2008
Generación de rutas turísticas personalizadas
Uso del modulo TeRRAS para la selección de
recursos turísticos en función de los gustos
del usuario

Resultados
Caso de uso: CruZar

Resultados
Publicaciones

Capítulo del libro “Case on Semantic
Interoperability for information system
integration” editado por Yannis Kalfoglou
en la editorial IGI Global (Publicación
prevista para Octubre)
Enviado el articulo “TeRRAS: SPARQL-
based matchmaking system” a la revista
Journal of Web Semantics

La biblioteca TeRRAS
Ha sido liberada en SourceForge, bajo licencia
GPL.

Conclusiones
Estudio de técnicas de recomendación de recursos
Estudio de la aplicación de las tecnologías semánticas
Deﬁnición de una función de recomendación, utilizando
el concepto de preferencias
Implementación de las aproximaciones deﬁnidas en
este proyecto:
Intérprete para el lenguaje QIL
Transformaciones a OWL y a SPARQL
Uso del método AHP para la valoración de las
preferencias

Trabajo futuro

Estudio de nuevas técnicas de comprobación de
preferencias utilizando otro tipo de lógicas (ej: lógica
difusa)
Uso de las nuevas características de estándares
todavía en desarrollo como OWL 2 y la nueva versión
de SPARQL

Información inferida

Patrón buscado

Base de conocimiento (KB)

Patrón buscado


Patrón buscado

Coincidencias


Patrón buscado

Razonador
Coincidencias


Patrón buscado

Razonador
Coincidencias Conocimiento inferido

Lógica descriptiva
Deﬁnición:
Las lógicas descriptivas (DL) son una familia de
formalismos lógicos bien conocidos para la
representación e inferencia sobre el
conocimiento de un dominio de aplicación

Esta formada por varios elementos:
El TBox: incluye todos los axiomas de la
base de conocimiento
El ABox: incluye todos los hechos de la
base de conocimiento

Método AHP
Se basa en la comparación de las diferentes
alternativas en función de una tabla.

Método AHP

Se realizan una serie de de cálculos para obtener un
vector de pesos para las diferentes alternativas
Este vector buscar tener una puntuación normalizada
Se veriﬁca que:

¿Dónde podemos encontrar
información en este formato?

Transformando las bases de datos existente en grafos
RDF
Utilizando por ejemplo software como D2R
Datos compartidos en la iniciativa Linking Open Data

Evolución de LOD
Mayo de 2007

Evolución de LOD
Septiembre de 2008

Evolución de LOD
Marzo de 2009

Número de tripletas:
4.712.896.432

TeRRAS

Recomendados

Recomendados

Más contenido relacionado

Destacado

Destacado (18)

Último

Último (19)

TeRRAS

Notas del editor