Aprendizaje de reglas para sistemas de recomendación
1. Aprendizaje de reglas
´ ´
para sistemas de recomendacion aplicando miner´a semantica
ı
Blanca A. Vargas Govea
´
Grupo de Sistemas de Recomendacion
Departamento de Ciencias Computacionales
cenidet
30 de noviembre de 2011
2. Contenido
1 ´
Motivacion
2 Estado actual
3 ´ ´
Propuesta de solucion: miner´a semantica
ı
2 / 16
3. ´
Resultados seleccion de atributos
0.70 0.35
0.65 subset 0.30 subset
All All
0.60 0.25
Precision
B B
Recall
C C
0.55 0.20
D D
0.50 E 0.15 E
F F
0.45
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0.0
0.2
0.4
0.6
0.8
1.0
Lambda Lambda
0.56
0.54
subset
0.52 All
B
NDCG
0.50
C
0.48 D
E
0.46
F
0.0
0.2
0.4
0.6
0.8
1.0
Lambda
Enfoque contextual: el peor evaluado
3 / 16
4. Problemas comunes
Overfitting Underfitting
El numero de
´ El modelo tiene muy
´
parametros en el ´
pocos parametros.
modelo es muy grande. Incapacidad de
Redundancia. capturar la variabilidad
Ajuste al ruido. importante en los
datos.
Pobres resultados de
´
prediccion. Pobres resultados de
´
prediccion.
Objetivo
Obtener mediante aprendizaje, reglas que describan el conjunto de
´
datos de modo que la evaluacion mejore.
4 / 16
5. ´
Surfeous: as´ estan las cosas
ı
Modelo
del usuario
Modelo Reglas
del entorno
Modelo
de servicios
5 / 16
6. Atributos
Service model (23 attributes)
latitude,longitude,address,city,state,country,fax,ZIP,
alcohol,smoking,dress,accessibility,price,franchise,
ambiance,space,services,parking,cuisine,phone,accepts,
days,hours
User model (21 attributes)
latitude,longitude,smoking,alcohol,dress,ambiance,age,
transportation,marital-status,children,interests,
personality,religion,occupation,favorite-color,weight,
height,budget,accepts,accessibility,cuisine
Environment model (2 attributes)
time,weather
6 / 16
7. Las reglas 1/4
Son 95 / a partir de un estudio de mercadotecnia / grupos de
consumidores
user - service profile
person(X ) ∧ hasOccupation(X , student) ∧
restaurant(R) ∧ hasCost(R, low) → select(X , R)
user - environment profile
person(X ) ∧ isJapanese(X , true) ∧
queryPlace(X , USA) ∧ restaurant(R) ∧
isVeryClose(R, true) → select(X , R)
environment - service profile
currentWeather(today , rainy ) ∧ restaurant(R) ∧
space(R, closed) → select(R)
Relations
likesFood(X , Y ) X : person, Y : cuisine-type
currentWeather(X , Y ) X : query, Y : weather
space(X , Y ) X : restaurant, Y : {closed, open}
7 / 16
11. ´
¿Que se hace?
˜
Generalmente disenadas por un experto
Tendencia
Semantic Web Mining
[Lavraˇ et al., 2011, Vavpeti & Lavrac, 2011,
c
Eiter et al., 2008]
Relaciones entre conceptos
[Ciaramita et al., 2005]
Reglas
[Aitken, 2002, Tegos et al., 2008,
Manine et al., 2009, Teflioudi, 2011,
Siebers & Kruijsen, 2006]
Reglas de comportamiento
[Valiente-Rocha & Tello, 2010,
Angeletou et al., 2011]
11 / 16
12. ´
Miner´a Semantica
ı
´ ´
Con la expansion de la Web Semantica y la disponibilidad de
´ ´ ´
ontolog´as la cantidad de informacin semantica esta en rapido
ı
crecimiento.
´
Las ontolog´as de dominio definen el espacio de hipotesis.
ı
Los datos son usados como medio para restringir y guiar el
´ ´
proceso de busqueda de hipotesis y evaluacion.
´
El reto actual es minar el conocimiento contenido en ontolog´as
ı
de dominio.
[Lavraˇ et al., 2011]
c
12 / 16
13. Lo que se propone
1 ´ ´
Seleccion de atributos de los modelos. Uno ya esta.
2 Proceso de aprendizaje relacional a partir de datos y ontolog´a,
ı
´ ´
ILP (Programacion Logica Inductiva).
3 Obtener relaciones/reglas.
4 Pruebas: se espera que el enfoque contextual mejore.
13 / 16
14. ILP
´
Enfoque de aprendizaje automatico en el cual las relaciones son
aprendidas a partir de ejemplos.
´ ´
La logica de predicados es usada como lenguaje de hipotesis y
los resultados son programas en Prolog.
A diferencia de los enfoques proposicionales permite incorporar
conocimiento del dominio.
Aleph (A Learning Engine for Proposing Hypotheses).
14 / 16
16. En proceso
Estado del arte detallado.
´
Seleccion de atributos del perfil de usuario.
16 / 16
17. Aitken, J. S. (2002).
Learning information extraction rules: An inductive logic programming approach.
Angeletou, S., Rowe, M., & Alani, H. (2011).
Modelling and analysis of user behaviour in online communities.
In International Semantic Web Conference (1) (pp. 35–50).
ˇ
Ciaramita, M., Gangemi, A., Ratsch, E., Saric, J., & Rojas, I. (2005).
Unsupervised learning of semantic relations between concepts of a molecular biology ontology.
In Proceedings of the 19th international joint conference on Artificial intelligence, IJCAI’05 (pp. 659–664). San Francisco,
CA, USA: Morgan Kaufmann Publishers Inc.
Eiter, T., Ianni, G., Krennwallner, T., & Polleres, A. (2008).
Reasoning web.
(pp. 1–53).
Lavraˇ , N., Vavpetiˇ , A., Soldatova, L., Trajkovski, I., & Novak, P. K. (2011).
c c
Using ontologies in semantic data mining with segs and g-segs.
In Proceedings of the 14th international conference on Discovery science, DS’11 (pp. 165–178). Berlin, Heidelberg:
Springer-Verlag.
Manine, A.-P., Alphonse, ., & Bessires, P. (2009).
Learning ontological rules to extract multiple relations of genic interactions from text.
I. J. Medical Informatics, 78(12), 31–38.
Siebers, Q. H. & Kruijsen, P.-P. (2006).
Implementing inference rules in the topic maps model.
In Proceedings of the Topic Maps Research and Applications Conference (TMRA).
Teflioudi, C. (2011).
Learning soft inference rules in large and uncertain knowledge bases.
¨
Master’s thesis, Universitat des Saarlandes, Saarbrucken.
¨
Tegos, A., Karkaletsis, V., & Potamianos, A. (2008).
Learning of semantic relations between ontology concepts using statistical techniques.
16 / 16
18. In Proceedings of the Workshop on High-Level Information Extraction at ECML-PKDD 2008, HLIE 2008 Antwerp, Belgium.
Valiente-Rocha, P. A. & Tello, A. L. (2010).
Ontology and swrl-based learning model for home automation controlling.
In ISAmI (pp. 79–86).
Vavpeti, A. & Lavrac, N. (2011).
Using ontologies in semantic data mining with g-segs and aleph.
In The 21st International Conference on Inductive Logic Programming (ILP 2011) Cumberland Lodge, United Kingdom.
16 / 16