SlideShare una empresa de Scribd logo
1 de 68
Descargar para leer sin conexión
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 2
Artículo
Hernando,A., Moya, R., Ortega, F., & Bobadilla, J. (2013).
Hierarchical Graph Maps forVisualization of Collaborative
Recommender Systems
Journal of Information Sciences, 40(1), 97-106.
(JCR Impact factor: 1.087. Q2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 3
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 4
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 5
• Los sistemas de recomendación (SR) son sistemas
inteligentes capaces de realizar recomendaciones
personalizadas a usuarios registrados en el sistema.
• Se necesita conocer los gustos de los usuarios para
poder realizar recomendaciones personalizadas.
• El tipo de ítems a recomendar por un SR es muy
variado: películas, libros, artículos, etc.
• Nacen como consecuencia del denominado “problema
de la sobrecarga de información” que hay en Internet.
Introducción
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 6
• La tarea de averiguar los gustos de los usuarios
y encontrar aquellos ítems que más se ajusta a
sus gustos ha requerido del uso de técnicas de
Machine Learning:
Introducción
Knn (K-Vecinos) Redes Neuronales Modelos Bayesianos
Descomposición matricial Modelos probabilísticos
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
Métodos Híbridos
Sistemas de Recomendación
Filtrado
Demográfico
Filtrado Basado
en Contenido
Filtrado
Colaborativo
Basados en
Memoria
Basados en
Modelos
Basados en
Memoria
Basados en
Modelos
7
Clasificación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 8
• La tendencia de los SR corre paralela a la propia
evolución de la web.
• Inicio de la Web: Los SR se nutrían únicamente de
información explicita de los usuarios.
• Web 2.0: Utilizan información de redes sociales (amigos,
followers, etc.), su comportamiento, participación en
blogs, foros, etc.
• Web 3.0: Incorporan más información: Internet of things,
ubicuidad, parámetros de salud, compras, hábitos, etc.
Tendencias
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 9
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 10
• El número de usuarios no registrados que
acceden a un SR es muchísimo mayor que el de
los usuarios registrados.
• Gran parte de las investigaciones en el campo
de los SR se han centrado en el cálculo de
recomendaciones a usuarios registrados.
• Esta tesis se centra fundamentalmente en los
usuarios no registrados.
Motivación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 11
Motivación
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 12
Si bien es cierto que los SR no pueden realizar
recomendaciones personalizadas a usuarios no registrados, sí
que es posible que el SR pueda ofrecer un modelo de
inferencia sencillo de interpretar que permita a un usuario
no registrado inferir por él mismo las propias
recomendaciones a partir de sus gustos.
Hipótesis
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 13
• Para que este modelo de inferencia tenga sentido, debe
cumplir los siguientes puntos:
1. El modelo de inferencia no debe estar basado en ecuaciones
matemáticas.
2. El modelo de inferencia debe estar basado en un tipo de
razonamiento similar al razonamiento humano.
3. La inferencia en el modelo propuesto debe proporcionar
recomendaciones lo más similares posibles a algún mecanismo
de recomendación conocido.
4. La inferencia debe estar basada en modelos visuales.
Hipótesis
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 14
• Los sistemas de inferencia basado en reglas
cumplen:
1. Se basan en un razonamiento muy cercano al humano
(Modus ponens, Modus tollens)
2. No se usan ecuaciones matemáticas complejas.
Modelo basado en reglas
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 15
Modelo basado en reglas
Ejemplo
Hecho 1 En general suele gustar la película “Ocho apellidos vascos”
Regla 1 Si te gusta la película “La isla mínima”, entonces probablemente te
gustará la película “El niño”
Hecho II
Usuario no registrado
Me gusta bastante la película “La isla mínima”
Inferencia
Usuario no registrado
Sería interesante ver la película “Ocho apellidos vascos”
(Hecho I)
Sería interesante ver la película “El niño”
(Regla I y Hecho II)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 16
1. Inferencia compleja para el usuario: El SR tiene que
ofrecer una gran cantidad de reglas y hechos.
2. Basado en representación textual: El usuario tiene
que leerse una gran cantidad de reglas y hechos para
poder sacar sus propias conclusiones.
Modelo basado en reglas
Inconvenientes
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 17
• Solventa los inconvenientes de los modelos
basados en reglas:
1. No se definen infinidad de reglas y hechos.
2. Es un modelo visual (no implica lectura para el
usuario)
Modelo basado en grafos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 18
• Se propone un grafo no dirigido con las siguientes
características:
1. Vértices: representarán a los ítems del SR y definirán una cantidad
asociado al ítem i que indicarán el grado de confianza del hecho:
Hecho: “En general suele gustar el ítem i”
2. Aristas: Dados dos ítems i,j; existe una arista entre dos vértices
asociados a estos dos ítems si existe la regla del tipo:
Regla: “Si te gusta el ítem i, entonces ‘probablemente’ te gustará el ítem j”
La longitud de la arista equivaldrá al grado de incertidumbre de la
regla (‘probablemente’,‘es posible’,‘quizás’, etc.)
Modelo basado en grafos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 19
• El grafo obtenido en general no es
plano (las aristas se cruzan).
• No se puede representar con la
longitud de la arista el grado de
incertidumbre de las reglas.
Modelos basados en grafos
Inconvenientes
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 20
• Construir un subgrafo a partir del grafo de relaciones entre
ítems con las reglas más significativas (con mayor grado de
confianza).
• Dentro de los tipos de subgrafos, se han considerado los árboles
de recubrimiento mínimo (ARM) ya que:
1. Son grafos planos.
2. Las aristas no se cruzan entre ellas.
3. Con la longitud de las aristas se puede representar el grado de confianza.
4. El problema de los ARM ha sido muy estudiado y es muy conocido en el
campo de la algorítmica.
Modelo definitivo
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 21
Modelo definitivo
Ejemplo
Hecho En general suele gustar el item “I4”
Regla
Si te gusta el item “I2”, entonces probablemente
te gustará el ítem “I5”
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 22
Modelo definitivo
Ejemplo del caso de estudio: RS-IST
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 23
• La tesis propuesta puede encuadrarse dentro del
área de visualización en Machine Learning.
• Existen técnicas destinadas a la visualización de
datos como: PC A, Kernel PC A, Mapas
autoorganizados, técnicas de clustering, etc.
• Estas técnicas no son adecuadas para representar
los ítems de un SR ya que aunque representan en el
plano los datos, no establecen relaciones entre los
datos y por tanto no proporcionan un modelo de
inferencia.
Métodos de visualización en
Machine Learning
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 24
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 25
Método
Calcular importancia del item
Calcular distancias entre items
Calcular el ARM
Calcular la fiabilidad de las similaridades
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
importancia(I1) = 2
importancia(I2) = 3
importancia(I6) = 2
importancia(I3) = 2
importancia(I4) = -2
importancia(I5) = -1
26
Método
Paso I: Cálculo de la importancia de un ítem
Usuarios
Items U1 U2 U3 U4 U5
I1 4 5 4 1
I2 3 5 4
I3 1 5 5
I4 1 4 3 2
I5 2 4 3 2
I6 5
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 27
Método
Paso I: Cálculo de la importancia de un ítem
Items
I1 I2 I3 I4 I5 I6
Importancia 2 3 2 -2 -1 2
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 28
Método
Paso II: Cálculo de distancias entre ítems
Usuarios
Items
U1 U2 U3 U4 U5
I1 4 5 4 1
I2 3 5 4
I3 1 5 5
I4 1 4 3 2
I5 2 4 3 2
I6 5
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 29
Método
Paso II: Cálculo de distancias entre ítems
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 30
Método
Paso III: Cálculo del árbol de recubrimiento mínimo
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 31
Método
Paso IV: Cálculo de la fiabilidad de las similaridades
Usuarios
Items
U1 U2 U3 U4 U5
I1 4 5 4 1
I2 3 5 4
I3 1 5 5
I4 1 4 3 2
I5 2 4 3 2
I6 5
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
I1 I2 I3 I4 I5 I6
I1 x 0.75 0.40 0.60 0.60 0
I2 x 0.40 0.40 0.40 0
I3 x 0.75 0.75 0.33
I4 x 1 0.25
I5 x 0.25
I6 x
Fiabilidad
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 32
Método
Paso IV: Cálculo de la fiabilidad de las similaridades
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
I1 I2 I3 I4 I5 I6
I1 x 0.75 0.40 0.60 0.60 0
I2 x 0.40 0.40 0.40 0
I3 x 0.75 0.75 0.33
I4 x 1 0.25
I5 x 0.25
I6 x
Fiabilidad
Fiabilidad 1 - 0.8 0.79 - 0.6 0.59 - 0.4 0.39 - 0.2 0.19 - 0
Color Rojo Naranja Verde Morado Azul
Tramos de fiabilidad
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
I1 I2 I3 I4 I5 I6
I1 x 0.75 0.40 0.60 0.60 0
I2 x 0.40 0.40 0.40 0
I3 x 0.75 0.75 0.33
I4 x 1 0.25
I5 x 0.25
I6 x
Fiabilidad
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 33
Método
Paso IV: Cálculo de la fiabilidad de las similaridades
I1 I2 I3 I4 I5 I6
I1 x 0.02 0.53 0.33 0.13 x
I2 x 0.06 0.16 0.06 x
I3 x 0.46 0.46 1
I4 x 0.02 0.06
I5 x 0.06
I6 x
Distancias
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 34
Resultado y conclusiones
Hecho En general suele gustar el item “I2”
Hecho En general suele gustar el item “I1”
Hecho En general suele gustar el item “I3”
Regla Si te gusta el ítem “I5”, entonces probablemente te gustará el ítem “I4”
Regla Si te gusta el ítem “I5”, entonces es posible que te guste el ítem “I2”
Regla Si te gusta el ítem “I5”, entonces quizás te guste el ítem “I6”
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 35
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 36
Método
Calcular importancia del item
Calcular distancias entre items
Calcular el ARM
Calcular la fiabilidad de las similaridades
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 37
SR basados en contenido
Sistemas de Recomendación
Basados en Memoria Basados en Modelos
SR basados en vectores
de palabras
LSI PLSI LDA
Filtrado Basado en Contenido
No probabilísticos Probabilísticos
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 38
• Preprocesamiento de la descripción de los ítems:
• Eliminar preposiciones, artículos, etc.
• Sustituir plurales, diminutivos, etc. a su palabra raíz.
• Se trabaja con una matriz de apariciones de
palabras en los ítems (palabras/items).
SR basados en contenido
Items
Palabras
I1 I2 I3 I4 I5
Fútbol 3 0 2 0 0
Política 0 0 4 4 2
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 39
• Calculan las recomendaciones basándose en el
cálculo de distancias entre cada par de vectores
de apariciones de palabras en los ítems.
SR basados en vectores de
palabras
Items
Palabras
I1 I2 I3 I4 I5
Fútbol 3 0 2 0 0
Política 0 0 4 4 2
I1 I2 I3 I4 I5
I1 0 3.0 4.1 5.0 3.6
I2 3.0 0 4.5 4 2
I3 4.1 4.5 0 2 2.8
I4 5.0 4 2 0 2
I5 3.6 2 2.8 2 0
Distancia Euclidea
I1 I2 I3 I4 I5
I1 0 3.0 4.1 5.0 3.6
I2 3.0 0 4.5 4 2
I3 4.1 4.5 0 2 2.8
I4 5.0 4 2 0 2
I5 3.6 2 2.8 2 0
Distancia Euclidea
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 40
• Técnica de factorización matricial basada en la
técnica matemática del SVD.
• Extrae (a partir de la matriz de apariciones de
palabras en ítems) una serie de factores latentes
que caracterizan a las palabras y los documentos.
• A partir de esos factores latentes podemos calcular
las similaridades entre los ítems o las palabras.
LSIPublicación
Deerwester.S, Dumais.ST, Furnas.GW, Landauer.TK, and Harshman.R. Indexing by latent
semantic analysis. Journal of the American Society for Information Science, page 391, 1990.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 41
LSI
Teorema de Eckart-Young
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 42
Cálculo de distancias
Para SR basados en vectores de palabras y LSI
SR basados en vectores
de palabras
LSI
Métrica de similaridad basada en ángulos (Coseno)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 43
• El PLSI es una evolución del LSI al que se le añado un
modelo probabilístico.
• Descompone la matriz de apariciones de palabras/ítems
en dos matrices que van a tener un significado
probabilístico.
• Los items y las palabras están caracterizados por una
distribución de probabilidad en el que se indica con que
grado un item o palabra pertenecen a un tema u otro.
PLSIPublicación
Hofmann.T. Probabilistic latent semantic indexing. International Computer Science
Institute, 1999.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 44
PLSI
Conjunto de temas: z ∈ Z = {z1,...,zk}
Conjunto de palabras: w ∈ W = {w1,...,wn}
Conjunto de documentos: d ∈ D = {d1,...,dm}
Estudiar similaridades entre items
Probabilidad de que un documento pertenezca
a un determinado tema.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 45
PLSI
Ejemplo
Items
Palabras
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11
Balón 3 2
Fútbol 2 6 8 1 1
Liga 3 1
CR7 6 7
Messi 1 2 5
Política 4 4 4 1 1
PP 6 3 1
PSOE 4 6 1
ZP 3 5 1 1 1
Rajoy 5 1 1 1 1
Dinero 1 4 4
FMI 5 4 4
UE 4 4 3
PIB 3 1 1
Ibex 2
K = 3
Temas
Fútbol Política Economía
I1 1.00 0 0
I2 1.00 0 0
I3 1.00 0 0
I4 0 1.00 0
I5 0 1.00 0
I6 0 1.00 0
I7 0 0 1.00
I8 0 0 1.00
I9 0 0.21 0.79
I10 0.33 0.33 0.33
I11 0.40 0.60 0
P (z | d)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 46
• Modelo probabilístico que se enmarca dentro de los modelos
generativos ya que trata de describir como se crea un documento.
• Al igual que el PLSI, el LDA calcula dos matrices de probabilidad P(w|z) y
P(z|θ).
• La diferencia radica en como se calculan las matrices de probabilidad:
• LDA: Cada ítem esta representado por un vector que sigue una
distribución de Dirichlet.
• PLSI: Cada ítem esta representado por un vector que sigue una
distribución categórica.
LDAPublicación
Blei.D, Ng.A, and Jordan.M. Latent dirichlet allocation. the Journal of machine Learning
research, pages 993–1022, 2003.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 47
LDA
Probabilidad de que un documento pertenezca
a un determinado tema.
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 48
LDA
Ejemplo
Items
Palabras
I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11
Balón 3 2
Fútbol 2 6 8 1 1
Liga 3 1
CR7 6 7
Messi 1 2 5
Política 4 4 4 1 1
PP 6 3 1
PSOE 4 6 1
ZP 3 5 1 1 1
Rajoy 5 1 1 1 1
Dinero 1 4 4
FMI 5 4 4
UE 4 4 3
PIB 3 1 1
Ibex 2
K = 3 Temas
Fútbol Política Economía
I1 15.01 0.01 0.01
I2 15.01 0.01 0.01
I3 15.01 0.01 0.01
I4 0.01 15.01 0.01
I5 0.01 15.01 0.01
I6 0.01 15.01 0.01
I7 0.01 0.01 15.01
I8 0.01 2.01 13.01
I9 0.01 4.01 11.01
I10 1.01 1.01 1.01
I11 2.01 3.01 0.01
P (z | θ)
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 49
Cálculo de distancias
Para SR basados en modelos probabilísticos
PLSI LDA
Métrica de similaridad entre distribuciones de probabilidad
Kullback-Liebler (KL)
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 50
SR basados en filtrado
colaborativo
Sistemas de Recomendación
Basados en Memoria Basados en Modelos
Knn (K-Vecinos) Factorización Matricial
Filtrado Colaborativo
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 51
• Se toma como base la matriz de votos que los
usuarios han emitido sobre los ítems
• El filtrado colaborativo consiste en ver que
usuarios (o ítems) son similares al usuario (o
ítem) activo al que se ha de recomendar.
SR basados en filtrado
colaborativo
Items
Usuarios
I1 I2 I3 I4 I5 I6
U1 4 3 1 2
U2 1 4 4 5
U3 5 5
U4 4 4 5 3 3
U5 1 5 2 2
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 52
K-Vecinos
Esquema general
Calcular la similaridad
Buscar los k vecinos
Predecir votaciones
Elegir items recomendados
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 53
• Uno de los pasos más importantes es el de
calcular la similaridad entre usuarios o ítems.
• Se han propuesto varias métricas de similaridad
• Tradicionales: MSD, Coseno, Correlación
• Destacadas: JMSD, Singularidades
• La distancia se calcula como:
Cálculo de distancias
Para la técnica de los K-Vecinos
dist(I1,I2) = 1 - sim(I1,I2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 54
• Una de las técnicas más importantes utilizadas
en los SR basados en factorización matricial es el
basado en SVD aplicado a los SR basados en FC.
• Esta técnica tiene como finalidad la de obtener
una serie de factores latentes que caractericen a
los usuario y a los ítems.
• A partir de estos factores se pueden calcular la
similaridad en usuarios o entre ítems.
SR basados en factorización
matricial
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 55
SVD aplicado a FC
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 56
SVD aplicado a FC
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 57
• Para el cálculo de similaridades entre usuario o
entre ítems a partir de sus factores latentes, se
puede utilizar cualquiera de las métricas
basadas en distancias o en ángulos como el
MSD, Coseno, Correlación, etc.
• De igual forma la distancia se calcula como:
Cálculo de distancias
Para el SVD
dist(I1,I2) = 1 - sim(I1,I2)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 58
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)
Métodos Híbridos
Sistemas de Recomendación
Filtrado
Demográfico
Filtrado Basado
en Contenido
Filtrado
Colaborativo
Basados en
Memoria
Basados en
Modelos
Basados en
Memoria
Basados en
Modelos
Sistemas de Recomendación
Filtrado
Colaborativo
Basados en
Memoria
59
Caso de estudio
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 60
Base de datos
MovieLens
Número de usuarios 6.040
Número de ítems 3.900
Número de votaciones 1.000.209 (1M)
Escala 1 - 5
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 61
RS-IST
Visión general
películas más populares
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 62
RS-IST
Películas más populares
Hecho En general suele gustar la película “ ”
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 63
RS-IST
Ejemplo de inferencia
Loca academia de policía
Loca academia de policía 2
Loca academia de policía 4
Loca academia
de policía 5
Loca academia
de policía 3
Texto del título
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 64
RS-IST
Ejemplo (Muchos vértices adyacentes)
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 65
• Introducción y contexto
• Motivación, hipótesis y objetivos
• Ejemplo del método propuesto
• Técnicas y métricas de similaridad
• Caso de estudio
• Conclusiones y trabajos futuros
Índice
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 66
• Se ha presentado un modelo de inferencia sencillo para
usuarios no registrados.
• Se ha presentado un modelo de visualización para los
ítems de un SR en los que es posible estudiar sus
similaridades.
• Como caso de estudio, se ha probado el modelo propuesto
con la base de datos de MovieLens 1M.
• Con el RS-IST resultante ha sido posible determinar que
ítems (películas) han sido votadas de forma similar,
pudiendo así “explicar las recomendaciones al estilo ítem”.
Conclusiones
Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 67
• Estudiar posibles formas de generar árboles personalizados para usuarios
de los que se tiene cierta información sobre su perfil, gustos, etc.
• Introducir otras medidas de fiabilidad.
• Comparar las diferentes estructuras de árboles al aplicar diferentes
medidas de similaridad entre ítems.
• Incorporar una etapa de pre-clasterización.
• Recuperación de información en las diferentes áreas en las que existen
sistemas de recomendación basados en memoria (redes sociales, blogs,
etc.), para poder aplicar más características a los árboles.
• Árboles dirigidos (Poliárboles).
• Aplicar este concepto a otros grafos planos (mallas).
Trabajos futuros
¿Preguntas?

Más contenido relacionado

Similar a Tesis Doctoral (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)

Problemas De Validez
Problemas De ValidezProblemas De Validez
Problemas De ValidezLaura Colo
 
diseño de base de datos
diseño de base de datosdiseño de base de datos
diseño de base de datosElizabeth Nero
 
metodologia de diseño de base de datos
metodologia de diseño de base de datosmetodologia de diseño de base de datos
metodologia de diseño de base de datosemnero
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos SecuencialesMarilyn Jaramillo
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafosAbraham Paez
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxAnonymousEoGAaTF
 
Presentacion modelo relacional2_final
Presentacion modelo relacional2_finalPresentacion modelo relacional2_final
Presentacion modelo relacional2_finalAlitas221
 
4. programacion. parcial 1. md
4. programacion. parcial 1. md4. programacion. parcial 1. md
4. programacion. parcial 1. mdtecnologiacetis100
 
metodologia de diseño de base de datos
metodologia de diseño de base de datosmetodologia de diseño de base de datos
metodologia de diseño de base de datosemnero
 
Fundamentos de arquitectura de la información
Fundamentos de arquitectura de la informaciónFundamentos de arquitectura de la información
Fundamentos de arquitectura de la informaciónJesús Tramullas
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
Análisis estructurado power
Análisis estructurado powerAnálisis estructurado power
Análisis estructurado powerA.C. Milan
 
Cap. 2 comprensión y modelado
Cap. 2 comprensión y modeladoCap. 2 comprensión y modelado
Cap. 2 comprensión y modeladoMarmgimel Idiaquez
 
Unidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos ConceptualUnidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos ConceptualSergio Sanchez
 
Trabajo sesion en linea semana 1
Trabajo sesion en linea semana 1Trabajo sesion en linea semana 1
Trabajo sesion en linea semana 1William Arias
 

Similar a Tesis Doctoral (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Problemas De Validez
Problemas De ValidezProblemas De Validez
Problemas De Validez
 
Base
BaseBase
Base
 
diseño de base de datos
diseño de base de datosdiseño de base de datos
diseño de base de datos
 
metodologia de diseño de base de datos
metodologia de diseño de base de datosmetodologia de diseño de base de datos
metodologia de diseño de base de datos
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafos
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
Presentacion modelo relacional2_final
Presentacion modelo relacional2_finalPresentacion modelo relacional2_final
Presentacion modelo relacional2_final
 
4. programacion. parcial 1. md
4. programacion. parcial 1. md4. programacion. parcial 1. md
4. programacion. parcial 1. md
 
metodologia de diseño de base de datos
metodologia de diseño de base de datosmetodologia de diseño de base de datos
metodologia de diseño de base de datos
 
Fundamentos de arquitectura de la información
Fundamentos de arquitectura de la informaciónFundamentos de arquitectura de la información
Fundamentos de arquitectura de la información
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
Análisis estructurado power
Análisis estructurado powerAnálisis estructurado power
Análisis estructurado power
 
Cap. 2 comprensión y modelado
Cap. 2 comprensión y modeladoCap. 2 comprensión y modelado
Cap. 2 comprensión y modelado
 
Modelado y metodologias para aplicaciones web
Modelado y metodologias para aplicaciones webModelado y metodologias para aplicaciones web
Modelado y metodologias para aplicaciones web
 
Unidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos ConceptualUnidad 3 Modelamiento De Datos Conceptual
Unidad 3 Modelamiento De Datos Conceptual
 
Trabajo sesion en linea semana 1
Trabajo sesion en linea semana 1Trabajo sesion en linea semana 1
Trabajo sesion en linea semana 1
 

Último

Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúDiegoFranciscoLarrea
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.FeliGamarra1
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaAlexander VA
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioAlexander VA
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdfJC Díaz Herrera
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfJulioCesarRubianoArc1
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfJC Díaz Herrera
 
Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviHugoSSalinas
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkJuanmanuelYapitamani
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEmisor Digital
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdfJC Díaz Herrera
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfanaliticaydatos
 
La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomascarmenachullahuamani1
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahodalisnicoles
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...Daniela Márquez Sena
 

Último (15)

Análisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y PerúAnálisis comparativo del olivo en los mercados de Noruega, España y Perú
Análisis comparativo del olivo en los mercados de Noruega, España y Perú
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 
CARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia PatrimonioCARTA DE ATENAS 1931 - Infografia Patrimonio
CARTA DE ATENAS 1931 - Infografia Patrimonio
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdf
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdf
 
Pobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdfPobreza porcentual por etnia para el año (2024).pdf
Pobreza porcentual por etnia para el año (2024).pdf
 
Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico Jamovi
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
 
Estudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de IpsosEstudio Índice de Igualdad 2024 de Ipsos
Estudio Índice de Igualdad 2024 de Ipsos
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomas
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 

Tesis Doctoral (Mapas gráficos para la visualización de relaciones en sistemas de recomendación)

  • 1.
  • 2. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 2 Artículo Hernando,A., Moya, R., Ortega, F., & Bobadilla, J. (2013). Hierarchical Graph Maps forVisualization of Collaborative Recommender Systems Journal of Information Sciences, 40(1), 97-106. (JCR Impact factor: 1.087. Q2)
  • 3. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 3 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 4. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 4 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 5. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 5 • Los sistemas de recomendación (SR) son sistemas inteligentes capaces de realizar recomendaciones personalizadas a usuarios registrados en el sistema. • Se necesita conocer los gustos de los usuarios para poder realizar recomendaciones personalizadas. • El tipo de ítems a recomendar por un SR es muy variado: películas, libros, artículos, etc. • Nacen como consecuencia del denominado “problema de la sobrecarga de información” que hay en Internet. Introducción
  • 6. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 6 • La tarea de averiguar los gustos de los usuarios y encontrar aquellos ítems que más se ajusta a sus gustos ha requerido del uso de técnicas de Machine Learning: Introducción Knn (K-Vecinos) Redes Neuronales Modelos Bayesianos Descomposición matricial Modelos probabilísticos
  • 7. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) Métodos Híbridos Sistemas de Recomendación Filtrado Demográfico Filtrado Basado en Contenido Filtrado Colaborativo Basados en Memoria Basados en Modelos Basados en Memoria Basados en Modelos 7 Clasificación
  • 8. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 8 • La tendencia de los SR corre paralela a la propia evolución de la web. • Inicio de la Web: Los SR se nutrían únicamente de información explicita de los usuarios. • Web 2.0: Utilizan información de redes sociales (amigos, followers, etc.), su comportamiento, participación en blogs, foros, etc. • Web 3.0: Incorporan más información: Internet of things, ubicuidad, parámetros de salud, compras, hábitos, etc. Tendencias
  • 9. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 9 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 10. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 10 • El número de usuarios no registrados que acceden a un SR es muchísimo mayor que el de los usuarios registrados. • Gran parte de las investigaciones en el campo de los SR se han centrado en el cálculo de recomendaciones a usuarios registrados. • Esta tesis se centra fundamentalmente en los usuarios no registrados. Motivación
  • 11. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 11 Motivación
  • 12. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 12 Si bien es cierto que los SR no pueden realizar recomendaciones personalizadas a usuarios no registrados, sí que es posible que el SR pueda ofrecer un modelo de inferencia sencillo de interpretar que permita a un usuario no registrado inferir por él mismo las propias recomendaciones a partir de sus gustos. Hipótesis
  • 13. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 13 • Para que este modelo de inferencia tenga sentido, debe cumplir los siguientes puntos: 1. El modelo de inferencia no debe estar basado en ecuaciones matemáticas. 2. El modelo de inferencia debe estar basado en un tipo de razonamiento similar al razonamiento humano. 3. La inferencia en el modelo propuesto debe proporcionar recomendaciones lo más similares posibles a algún mecanismo de recomendación conocido. 4. La inferencia debe estar basada en modelos visuales. Hipótesis
  • 14. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 14 • Los sistemas de inferencia basado en reglas cumplen: 1. Se basan en un razonamiento muy cercano al humano (Modus ponens, Modus tollens) 2. No se usan ecuaciones matemáticas complejas. Modelo basado en reglas
  • 15. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 15 Modelo basado en reglas Ejemplo Hecho 1 En general suele gustar la película “Ocho apellidos vascos” Regla 1 Si te gusta la película “La isla mínima”, entonces probablemente te gustará la película “El niño” Hecho II Usuario no registrado Me gusta bastante la película “La isla mínima” Inferencia Usuario no registrado Sería interesante ver la película “Ocho apellidos vascos” (Hecho I) Sería interesante ver la película “El niño” (Regla I y Hecho II)
  • 16. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 16 1. Inferencia compleja para el usuario: El SR tiene que ofrecer una gran cantidad de reglas y hechos. 2. Basado en representación textual: El usuario tiene que leerse una gran cantidad de reglas y hechos para poder sacar sus propias conclusiones. Modelo basado en reglas Inconvenientes
  • 17. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 17 • Solventa los inconvenientes de los modelos basados en reglas: 1. No se definen infinidad de reglas y hechos. 2. Es un modelo visual (no implica lectura para el usuario) Modelo basado en grafos
  • 18. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 18 • Se propone un grafo no dirigido con las siguientes características: 1. Vértices: representarán a los ítems del SR y definirán una cantidad asociado al ítem i que indicarán el grado de confianza del hecho: Hecho: “En general suele gustar el ítem i” 2. Aristas: Dados dos ítems i,j; existe una arista entre dos vértices asociados a estos dos ítems si existe la regla del tipo: Regla: “Si te gusta el ítem i, entonces ‘probablemente’ te gustará el ítem j” La longitud de la arista equivaldrá al grado de incertidumbre de la regla (‘probablemente’,‘es posible’,‘quizás’, etc.) Modelo basado en grafos
  • 19. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 19 • El grafo obtenido en general no es plano (las aristas se cruzan). • No se puede representar con la longitud de la arista el grado de incertidumbre de las reglas. Modelos basados en grafos Inconvenientes
  • 20. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 20 • Construir un subgrafo a partir del grafo de relaciones entre ítems con las reglas más significativas (con mayor grado de confianza). • Dentro de los tipos de subgrafos, se han considerado los árboles de recubrimiento mínimo (ARM) ya que: 1. Son grafos planos. 2. Las aristas no se cruzan entre ellas. 3. Con la longitud de las aristas se puede representar el grado de confianza. 4. El problema de los ARM ha sido muy estudiado y es muy conocido en el campo de la algorítmica. Modelo definitivo
  • 21. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 21 Modelo definitivo Ejemplo Hecho En general suele gustar el item “I4” Regla Si te gusta el item “I2”, entonces probablemente te gustará el ítem “I5”
  • 22. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 22 Modelo definitivo Ejemplo del caso de estudio: RS-IST
  • 23. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 23 • La tesis propuesta puede encuadrarse dentro del área de visualización en Machine Learning. • Existen técnicas destinadas a la visualización de datos como: PC A, Kernel PC A, Mapas autoorganizados, técnicas de clustering, etc. • Estas técnicas no son adecuadas para representar los ítems de un SR ya que aunque representan en el plano los datos, no establecen relaciones entre los datos y por tanto no proporcionan un modelo de inferencia. Métodos de visualización en Machine Learning
  • 24. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 24 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 25. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 25 Método Calcular importancia del item Calcular distancias entre items Calcular el ARM Calcular la fiabilidad de las similaridades
  • 26. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) importancia(I1) = 2 importancia(I2) = 3 importancia(I6) = 2 importancia(I3) = 2 importancia(I4) = -2 importancia(I5) = -1 26 Método Paso I: Cálculo de la importancia de un ítem Usuarios Items U1 U2 U3 U4 U5 I1 4 5 4 1 I2 3 5 4 I3 1 5 5 I4 1 4 3 2 I5 2 4 3 2 I6 5
  • 27. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 27 Método Paso I: Cálculo de la importancia de un ítem Items I1 I2 I3 I4 I5 I6 Importancia 2 3 2 -2 -1 2
  • 28. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 28 Método Paso II: Cálculo de distancias entre ítems Usuarios Items U1 U2 U3 U4 U5 I1 4 5 4 1 I2 3 5 4 I3 1 5 5 I4 1 4 3 2 I5 2 4 3 2 I6 5 I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias
  • 29. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 29 Método Paso II: Cálculo de distancias entre ítems I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias
  • 30. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 30 Método Paso III: Cálculo del árbol de recubrimiento mínimo
  • 31. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 31 Método Paso IV: Cálculo de la fiabilidad de las similaridades Usuarios Items U1 U2 U3 U4 U5 I1 4 5 4 1 I2 3 5 4 I3 1 5 5 I4 1 4 3 2 I5 2 4 3 2 I6 5 I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias I1 I2 I3 I4 I5 I6 I1 x 0.75 0.40 0.60 0.60 0 I2 x 0.40 0.40 0.40 0 I3 x 0.75 0.75 0.33 I4 x 1 0.25 I5 x 0.25 I6 x Fiabilidad
  • 32. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 32 Método Paso IV: Cálculo de la fiabilidad de las similaridades I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias I1 I2 I3 I4 I5 I6 I1 x 0.75 0.40 0.60 0.60 0 I2 x 0.40 0.40 0.40 0 I3 x 0.75 0.75 0.33 I4 x 1 0.25 I5 x 0.25 I6 x Fiabilidad Fiabilidad 1 - 0.8 0.79 - 0.6 0.59 - 0.4 0.39 - 0.2 0.19 - 0 Color Rojo Naranja Verde Morado Azul Tramos de fiabilidad I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias I1 I2 I3 I4 I5 I6 I1 x 0.75 0.40 0.60 0.60 0 I2 x 0.40 0.40 0.40 0 I3 x 0.75 0.75 0.33 I4 x 1 0.25 I5 x 0.25 I6 x Fiabilidad
  • 33. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 33 Método Paso IV: Cálculo de la fiabilidad de las similaridades I1 I2 I3 I4 I5 I6 I1 x 0.02 0.53 0.33 0.13 x I2 x 0.06 0.16 0.06 x I3 x 0.46 0.46 1 I4 x 0.02 0.06 I5 x 0.06 I6 x Distancias
  • 34. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 34 Resultado y conclusiones Hecho En general suele gustar el item “I2” Hecho En general suele gustar el item “I1” Hecho En general suele gustar el item “I3” Regla Si te gusta el ítem “I5”, entonces probablemente te gustará el ítem “I4” Regla Si te gusta el ítem “I5”, entonces es posible que te guste el ítem “I2” Regla Si te gusta el ítem “I5”, entonces quizás te guste el ítem “I6”
  • 35. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 35 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 36. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 36 Método Calcular importancia del item Calcular distancias entre items Calcular el ARM Calcular la fiabilidad de las similaridades
  • 37. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 37 SR basados en contenido Sistemas de Recomendación Basados en Memoria Basados en Modelos SR basados en vectores de palabras LSI PLSI LDA Filtrado Basado en Contenido No probabilísticos Probabilísticos
  • 38. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 38 • Preprocesamiento de la descripción de los ítems: • Eliminar preposiciones, artículos, etc. • Sustituir plurales, diminutivos, etc. a su palabra raíz. • Se trabaja con una matriz de apariciones de palabras en los ítems (palabras/items). SR basados en contenido Items Palabras I1 I2 I3 I4 I5 Fútbol 3 0 2 0 0 Política 0 0 4 4 2
  • 39. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 39 • Calculan las recomendaciones basándose en el cálculo de distancias entre cada par de vectores de apariciones de palabras en los ítems. SR basados en vectores de palabras Items Palabras I1 I2 I3 I4 I5 Fútbol 3 0 2 0 0 Política 0 0 4 4 2 I1 I2 I3 I4 I5 I1 0 3.0 4.1 5.0 3.6 I2 3.0 0 4.5 4 2 I3 4.1 4.5 0 2 2.8 I4 5.0 4 2 0 2 I5 3.6 2 2.8 2 0 Distancia Euclidea I1 I2 I3 I4 I5 I1 0 3.0 4.1 5.0 3.6 I2 3.0 0 4.5 4 2 I3 4.1 4.5 0 2 2.8 I4 5.0 4 2 0 2 I5 3.6 2 2.8 2 0 Distancia Euclidea
  • 40. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 40 • Técnica de factorización matricial basada en la técnica matemática del SVD. • Extrae (a partir de la matriz de apariciones de palabras en ítems) una serie de factores latentes que caracterizan a las palabras y los documentos. • A partir de esos factores latentes podemos calcular las similaridades entre los ítems o las palabras. LSIPublicación Deerwester.S, Dumais.ST, Furnas.GW, Landauer.TK, and Harshman.R. Indexing by latent semantic analysis. Journal of the American Society for Information Science, page 391, 1990.
  • 41. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 41 LSI Teorema de Eckart-Young
  • 42. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 42 Cálculo de distancias Para SR basados en vectores de palabras y LSI SR basados en vectores de palabras LSI Métrica de similaridad basada en ángulos (Coseno)
  • 43. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 43 • El PLSI es una evolución del LSI al que se le añado un modelo probabilístico. • Descompone la matriz de apariciones de palabras/ítems en dos matrices que van a tener un significado probabilístico. • Los items y las palabras están caracterizados por una distribución de probabilidad en el que se indica con que grado un item o palabra pertenecen a un tema u otro. PLSIPublicación Hofmann.T. Probabilistic latent semantic indexing. International Computer Science Institute, 1999.
  • 44. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 44 PLSI Conjunto de temas: z ∈ Z = {z1,...,zk} Conjunto de palabras: w ∈ W = {w1,...,wn} Conjunto de documentos: d ∈ D = {d1,...,dm} Estudiar similaridades entre items Probabilidad de que un documento pertenezca a un determinado tema.
  • 45. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 45 PLSI Ejemplo Items Palabras I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11 Balón 3 2 Fútbol 2 6 8 1 1 Liga 3 1 CR7 6 7 Messi 1 2 5 Política 4 4 4 1 1 PP 6 3 1 PSOE 4 6 1 ZP 3 5 1 1 1 Rajoy 5 1 1 1 1 Dinero 1 4 4 FMI 5 4 4 UE 4 4 3 PIB 3 1 1 Ibex 2 K = 3 Temas Fútbol Política Economía I1 1.00 0 0 I2 1.00 0 0 I3 1.00 0 0 I4 0 1.00 0 I5 0 1.00 0 I6 0 1.00 0 I7 0 0 1.00 I8 0 0 1.00 I9 0 0.21 0.79 I10 0.33 0.33 0.33 I11 0.40 0.60 0 P (z | d)
  • 46. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 46 • Modelo probabilístico que se enmarca dentro de los modelos generativos ya que trata de describir como se crea un documento. • Al igual que el PLSI, el LDA calcula dos matrices de probabilidad P(w|z) y P(z|θ). • La diferencia radica en como se calculan las matrices de probabilidad: • LDA: Cada ítem esta representado por un vector que sigue una distribución de Dirichlet. • PLSI: Cada ítem esta representado por un vector que sigue una distribución categórica. LDAPublicación Blei.D, Ng.A, and Jordan.M. Latent dirichlet allocation. the Journal of machine Learning research, pages 993–1022, 2003.
  • 47. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 47 LDA Probabilidad de que un documento pertenezca a un determinado tema.
  • 48. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 48 LDA Ejemplo Items Palabras I1 I2 I3 I4 I5 I6 I7 I8 I9 I10 I11 Balón 3 2 Fútbol 2 6 8 1 1 Liga 3 1 CR7 6 7 Messi 1 2 5 Política 4 4 4 1 1 PP 6 3 1 PSOE 4 6 1 ZP 3 5 1 1 1 Rajoy 5 1 1 1 1 Dinero 1 4 4 FMI 5 4 4 UE 4 4 3 PIB 3 1 1 Ibex 2 K = 3 Temas Fútbol Política Economía I1 15.01 0.01 0.01 I2 15.01 0.01 0.01 I3 15.01 0.01 0.01 I4 0.01 15.01 0.01 I5 0.01 15.01 0.01 I6 0.01 15.01 0.01 I7 0.01 0.01 15.01 I8 0.01 2.01 13.01 I9 0.01 4.01 11.01 I10 1.01 1.01 1.01 I11 2.01 3.01 0.01 P (z | θ)
  • 49. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 49 Cálculo de distancias Para SR basados en modelos probabilísticos PLSI LDA Métrica de similaridad entre distribuciones de probabilidad Kullback-Liebler (KL)
  • 50. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 50 SR basados en filtrado colaborativo Sistemas de Recomendación Basados en Memoria Basados en Modelos Knn (K-Vecinos) Factorización Matricial Filtrado Colaborativo
  • 51. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 51 • Se toma como base la matriz de votos que los usuarios han emitido sobre los ítems • El filtrado colaborativo consiste en ver que usuarios (o ítems) son similares al usuario (o ítem) activo al que se ha de recomendar. SR basados en filtrado colaborativo Items Usuarios I1 I2 I3 I4 I5 I6 U1 4 3 1 2 U2 1 4 4 5 U3 5 5 U4 4 4 5 3 3 U5 1 5 2 2
  • 52. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 52 K-Vecinos Esquema general Calcular la similaridad Buscar los k vecinos Predecir votaciones Elegir items recomendados
  • 53. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 53 • Uno de los pasos más importantes es el de calcular la similaridad entre usuarios o ítems. • Se han propuesto varias métricas de similaridad • Tradicionales: MSD, Coseno, Correlación • Destacadas: JMSD, Singularidades • La distancia se calcula como: Cálculo de distancias Para la técnica de los K-Vecinos dist(I1,I2) = 1 - sim(I1,I2)
  • 54. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 54 • Una de las técnicas más importantes utilizadas en los SR basados en factorización matricial es el basado en SVD aplicado a los SR basados en FC. • Esta técnica tiene como finalidad la de obtener una serie de factores latentes que caractericen a los usuario y a los ítems. • A partir de estos factores se pueden calcular la similaridad en usuarios o entre ítems. SR basados en factorización matricial
  • 55. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 55 SVD aplicado a FC
  • 56. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 56 SVD aplicado a FC
  • 57. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 57 • Para el cálculo de similaridades entre usuario o entre ítems a partir de sus factores latentes, se puede utilizar cualquiera de las métricas basadas en distancias o en ángulos como el MSD, Coseno, Correlación, etc. • De igual forma la distancia se calcula como: Cálculo de distancias Para el SVD dist(I1,I2) = 1 - sim(I1,I2)
  • 58. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 58 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 59. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) Métodos Híbridos Sistemas de Recomendación Filtrado Demográfico Filtrado Basado en Contenido Filtrado Colaborativo Basados en Memoria Basados en Modelos Basados en Memoria Basados en Modelos Sistemas de Recomendación Filtrado Colaborativo Basados en Memoria 59 Caso de estudio
  • 60. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 60 Base de datos MovieLens Número de usuarios 6.040 Número de ítems 3.900 Número de votaciones 1.000.209 (1M) Escala 1 - 5
  • 61. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 61 RS-IST Visión general películas más populares
  • 62. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 62 RS-IST Películas más populares Hecho En general suele gustar la película “ ”
  • 63. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 63 RS-IST Ejemplo de inferencia Loca academia de policía Loca academia de policía 2 Loca academia de policía 4 Loca academia de policía 5 Loca academia de policía 3
  • 64. Texto del título Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 64 RS-IST Ejemplo (Muchos vértices adyacentes)
  • 65. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 65 • Introducción y contexto • Motivación, hipótesis y objetivos • Ejemplo del método propuesto • Técnicas y métricas de similaridad • Caso de estudio • Conclusiones y trabajos futuros Índice
  • 66. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 66 • Se ha presentado un modelo de inferencia sencillo para usuarios no registrados. • Se ha presentado un modelo de visualización para los ítems de un SR en los que es posible estudiar sus similaridades. • Como caso de estudio, se ha probado el modelo propuesto con la base de datos de MovieLens 1M. • Con el RS-IST resultante ha sido posible determinar que ítems (películas) han sido votadas de forma similar, pudiendo así “explicar las recomendaciones al estilo ítem”. Conclusiones
  • 67. Ricardo Moya García. (Mapas gráficos para la visualización de relaciones en sistemas de recomendación) 67 • Estudiar posibles formas de generar árboles personalizados para usuarios de los que se tiene cierta información sobre su perfil, gustos, etc. • Introducir otras medidas de fiabilidad. • Comparar las diferentes estructuras de árboles al aplicar diferentes medidas de similaridad entre ítems. • Incorporar una etapa de pre-clasterización. • Recuperación de información en las diferentes áreas en las que existen sistemas de recomendación basados en memoria (redes sociales, blogs, etc.), para poder aplicar más características a los árboles. • Árboles dirigidos (Poliárboles). • Aplicar este concepto a otros grafos planos (mallas). Trabajos futuros