SlideShare una empresa de Scribd logo
1 de 33
Descargar para leer sin conexión
Tópicos de Estadística & Data Mining 
en Big Data 
Sistemas de recomendación 
Lic. Ernesto Mislej 
Maestría en Exploración de Datos y 
Descubrimiento del Conocimiento 
Universidad de Buenos Aires 
ernesto@7puentes.com 
Octubre 2014
Tópicos de Estadística & Data Mining 
en Big Data 
Sistemas de recomendación 
Lic. Ernesto Mislej 
Maestría en Exploración de Datos y 
Descubrimiento del Conocimiento 
Universidad de Buenos Aires 
ernesto@7puentes.com 
Octubre 2014
Afro Celt Sound System
Definición 
Los Sistemas de Recomendación (RS), rec. systems, engines, 
frameworks, platforms es una disciplina derivada del Data 
Mining que se centra en el diseño de filtros sobre colecciones de 
items que son del gusto o del interés del usuario. 
Para tal fin se utilizan la historia de calificaciones realizada por 
el usuario y por la comunidad de usuarios. 
Se trabajan sobre dominos ligados al gusto como son las 
películas, programas de TV, video por demanda, música, libros, 
espectáculos, restaurantes, noticias, entre otros.
The Long Tail
The Long Tail 
 Recomendaciones de items muy poco populares y aún 
desconocidos por el usuario, pero que serán de su agrado! 
 20% de los items acumulan el 80% de los votos 
 Serendipia (a.k.a chiripa) ocurre cuando encontrás algo 
supuestamente inesperado.
Read http://www.wired.com/wired/archive/12.10/tail.html to learn more! 
!#!$%!$ '()*+*,-./*0123456.)78$9:;=5=54,,=/*?434,*3, :
The Netflix Prize
The Netflix Prize 
 Training data: 100 millones de calificaciones, 48.000 
usuarios, 17.770 películas 
 6 años de información: 2000-2005 
 Test data: Algunas últimas calificaciones de cada usuarios 
(2.8 millones) 
 Criterio de evaluation: root mean squared error (RMSE) 
 Netflix Cinematch RMSE: 0.9514 
 Concurso 2700+ equipos 
 $1M USD para aquél quien supere en un 10% a Netflix 
Cinematch 
 Grand Prize to team BellKor’s Pragmatic Chaos 21 de 
septiembre de 2009.
Juan Carlos
René
Sistemas de Recomendación 
Search Recommendations 
Items 
!#$%'()* 
Products, web sites, 
blogs, news items, …
Ejemplos de Sistemas de Recomendación 
1 Ofrecer artículos periodísticos en sitios de noticias online 
basados en los intereses del lector. 
2 Ofrecer sugerencias de productos en una tienda online 
basados en el historial de compra. 
3 Encontrar cuál es el grupo de fans con más ganas para 
viajar a ver un recital. 
4 Ofrecer cursos de capacitación a personas conociendo sus 
capacidades y su historia curricular. 
5 Sugerir destinos de viaje en relación a las búsquedas 
realizadas en una agencia de viajes online.
Paradigmas de los sistemas de recomendación 
Los recsys utilizan diferentes tecnologías, podemos clasificarlas 
dentro de este grupo de 2 (+1) categorías. 
 Basados en Contenido el sistema encuentra características 
de los ítems pertenecientes al catálogo y encuentra ítems 
aún no vistos. Por ejemplo, si el usuario vio muchas 
peliculas cowboys, el sistema recomendará otras películas 
de ese género. 
 Filtros Colaborativos el sistema encuentra otros usuarios 
similares respecto de sus historiales de compra y 
recomendará items aún no vistos. 
 Basados en Conocimiento: el sistema emula el 
comportamiento de un vendedor realizando preguntas para 
conocer cuáles son nuestros intereses
Paradigmas de los sistemas de recomendación
Paradigmas de los sistemas de recomendación 
Filtros personalizados: Sólo mostrame estás categorías
Paradigmas de los sistemas de recomendación 
Collaborative: Contame qué le gustó a mis pares
Paradigmas de los sistemas de recomendación 
Content-based: Dame más de lo que me gusta
Paradigmas de los sistemas de recomendación 
Knowledge-based: ¿Qué estás buscando?
Paradigmas de los sistemas de recomendación 
Híbridos: combinando los diferentes mecanismos
Content-based recommendation 
Idea: Recomendar ítems al usuario x similares a los ítems que 
previamente el usuario x calificó positivamente. Recomendar 
fantasy novels a la gente que le gustó fantasy novels en el 
pasado. 
Qué necesitamos: 
 características del item cómo el género. A ello lo llamamos 
(content). 
 construir un perfil del usuario que describen sus gustos 
(preferences). 
El objetivo: 
 inducir preferencias 
 reconocer items similares a los preferidos del usuario en el 
pasado.
Videos de gatos 
¿Dónde está el género?
Duplicados
Collaborative Filtering 
 C = conjunto de Usuarios 
 S = conjunto de Items 
 Función de utilidad u : C  S ! R 
 R = conjunto de calificaciones 
Matriz de utilidad: 
Item 1 Item 2 Item 3 Item 4 Item 5 
Alice 5 3 4 4 ? 
Berta 3 1 2 3 3 
Clara 4 3 4 3 5 
Diana 5 1 4 3 4 
Erika 1 5 5 2 1
Collaborative Filtering 
 Consideremos al 
usuario x 
 Identificar al grupo N 
de otros usuarios tal 
que sus califiaciones son 
similares a las 
calificaciones de x 
 Luego estimar las 
calificaciones de los 
ítems aún-no-vistos de x 
utilizando las 
calificaciones del grupo 
N 
ƒ !#$%'()*$'()! 
! 
ƒ +%#)$',)#)-),.'()) 
*$'($)/.$')(0,%#1$)) 
0(')2$%3%40(5),)) 
!6$)(0,%#1$) 
! 
ƒ 7$,%30,')!6$)(0,%#1$)) 
80$')#)(0,%#1$)) 
-)*$'($)%#)# 
) 
! 
# 
9:;9:=9) *(')?'$@A'BC)D,0#-()!EFG)H%#%#1)H0$$%A')I0,0$',$) =)
9.4.1 UV-Decomposition 
Consider movies as a case in point. Most users respond to a small number 
of features; they like certain genres, they may have certain famous actors or 
actresses that they like, and perhaps there are a few directors with a significant 
following. If we start with the utility matrix M, with n rows and m columns 
(i.e., there are n users and m items), then we might be able to find a matrix 
U with n rows and d columns and a matrix V with d rows and m columns, 
such that UV closely approximates M in those entries where M is nonblank. 
If so, then we have established that there are d dimensions that allow us to 
characterize both users and items closely. We can then use the entry in the 
product UV to estimate the corresponding blank entry in utility matrix M. 
This process is called UV-decomposition of M. 
Dimensionality Reduction 
Un enfoque sería intentar estimar las celdas vacías de la matriz 
de utilidad como el producto de 2 matrices (thin matrices) 
rectangulares. 
UV-Decomposition 
! 
# 
5 2 4 4 3 
3 1 2 4 1 
2 3 1 4 
2 5 4 3 5 
4 4 5 4 
$ 
%%%% 
= 
! 
# 
u11 u12 
u21 u22 
u31 u32 
u41 u42 
u51 u52 
$ 
%%%% 
× 
' 
v11 v12 v13 v14 v15 
v21 v22 v23 v24 v25 
( 
Figure 9.9: UV-decomposition of matrix M 
Example 9.11 : We shall use as a running example a 5-by-5 matrix M with
Cold Start
Explanation
Feedback
CARS 
Context-Aware 
Recommender Systems
KB Recommendation
PROs and CONs 
Content-based: 
PROs: No hace falta comunidad, solo func. de distancia entre ítems 
CONs: Content-descriptions, cold start para usuarios nuevos, no hay 
sorpresa. 
Collaborative Filtering (CF): 
PROs: Serendipia de resultados, reconoce segmentos del mercado 
CONs: Requiere feedback, cold start para usuarios nuevos e ítems. 
Knowledge-based: 
PROs: Recomendaciones determinísticas, calidad controlada, no hay 
cold-start, remite al diálogo del vendedor. 
CONs: Conocer el dominio del catálogo, no admite entorno dinámicos.
Referencias 
 The Netflix prize. http://www.netflixprize.com/ 
 The Long Tail: Why the Future of Business is Selling Less of 
More, by Chris Anderson. 
 Recommender Systems: An Introduction, by Markus Zanker, 
Alexander Felfernig, Gerhard Friedrich. 
 Recommender Systems Handbook, by Lior Rokach, Bracha 
Shapira. 
 The ACM Conference Series on Recommender Systems. 
http://recsys.acm.org/ 
 Recommendation Systems - Mining of Massive Datasets, 
Chap. 9, by Anand Rajaraman, Jeff Ullman y Jure Leskovec.

Más contenido relacionado

Destacado

Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Ernesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Ernesto Mislej
 
Tópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisTópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisErnesto Mislej
 
Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Ernesto Mislej
 
Tópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresTópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresErnesto Mislej
 
Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big DataErnesto Mislej
 
Data Science & Big Data
Data Science & Big DataData Science & Big Data
Data Science & Big DataErnesto Mislej
 

Destacado (7)

Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4Curso de Nivelación de Algoritmos - Clase 4
Curso de Nivelación de Algoritmos - Clase 4
 
Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5Curso de Nivelación de Algoritmos - Clase 5
Curso de Nivelación de Algoritmos - Clase 5
 
Tópicos de Big Data - Link Analysis
Tópicos de Big Data - Link AnalysisTópicos de Big Data - Link Analysis
Tópicos de Big Data - Link Analysis
 
Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3Curso de Nivelación de Algoritmos - Clase 3
Curso de Nivelación de Algoritmos - Clase 3
 
Tópicos de Big Data - Items Similares
Tópicos de Big Data - Items SimilaresTópicos de Big Data - Items Similares
Tópicos de Big Data - Items Similares
 
Innovación en Big Data
Innovación en Big DataInnovación en Big Data
Innovación en Big Data
 
Data Science & Big Data
Data Science & Big DataData Science & Big Data
Data Science & Big Data
 

Similar a Tópicos de Big Data - Sistemas de Recomendación

Seminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónSeminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónalmudena ruiz
 
Motores de recomendacion (Recommendation engines)
Motores de recomendacion (Recommendation engines)Motores de recomendacion (Recommendation engines)
Motores de recomendacion (Recommendation engines)Luis Francisco
 
Intelligent Methods for Information Access in Context: The Role of Topic Desc...
Intelligent Methods for Information Access in Context: The Role of Topic Desc...Intelligent Methods for Information Access in Context: The Role of Topic Desc...
Intelligent Methods for Information Access in Context: The Role of Topic Desc...Carlos Lorenzetti
 
Sistemas De Recomendación
Sistemas De RecomendaciónSistemas De Recomendación
Sistemas De Recomendaciónkamui002
 
Sistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónSistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónBlanca Alicia Vargas Govea
 
Filtros Colaborativos y Sistemas de Recomendación
Filtros Colaborativos y Sistemas de RecomendaciónFiltros Colaborativos y Sistemas de Recomendación
Filtros Colaborativos y Sistemas de RecomendaciónGabriel Huecas
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxAnonymousEoGAaTF
 
04 7n1is triptico diseno dialogos
04 7n1is triptico diseno dialogos04 7n1is triptico diseno dialogos
04 7n1is triptico diseno dialogosManuel Mujica
 
Buscador Semántico
Buscador SemánticoBuscador Semántico
Buscador SemánticoFlor Cuenca
 
08-Metadatos_Ontologias_y_Web_Semantica.pdf
08-Metadatos_Ontologias_y_Web_Semantica.pdf08-Metadatos_Ontologias_y_Web_Semantica.pdf
08-Metadatos_Ontologias_y_Web_Semantica.pdfDAVIDMOISESOREMEJIA
 
Lecciones aprendidas creando una red social
Lecciones aprendidas creando una red socialLecciones aprendidas creando una red social
Lecciones aprendidas creando una red socialRoberto Luis Bisbé
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acLuis Jherry
 
Lindsay (fundamentos y metodos de analisis y requirimientos)
Lindsay (fundamentos y metodos de analisis y requirimientos)Lindsay (fundamentos y metodos de analisis y requirimientos)
Lindsay (fundamentos y metodos de analisis y requirimientos)LindsayLeblanc3
 

Similar a Tópicos de Big Data - Sistemas de Recomendación (20)

Seminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónSeminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendación
 
Motores de recomendacion (Recommendation engines)
Motores de recomendacion (Recommendation engines)Motores de recomendacion (Recommendation engines)
Motores de recomendacion (Recommendation engines)
 
Bases de datos ss14
Bases de datos ss14Bases de datos ss14
Bases de datos ss14
 
Intelligent Methods for Information Access in Context: The Role of Topic Desc...
Intelligent Methods for Information Access in Context: The Role of Topic Desc...Intelligent Methods for Information Access in Context: The Role of Topic Desc...
Intelligent Methods for Information Access in Context: The Role of Topic Desc...
 
Sistemas De Recomendación
Sistemas De RecomendaciónSistemas De Recomendación
Sistemas De Recomendación
 
Sistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluaciónSistemas de recomendación: tipos y evaluación
Sistemas de recomendación: tipos y evaluación
 
Filtros Colaborativos y Sistemas de Recomendación
Filtros Colaborativos y Sistemas de RecomendaciónFiltros Colaborativos y Sistemas de Recomendación
Filtros Colaborativos y Sistemas de Recomendación
 
Filtrado colaborativo
Filtrado colaborativoFiltrado colaborativo
Filtrado colaborativo
 
Bases de datos ss14
Bases de datos ss14Bases de datos ss14
Bases de datos ss14
 
Bases de datos ss14
Bases de datos ss14Bases de datos ss14
Bases de datos ss14
 
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptxIntroduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
Introduccin_a_la_Minera_de_Datos_M_cc_v2.pptx
 
04 7n1is triptico diseno dialogos
04 7n1is triptico diseno dialogos04 7n1is triptico diseno dialogos
04 7n1is triptico diseno dialogos
 
Buscador Semántico
Buscador SemánticoBuscador Semántico
Buscador Semántico
 
08-Metadatos_Ontologias_y_Web_Semantica.pdf
08-Metadatos_Ontologias_y_Web_Semantica.pdf08-Metadatos_Ontologias_y_Web_Semantica.pdf
08-Metadatos_Ontologias_y_Web_Semantica.pdf
 
Modelo Entidad Relacion.pdf
Modelo Entidad Relacion.pdfModelo Entidad Relacion.pdf
Modelo Entidad Relacion.pdf
 
Lecciones aprendidas creando una red social
Lecciones aprendidas creando una red socialLecciones aprendidas creando una red social
Lecciones aprendidas creando una red social
 
Clase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd acClase 2 ciclo de vida bd ac
Clase 2 ciclo de vida bd ac
 
Lindsay (fundamentos y metodos de analisis y requirimientos)
Lindsay (fundamentos y metodos de analisis y requirimientos)Lindsay (fundamentos y metodos de analisis y requirimientos)
Lindsay (fundamentos y metodos de analisis y requirimientos)
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
TOminer-1.2
TOminer-1.2TOminer-1.2
TOminer-1.2
 

Último

Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfvladimiroflores1
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxMiguelAtencio10
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21mariacbr99
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.FlorenciaCattelani
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanamcerpam
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estossgonzalezp1
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...JohnRamos830530
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfAnnimoUno1
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxAlan779941
 

Último (11)

Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21Innovaciones tecnologicas en el siglo 21
Innovaciones tecnologicas en el siglo 21
 
How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.How to use Redis with MuleSoft. A quick start presentation.
How to use Redis with MuleSoft. A quick start presentation.
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
Resistencia extrema al cobre por un consorcio bacteriano conformado por Sulfo...
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 

Tópicos de Big Data - Sistemas de Recomendación

  • 1. Tópicos de Estadística & Data Mining en Big Data Sistemas de recomendación Lic. Ernesto Mislej Maestría en Exploración de Datos y Descubrimiento del Conocimiento Universidad de Buenos Aires ernesto@7puentes.com Octubre 2014
  • 2. Tópicos de Estadística & Data Mining en Big Data Sistemas de recomendación Lic. Ernesto Mislej Maestría en Exploración de Datos y Descubrimiento del Conocimiento Universidad de Buenos Aires ernesto@7puentes.com Octubre 2014
  • 4. Definición Los Sistemas de Recomendación (RS), rec. systems, engines, frameworks, platforms es una disciplina derivada del Data Mining que se centra en el diseño de filtros sobre colecciones de items que son del gusto o del interés del usuario. Para tal fin se utilizan la historia de calificaciones realizada por el usuario y por la comunidad de usuarios. Se trabajan sobre dominos ligados al gusto como son las películas, programas de TV, video por demanda, música, libros, espectáculos, restaurantes, noticias, entre otros.
  • 6. The Long Tail Recomendaciones de items muy poco populares y aún desconocidos por el usuario, pero que serán de su agrado! 20% de los items acumulan el 80% de los votos Serendipia (a.k.a chiripa) ocurre cuando encontrás algo supuestamente inesperado.
  • 7. Read http://www.wired.com/wired/archive/12.10/tail.html to learn more! !#!$%!$ '()*+*,-./*0123456.)78$9:;=5=54,,=/*?434,*3, :
  • 9. The Netflix Prize Training data: 100 millones de calificaciones, 48.000 usuarios, 17.770 películas 6 años de información: 2000-2005 Test data: Algunas últimas calificaciones de cada usuarios (2.8 millones) Criterio de evaluation: root mean squared error (RMSE) Netflix Cinematch RMSE: 0.9514 Concurso 2700+ equipos $1M USD para aquél quien supere en un 10% a Netflix Cinematch Grand Prize to team BellKor’s Pragmatic Chaos 21 de septiembre de 2009.
  • 11. René
  • 12. Sistemas de Recomendación Search Recommendations Items !#$%'()* Products, web sites, blogs, news items, …
  • 13. Ejemplos de Sistemas de Recomendación 1 Ofrecer artículos periodísticos en sitios de noticias online basados en los intereses del lector. 2 Ofrecer sugerencias de productos en una tienda online basados en el historial de compra. 3 Encontrar cuál es el grupo de fans con más ganas para viajar a ver un recital. 4 Ofrecer cursos de capacitación a personas conociendo sus capacidades y su historia curricular. 5 Sugerir destinos de viaje en relación a las búsquedas realizadas en una agencia de viajes online.
  • 14. Paradigmas de los sistemas de recomendación Los recsys utilizan diferentes tecnologías, podemos clasificarlas dentro de este grupo de 2 (+1) categorías. Basados en Contenido el sistema encuentra características de los ítems pertenecientes al catálogo y encuentra ítems aún no vistos. Por ejemplo, si el usuario vio muchas peliculas cowboys, el sistema recomendará otras películas de ese género. Filtros Colaborativos el sistema encuentra otros usuarios similares respecto de sus historiales de compra y recomendará items aún no vistos. Basados en Conocimiento: el sistema emula el comportamiento de un vendedor realizando preguntas para conocer cuáles son nuestros intereses
  • 15. Paradigmas de los sistemas de recomendación
  • 16. Paradigmas de los sistemas de recomendación Filtros personalizados: Sólo mostrame estás categorías
  • 17. Paradigmas de los sistemas de recomendación Collaborative: Contame qué le gustó a mis pares
  • 18. Paradigmas de los sistemas de recomendación Content-based: Dame más de lo que me gusta
  • 19. Paradigmas de los sistemas de recomendación Knowledge-based: ¿Qué estás buscando?
  • 20. Paradigmas de los sistemas de recomendación Híbridos: combinando los diferentes mecanismos
  • 21. Content-based recommendation Idea: Recomendar ítems al usuario x similares a los ítems que previamente el usuario x calificó positivamente. Recomendar fantasy novels a la gente que le gustó fantasy novels en el pasado. Qué necesitamos: características del item cómo el género. A ello lo llamamos (content). construir un perfil del usuario que describen sus gustos (preferences). El objetivo: inducir preferencias reconocer items similares a los preferidos del usuario en el pasado.
  • 22. Videos de gatos ¿Dónde está el género?
  • 24. Collaborative Filtering C = conjunto de Usuarios S = conjunto de Items Función de utilidad u : C S ! R R = conjunto de calificaciones Matriz de utilidad: Item 1 Item 2 Item 3 Item 4 Item 5 Alice 5 3 4 4 ? Berta 3 1 2 3 3 Clara 4 3 4 3 5 Diana 5 1 4 3 4 Erika 1 5 5 2 1
  • 25. Collaborative Filtering Consideremos al usuario x Identificar al grupo N de otros usuarios tal que sus califiaciones son similares a las calificaciones de x Luego estimar las calificaciones de los ítems aún-no-vistos de x utilizando las calificaciones del grupo N ƒ !#$%'()*$'()! ! ƒ +%#)$',)#)-),.'()) *$'($)/.$')(0,%#1$)) 0(')2$%3%40(5),)) !6$)(0,%#1$) ! ƒ 7$,%30,')!6$)(0,%#1$)) 80$')#)(0,%#1$)) -)*$'($)%#)# ) ! # 9:;9:=9) *(')?'$@A'BC)D,0#-()!EFG)H%#%#1)H0$$%A')I0,0$',$) =)
  • 26. 9.4.1 UV-Decomposition Consider movies as a case in point. Most users respond to a small number of features; they like certain genres, they may have certain famous actors or actresses that they like, and perhaps there are a few directors with a significant following. If we start with the utility matrix M, with n rows and m columns (i.e., there are n users and m items), then we might be able to find a matrix U with n rows and d columns and a matrix V with d rows and m columns, such that UV closely approximates M in those entries where M is nonblank. If so, then we have established that there are d dimensions that allow us to characterize both users and items closely. We can then use the entry in the product UV to estimate the corresponding blank entry in utility matrix M. This process is called UV-decomposition of M. Dimensionality Reduction Un enfoque sería intentar estimar las celdas vacías de la matriz de utilidad como el producto de 2 matrices (thin matrices) rectangulares. UV-Decomposition ! # 5 2 4 4 3 3 1 2 4 1 2 3 1 4 2 5 4 3 5 4 4 5 4 $ %%%% = ! # u11 u12 u21 u22 u31 u32 u41 u42 u51 u52 $ %%%% × ' v11 v12 v13 v14 v15 v21 v22 v23 v24 v25 ( Figure 9.9: UV-decomposition of matrix M Example 9.11 : We shall use as a running example a 5-by-5 matrix M with
  • 32. PROs and CONs Content-based: PROs: No hace falta comunidad, solo func. de distancia entre ítems CONs: Content-descriptions, cold start para usuarios nuevos, no hay sorpresa. Collaborative Filtering (CF): PROs: Serendipia de resultados, reconoce segmentos del mercado CONs: Requiere feedback, cold start para usuarios nuevos e ítems. Knowledge-based: PROs: Recomendaciones determinísticas, calidad controlada, no hay cold-start, remite al diálogo del vendedor. CONs: Conocer el dominio del catálogo, no admite entorno dinámicos.
  • 33. Referencias The Netflix prize. http://www.netflixprize.com/ The Long Tail: Why the Future of Business is Selling Less of More, by Chris Anderson. Recommender Systems: An Introduction, by Markus Zanker, Alexander Felfernig, Gerhard Friedrich. Recommender Systems Handbook, by Lior Rokach, Bracha Shapira. The ACM Conference Series on Recommender Systems. http://recsys.acm.org/ Recommendation Systems - Mining of Massive Datasets, Chap. 9, by Anand Rajaraman, Jeff Ullman y Jure Leskovec.