SlideShare una empresa de Scribd logo
1 de 84
Evaluación de sistemas
de recomendación
Luis Brassara (luis.brassara@almundo.com)
Introducción a los sistemas
de recomendación
• Qué es un sistema de recomendación?
Introducción a los sistemas
de recomendación
• Familias de sistemas de recomendación (content
based filtering vs collaborative filtering)
Introducción a los sistemas
de recomendación
• Content based filtering:
Le gusta
Similar
• Collaborative filtering:
Introducción a los sistemas
de recomendación
SimilarLe gusta Le gusta
Introducción a los sistemas
de recomendación
• Feedback del usuario (explícito vs implícito)
Introducción a los sistemas
de recomendación
• Modelo: utility matrix
Introducción a los sistemas
de recomendación
3
4
4
5
?
?? ?
?
2
3 5
Slope one
• Collaborative filtering
Slope one
• Collaborative filtering
• Se basa en las diferencias promedio entre los
rankings de los productos
Slope one
• Collaborative filtering
• Se basa en las diferencias promedio entre los
rankings de los productos
• Uno de los más triviales, pero…
Slope one
3 ?
4 4.5
Slope one
3
4 4.5
+0.5
?
Slope one
3
4 4.5
3.5
3 + 0.5 = 3.5
Slope one
4.5
?
?
25
34
3
4
Slope one
3
4.5
?
?
25
34
4
−2
Slope one
3
4.5
?
25
34
4
4.5 − 2 = 2.5
2.5
Slope one
3
4.5
?
?
25
34
4
−1
Slope one
3
4.5
?
25
34
4
4 − 1 = 3
3
Slope one
3
4.5
?
2.5 + 3
2
= 2.75
25
24
4 2.75
Weighted slope one
3
4.5
?
2.5 ⋅ 2 + 3 ⋅ 1
3
= 2.66
25
24
4 2.66
Evaluación de sistemas de
recomendación
• Como medir que tan bien estamos
recomendando?
Evaluación de sistemas de
recomendación
• Como medir que tan bien estamos
recomendando?
• Métricas offline vs métricas online
Métricas online
• Click-through rate (CTR)
Métricas online
• Click-through rate (CTR)
• Conversion rate (CR)
Métricas online
• Click-through rate (CTR)
• Conversion rate (CR)
• Corto y largo plazo (Lifetime value o LTV)
Métricas online
• Click-through rate (CTR)
• Conversion rate (CR)
• Corto y largo plazo (Lifetime value o LTV)
• A/B testing vs Multi armed bandits
Métricas offline
• Probar en producción tiene un costo
Métricas offline
• Probar en producción tiene un costo
• Lleva tiempo alcanzar significancia estadística
Métricas offline
• Probar en producción tiene un costo
• Lleva tiempo alcanzar significancia estadística
• Permiten selección preliminar de
hiperparámetros y modelos
Train & test set
• Como separar los datos para train y test de los
modelos?
Train & test set
• Como separar los datos para train y test de los
modelos?
• No separar por usuarios completos…
Train & test set
• Como separar los datos para train y test de los
modelos?
• No separar por usuarios completos…
• Separar por interacciones de usuarios con
productos!
Train & test set
t
Train & test set
Train Test
t
Root squared mean error
(RSME)
1. Antes de entrenar el modelo guardar algunos
ratings conocidos para validación
Root squared mean error
(RSME)
4.5
?
?
35
24
4
4
Root squared mean error
(RSME)
4.5
?
?
35
24
4
4
Root squared mean error
(RSME)
4.5
?
?
35
4
4
?
?
Root squared mean error
(RSME)
2. Entrenar el modelo
Root squared mean error
(RSME)
4.5
35
4
4
3
53
5
(4)
(2)
Root squared mean error
(RSME)
3. Calcular el RSME entre los N ratings que
guardamos para validación y los ratings que el
modelo predijo para esas posiciones
RMSE =
∑𝑖=1
𝑁
(𝑦
̂
𝑖 − 𝑦𝑖)2
𝑁
Root squared mean error
(RSME)
4.5
35
4
4
3
53
5
RMSE =
(3 − 4)2 + (5 − 2)2
2
= 2.24
(4)
(2)
Root squared mean error
(RSME)
• Métricas similares: Mean Absolute Error (MAE),
Mean Squared Error (MSE)
Root squared mean error
(RSME)
• Métricas similares: Mean Absolute Error (MAE),
Mean Squared Error (MSE)
• Muy popular en la literatura de machine learning
para regresiones o clasificadores, pero…
Relevancia
• En general no nos interesa tanto predecir el
rating exacto de un usuario hacia un producto…
Relevancia
• En general no nos interesa tanto predecir el
rating exacto de un usuario hacia un producto…
• Nos interesa si un producto es relevante o no
para el usuario!
Reformulando el problema
• Pensemos en la recomendación como elegir un
conjunto de productos para el usuario
Reformulando el problema
• Pensemos en la recomendación como elegir un
conjunto de productos para el usuario
• Idealmente, queremos que todos los productos
en el conjunto sean relevantes para el usuario
Reformulando el problema
• Pensemos en la recomendación como elegir un
conjunto de productos para el usuario
• Idealmente, queremos que todos los productos
en el conjunto sean relevantes para el usuario
• Pensandolo como conjuntos…
Reformulando el problema
Recomendados Relevantes
Reformulando el problema
Los tenía que recomendar
y los recomendó
Recomendados Relevantes
Reformulando el problema
No los tenía que recomendar
y los recomendó
Recomendados Relevantes
Reformulando el problema
Lo tenía que recomendar
y no lo recomendó
Recomendados Relevantes
Precision vs Recall
Precision =
|Relevantes ∩ Recomendados|
|Recomendados|
Recomendados Relevantes
Precision vs Recall
Precision =
|Relevantes ∩ Recomendados|
|Recomendados|
=
3
5
Recomendados Relevantes
Precision vs Recall
Recall =
|Relevantes ∩ Recomendados|
|Relevantes|
Recomendados Relevantes
Precision vs Recall
Recall =
|Relevantes ∩ Recomendados|
|Relevantes|
=
3
4
Recomendados Relevantes
Precision vs Recall
• Existe un trade-off…
Precision vs Recall
• Existe un trade-off…
Precision vs Recall
𝐹𝑚𝑒𝑎𝑠𝑢𝑟𝑒 =
2
1
recall
+
1
precision
= 2 ⋅
precision ⋅ rec
precision + re
• Se suele usar el promedio (armónico) entre
precision y recall como balance entre ambas
Precision vs Recall
• Métricas similares: Receiver operating
characteristic (ROC)
Contexto
• Las recomendaciones se pueden mostrar en
distintos contextos (home, checkout, thank you
page, etc)
• Las recomendaciones se pueden mostrar en
distintos contextos (home, checkout, thank you
page, etc)
• Cada contexto tiene un propósito distinto
(inspirational, cross-selling, etc)
Contexto
• Las recomendaciones se pueden mostrar en
distintos contextos (home, checkout, thank you
page, etc)
• Cada contexto tiene un propósito distinto
(inspirational, cross-selling, etc)
• Y también una presentación distinta (carrousel
con K recomendaciones vs. scroll infinito)
Contexto
Precision at K
• Vimos que en algunos contextos siempre se
recomiendan exactamente K productos
Precision at K
• Vimos que en algunos contextos siempre se
recomiendan exactamente K productos
• Tienen sentido precision y recall que tienen en
cuenta todo el conjunto de recomendaciones?
Precision at K
• Vimos que en algunos contextos siempre se
recomiendan exactamente K productos
• Tienen sentido precision y recall que tienen en
cuenta todo el conjunto de recomendaciones?
• Precision at K (o Precision@K) es la precision
limitándose a los primeros K productos
recomendados
Orden
• En general nos importa el orden en que el
usuario ve las recomendaciones
Orden
• En general nos importa el orden en que el
usuario ve las recomendaciones
• Tienen sentido las métricas anteriores para
conjuntos para evaluar sistemas de
recomendación que devuelven listas?
Normalized Discounted
Cumulative Gain (nDCG)
Normalized Discounted
Cumulative Gain (nDCG)
• Se suele tardar varios meses en memorizar las
siglas, pero…
Normalized Discounted
Cumulative Gain (nDCG)
• Cumulative Gain:
CG = ∑
𝑖=1
𝑘
𝑟𝑒𝑙𝑖
Normalized Discounted
Cumulative Gain (nDCG)
• Discounted Cumulative Gain:
DCG = ∑
𝑖=1
𝑘 𝑟𝑒𝑙𝑖
log2(𝑖 + 1)
Normalized Discounted
Cumulative Gain (nDCG)
1 2 3
Normalized Discounted
Cumulative Gain (nDCG)
1 2 3
DCG =
1
log2(2)
+
1
log2(3)
+
1
log2(4)
= 2.13
Normalized Discounted
Cumulative Gain (nDCG)
DCG =
1
log2(2)
+
1
log2(3)
+
0
log2(4)
= 1.63
1 2 3
Normalized Discounted
Cumulative Gain (nDCG)
1 2 3
DCG =
1
log2(2)
+
0
log2(3)
+
1
log2(4)
= 1.50
Normalized Discounted
Cumulative Gain (nDCG)
1 2 3
DCG =
0
log2(2)
+
1
log2(3)
+
1
log2(4)
= 1.13
Normalized Discounted
Cumulative Gain (nDCG)
• Normalized Discounted Cumulative Gain:
nDCG =
𝐷𝐶𝐺
𝐼𝐷𝐶𝐺
Normalized Discounted
Cumulative Gain (nDCG)
• Normalized Discounted Cumulative Gain:
nDCG =
𝐷𝐶𝐺
𝐼𝐷𝐶𝐺
DCG de recomendación
ideal para el usuario
DCG de nuestra recomendación
Normalized Discounted
Cumulative Gain (nDCG)
• Métricas similares: Mean Reciprocal Rank
(MRR), Mean Average Precision (MAP)
Otras cualidades deseables
• Novelty / Serendipity
• Diversity
• Coverage
• Son medibles?
Evaluacion de sistemas de recomendacion

Más contenido relacionado

La actualidad más candente

Product Recommendations Enhanced with Reviews
Product Recommendations Enhanced with ReviewsProduct Recommendations Enhanced with Reviews
Product Recommendations Enhanced with Reviewsmaranlar
 
Feature Selection in Machine Learning
Feature Selection in Machine LearningFeature Selection in Machine Learning
Feature Selection in Machine LearningUpekha Vandebona
 
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...What is Machine Learning | Introduction to Machine Learning | Machine Learnin...
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...Simplilearn
 
Past, present, and future of Recommender Systems: an industry perspective
Past, present, and future of Recommender Systems: an industry perspectivePast, present, and future of Recommender Systems: an industry perspective
Past, present, and future of Recommender Systems: an industry perspectiveXavier Amatriain
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidosTensor
 
Classification techniques in data mining
Classification techniques in data miningClassification techniques in data mining
Classification techniques in data miningKamal Acharya
 
Matrix Factorization In Recommender Systems
Matrix Factorization In Recommender SystemsMatrix Factorization In Recommender Systems
Matrix Factorization In Recommender SystemsYONG ZHENG
 
Seminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónSeminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónalmudena ruiz
 
Recommendation Systems Basics
Recommendation Systems BasicsRecommendation Systems Basics
Recommendation Systems BasicsJarin Tasnim Khan
 
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...Simplilearn
 
An introduction to Recommender Systems
An introduction to Recommender SystemsAn introduction to Recommender Systems
An introduction to Recommender SystemsDavid Zibriczky
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learningKoundinya Desiraju
 
Collaborative Filtering using KNN
Collaborative Filtering using KNNCollaborative Filtering using KNN
Collaborative Filtering using KNNŞeyda Hatipoğlu
 
Recommendation system
Recommendation systemRecommendation system
Recommendation systemSAIFUR RAHMAN
 
Model selection and cross validation techniques
Model selection and cross validation techniquesModel selection and cross validation techniques
Model selection and cross validation techniquesVenkata Reddy Konasani
 

La actualidad más candente (20)

JAVA ORIENTADO A OBJETOS - ARREGLOS
JAVA ORIENTADO A OBJETOS - ARREGLOSJAVA ORIENTADO A OBJETOS - ARREGLOS
JAVA ORIENTADO A OBJETOS - ARREGLOS
 
Recommender Systems
Recommender SystemsRecommender Systems
Recommender Systems
 
Matrix Factorization
Matrix FactorizationMatrix Factorization
Matrix Factorization
 
Product Recommendations Enhanced with Reviews
Product Recommendations Enhanced with ReviewsProduct Recommendations Enhanced with Reviews
Product Recommendations Enhanced with Reviews
 
Recommender system
Recommender systemRecommender system
Recommender system
 
Feature Selection in Machine Learning
Feature Selection in Machine LearningFeature Selection in Machine Learning
Feature Selection in Machine Learning
 
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...What is Machine Learning | Introduction to Machine Learning | Machine Learnin...
What is Machine Learning | Introduction to Machine Learning | Machine Learnin...
 
Past, present, and future of Recommender Systems: an industry perspective
Past, present, and future of Recommender Systems: an industry perspectivePast, present, and future of Recommender Systems: an industry perspective
Past, present, and future of Recommender Systems: an industry perspective
 
Sistemas distribuidos
Sistemas distribuidosSistemas distribuidos
Sistemas distribuidos
 
Classification techniques in data mining
Classification techniques in data miningClassification techniques in data mining
Classification techniques in data mining
 
Matrix Factorization In Recommender Systems
Matrix Factorization In Recommender SystemsMatrix Factorization In Recommender Systems
Matrix Factorization In Recommender Systems
 
Seminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendaciónSeminario sobre sistemas de recomendación
Seminario sobre sistemas de recomendación
 
Recommendation Systems Basics
Recommendation Systems BasicsRecommendation Systems Basics
Recommendation Systems Basics
 
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...
Machine Learning Tutorial Part - 2 | Machine Learning Tutorial For Beginners ...
 
An introduction to Recommender Systems
An introduction to Recommender SystemsAn introduction to Recommender Systems
An introduction to Recommender Systems
 
Aprendizaje no supervisado
Aprendizaje no supervisadoAprendizaje no supervisado
Aprendizaje no supervisado
 
Introduction to machine learning
Introduction to machine learningIntroduction to machine learning
Introduction to machine learning
 
Collaborative Filtering using KNN
Collaborative Filtering using KNNCollaborative Filtering using KNN
Collaborative Filtering using KNN
 
Recommendation system
Recommendation systemRecommendation system
Recommendation system
 
Model selection and cross validation techniques
Model selection and cross validation techniquesModel selection and cross validation techniques
Model selection and cross validation techniques
 

Similar a Evaluacion de sistemas de recomendacion

Analisis Conjiint en ddetalle y friendly.pdf
Analisis Conjiint en ddetalle y friendly.pdfAnalisis Conjiint en ddetalle y friendly.pdf
Analisis Conjiint en ddetalle y friendly.pdfssuserd8290b1
 
Análisis de Negocio Ágil, ¿es esto viable?.
Análisis de Negocio Ágil, ¿es esto viable?.Análisis de Negocio Ágil, ¿es esto viable?.
Análisis de Negocio Ágil, ¿es esto viable?.Software Guru
 
Qfd casa de la calidad
Qfd casa de la calidadQfd casa de la calidad
Qfd casa de la calidadchirioska
 
Conceptos de desarrollo ágil
Conceptos de desarrollo ágilConceptos de desarrollo ágil
Conceptos de desarrollo ágilGuino Henostroza
 
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOS
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOSWEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOS
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOSDISC for All
 
Pruebas de software agiles
Pruebas de software agilesPruebas de software agiles
Pruebas de software agilesGuino Henostroza
 
Sesión 2 taller negociando como un profesional capitalizarme
Sesión 2 taller negociando como un profesional   capitalizarmeSesión 2 taller negociando como un profesional   capitalizarme
Sesión 2 taller negociando como un profesional capitalizarmeConsultora Frismo Ltda
 
Como lograr mejora con agile dev
Como lograr mejora con agile devComo lograr mejora con agile dev
Como lograr mejora con agile devLuis Mulato
 
Patrones de Scrum orientados al valor
Patrones de Scrum orientados al valorPatrones de Scrum orientados al valor
Patrones de Scrum orientados al valorMarco Avendaño
 
FUNDAMENTOS_DE_GESTION_14.pptx
FUNDAMENTOS_DE_GESTION_14.pptxFUNDAMENTOS_DE_GESTION_14.pptx
FUNDAMENTOS_DE_GESTION_14.pptxDashaImpresiones
 
Resumen de los 10 videos
Resumen de los 10 videosResumen de los 10 videos
Resumen de los 10 videosShadrickSdn1
 
2. Herramientas de calidad.pptx
2. Herramientas de calidad.pptx2. Herramientas de calidad.pptx
2. Herramientas de calidad.pptxIlianMontalvo
 
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...Claudia Badell
 

Similar a Evaluacion de sistemas de recomendacion (20)

Analisis Conjiint en ddetalle y friendly.pdf
Analisis Conjiint en ddetalle y friendly.pdfAnalisis Conjiint en ddetalle y friendly.pdf
Analisis Conjiint en ddetalle y friendly.pdf
 
Rodrigo Sanchez, mer
Rodrigo Sanchez, merRodrigo Sanchez, mer
Rodrigo Sanchez, mer
 
Análisis de Negocio Ágil, ¿es esto viable?.
Análisis de Negocio Ágil, ¿es esto viable?.Análisis de Negocio Ágil, ¿es esto viable?.
Análisis de Negocio Ágil, ¿es esto viable?.
 
Qfd casa de la calidad
Qfd casa de la calidadQfd casa de la calidad
Qfd casa de la calidad
 
Conceptos de desarrollo ágil
Conceptos de desarrollo ágilConceptos de desarrollo ágil
Conceptos de desarrollo ágil
 
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOS
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOSWEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOS
WEBINAR GRATUITO - DISC PARA LOS RECURSOS HUMANOS
 
Pruebas de software agiles
Pruebas de software agilesPruebas de software agiles
Pruebas de software agiles
 
Objetivos.ppt
Objetivos.pptObjetivos.ppt
Objetivos.ppt
 
Scrum
ScrumScrum
Scrum
 
Conversion thursday
Conversion thursdayConversion thursday
Conversion thursday
 
Sesión 2 taller negociando como un profesional capitalizarme
Sesión 2 taller negociando como un profesional   capitalizarmeSesión 2 taller negociando como un profesional   capitalizarme
Sesión 2 taller negociando como un profesional capitalizarme
 
Lean thinking o muere en el intento
Lean thinking o muere en el intentoLean thinking o muere en el intento
Lean thinking o muere en el intento
 
Como lograr mejora con agile dev
Como lograr mejora con agile devComo lograr mejora con agile dev
Como lograr mejora con agile dev
 
Patrones de Scrum orientados al valor
Patrones de Scrum orientados al valorPatrones de Scrum orientados al valor
Patrones de Scrum orientados al valor
 
Introducción a tdd
Introducción a tddIntroducción a tdd
Introducción a tdd
 
FUNDAMENTOS_DE_GESTION_14.pptx
FUNDAMENTOS_DE_GESTION_14.pptxFUNDAMENTOS_DE_GESTION_14.pptx
FUNDAMENTOS_DE_GESTION_14.pptx
 
Resumen de los 10 videos
Resumen de los 10 videosResumen de los 10 videos
Resumen de los 10 videos
 
2. Herramientas de calidad.pptx
2. Herramientas de calidad.pptx2. Herramientas de calidad.pptx
2. Herramientas de calidad.pptx
 
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...
Charla Testing Chile 2019: Desafíos y lecciones aprendidas al incorporar el t...
 
Principios Ágiles y Lean-Kanban
Principios Ágiles y Lean-KanbanPrincipios Ágiles y Lean-Kanban
Principios Ágiles y Lean-Kanban
 

Último

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfJulian Lamprea
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITMaricarmen Sánchez Ruiz
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxLolaBunny11
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 

Último (10)

Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 

Evaluacion de sistemas de recomendacion

Notas del editor

  1. Si les parece al principio damos la charla y al final hacemos las preguntas Primero introducción a los sistemas de recomendación Un ejemplo de un recomendador sencillo Despues la parte de la evaluación
  2. Sistema que, dado un usuario, le recomienda productos relevantes para el, es decir, productos en los que podría estar potencialmente interesado El impacto de las recomendaciones es grande y de ahi el interés por estas tecnologías. Para ponerlo en numeros, el 35% de las ventas de Amazon surge a través de recomendaciones y en Netflix 2 de cada 3 películas que se vieron fueron recomendadas.
  3. En los sistemas de recomendación hay dos grandes familias
  4. Recomienda productos similares a los que ya te gustaron
  5. 1) Recomienda productos que le gustaron a usuarios similares 2) En general no se desempeña tan bien como content based filtering, pero content based filtering necesita metadata de los productos y este no 3) Los mejores algoritmos en general son híbridos
  6. Como sabiamos en la slide anterior de que al chico le gustaba Spiderman o Batman? Necesitamos feedback para saber si a un usuario le gusto o no un producto
  7. El modelo subyacente a estos sistemas de recomendación es la matriz de utilidad
  8. 1) Es una matriz donde las columnas son los productos y las filas son los usuarios 2) Para cada par usuario producto hay un rating. No están todos. 3) Mas usuarios que productos y son mucho mas esparsas 4) El objetivo de los sistemas de recomendación es inferir los ? a partir de los ratings conocidos, o sea, completar la matriz
  9. Pero es una muy buena linea de base para empezar
  10. Pero es una muy buena linea de base para empezar
  11. Pero es una muy buena linea de base para empezar
  12. Queremos saber que rating tendría que tener el chico para Batman
  13. Slope one es un algoritmo de recomendación que se basa en las diferencias entre ratings
  14. El chico le puso 3 a Spiderman y la diferencia promedio es +0.5 así que el puntaje final es 3.5
  15. Ahora queremos saber el rating de la chica hacia Harry Potter. Aca hay un caso mas complejo porque vamos a tener que ver las diferencias entre Batman y Harry Potter Y las diferencias entre Spiderman y Harry Potter
  16. Empecemos por las diferencias entre Batman y Harry Potter
  17. Para cuantificar que tan bien se desempeña un recomendador necesitamos métricas
  18. Las metricas online las podemos probar directamente en producción, con los usuarios reales
  19. AB testing es ponerle al 50% del trafico la opción A y al otro 50 la opción B Dejamos pasar un tiempo hasta juntar datos suficientes para alcanzar lo que se llama significancia estadística Que es la significancia estadistica? Afirmar ponele con 95% de certeza que la opción A es mejor que la B o al revés Detrás de eso hay un test de hipótesis, un intervalo de confianza, un p-valor, etc. Estadística clasica.
  20. AB testing es ponerle al 50% del trafico la opción A y al otro 50 la opción B Dejamos pasar un tiempo hasta juntar datos suficientes para alcanzar lo que se llama significancia estadística Que es la significancia estadistica? Afirmar ponele con 95% de certeza que la opción A es mejor que la B o al revés Detrás de eso hay un test de hipótesis, un intervalo de confianza, un p-valor, etc. Estadística clasica.
  21. Obviamente cuanto mas trafico tiene tu sitio, menos tiempo te lleva Pero por mas trafico que tengas nunca vas a poder achicar el tiempo hasta hacerlo despreciable
  22. Y ademas obviamente nos sirven como “test”, saber que no rompimos nada
  23. Se suele hacer un cross validation, esto mas que nada es para ver como en cada etapa o fold del cross validation separar en train y test
  24. Y ahi vamos a necesitar métricas que nos digan que tan cerca o que tan lejos estamos de incluir productos relevantes en nuestras recomendaciones.
  25. Entonces como dije recién hay métricas que nos permiten saber que tan bien o mal estamos haciendo las cosas según estos diagramas de Venn
  26. F measure es un promedio armónico (pero promedio al fin) entre precision y recall. Es una métrica que se usa para encontrar un balance entre ambas.