SlideShare una empresa de Scribd logo
1 de 121
L’applicazione del data mining ai siti web di e-commerce Dal web usage mining al social data mining
Indice ,[object Object],[object Object],[object Object],[object Object],[object Object]
Il contesto ,[object Object],[object Object],[object Object],[object Object],Marketing relazionale  Data mining Personalizzazione
Marketing relazionale ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Indice ,[object Object],[object Object],[object Object],[object Object],[object Object]
Data mining ,[object Object],[object Object],[object Object]
Supervisionato/non supervisionato ,[object Object],[object Object],[object Object],[object Object],[object Object]
Metodologie di data mining ,[object Object],[object Object],[object Object]
Classificazione ,[object Object],[object Object],[object Object],[object Object],[object Object]
Esempio m … … … Classe (y i ) x ij Esempio  i … … .. … Esempio4 Classe1 Esempio3 Classe2 Esempio2 Classe1  Esempio1 Classe Attributo n Attributo2 Attributo1
Classificazione Il caso Carla è rappresentato dal punto nero in uno spazio a quattro dimensioni. La posizione nello spazio è determinata dai valori assunti da Carla rispetto ai quattro attributi .
Classificazione Funzione che descrive la relazione tra attributi e classe ,[object Object],[object Object],[object Object]
Classificazione ,[object Object],[object Object],[object Object],[object Object],[object Object]
Clustering ,[object Object],[object Object],[object Object]
Clustering Cluster
Metodi di clustering ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Metodi di clustering ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Regole associative ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Data mining per la personalizzazione ,[object Object],[object Object],[object Object],[object Object],[object Object]
Esempi ,[object Object],[object Object],[object Object],[object Object]
CRM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
CRM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
CRM ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Curva ROC Questa curva ha come coordinate in ascisse (1- la specificità, cioè la probabilità dell’errore di secondo tipo) e in ordinata la sensitività, cioè (1-la probabilità dell’errore di primo tipo)  1- la probabilità dell’errore di secondo tipo (falsi negativi)
CRM ,[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Click stream 250.711 ………… 1 Pagina richiesta Data accesso Id utente Richieste
Click stream ,[object Object],Da questo iniziale dataset ne viene ricavato un altro, organizzato per sessioni ………… Pag. 36 … … . … . Pag.3 Pag. 2 Pag. 1 Numero di click Orario inizio  Durata sessione sessioni
Click stream ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
User profiling ,[object Object],[object Object],[object Object],[object Object],Ogni visitatore è identificato da un’etichetta (C), poi tradotta in codice numerico (109**), ed è seguito da una o più righe che indicano le pagine visitate (V), anch’esse identificate da un codice numerico (da 1000 a 1295). V, 1017 V, 1026 C, “10910”, 10910 V, 1034 V, 1009 V, 1113 C, “10909”, 10909 V, 1017 V, 1108 C, “10908”, 10908
User profiling ,[object Object],[object Object],[object Object],[object Object],[object Object],… … … … … … … … … … … … … … 2 0 0 0 0 0 0 2 0 0 0 1 2 10003 0 0 0 0 0 3 0 0 0 0 0 1 1 10002 0 0 5 0 0 0 0 0 0 0 1 1 1 10001 Area Info Biz Hardware Sviluppo Altro Int. Down load Altro Soft. Window office Svago Help Iniziale Codice cliente
User profiling ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Indice ,[object Object],[object Object],[object Object],[object Object],[object Object]
La personalizzazione dei siti web ,[object Object],[object Object],[object Object],[object Object],[object Object]
Perché la personalizzazione dei siti web? ,[object Object],[object Object]
Il processo di personalizzazione Analisi dei dati Raccolta dei web data User profiling e User profiling Collaborative filtering Content based filtering Web usage mining Scelta del tipo di personalizzazione Contenuto Interfaccia Presentazione
Il processo di personalizzazione ,[object Object],[object Object],[object Object],[object Object],[object Object]
Le informazioni sull’utente ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Dati ambientali: informazioni sul dispositivo usato ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Informazioni sul contesto d’uso ,[object Object],[object Object],[object Object],[object Object]
Usage data ,[object Object]
Web Log ,[object Object],[object Object],Request Remote host  Ip Remote log name User name login Date and time Status Bytes Referrer: l’url di provenienza dell’utente User agent: il software che l’utente usa per navigare nel sito Cookies: se il sito visitato li usa
Log file ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
User profile ,[object Object],[object Object],[object Object]
User profile Fonte: adattamento da (van Dijk et alt., 2005, p.13)  … . … .. Expertise: fisica quantistica, giardinaggio, motori, etc Conosco Comportamento: lavoro, ascolto musica, etc Faccio Obiettivi: carriera, vita sociale, etc Voglio Circostanze: studio, cerco casa/lavoro/un’auto, organizzo un viaggio, etc Possiedo Interessi: pittura, immersioni, internet, etc Mi piace Preferenze: musica, arte, notizie, cibo, viaggi, etc Preferisco Me: personalità,  Io sono + Identificatori: nome utente, password, domande segrete,etc Io sono
Tecniche per la personalizzazione ,[object Object],[object Object],[object Object]
Web usage mining ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Il Web Personalizer ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Preparazione dei dati  Usage Mining File del sito e metadati Server  Log Pulizia dei dati Identificazione degli utenti e delle transazioni Statistiche d’uso File delle transazioni  utente Transaction clustering  Usage clustering Association rule discovery Itemset  frequenti Cluster di URL Motore di Raccomandazione Sessione attiva  Client browser Raccomandazioni Web server Componente  off line Componente  on line Struttura del Web Personalizer Fonte: adattamento da (Mobasher et al., 2000)
Clickworld ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Clickworld ,[object Object],[object Object],[object Object],[object Object],[object Object]
Clickworld ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Limiti del web usage mining ,[object Object],[object Object],[object Object]
Tecniche per la personalizzazione ,[object Object],[object Object],[object Object]
Content-based filtering ,[object Object],www.amazon.com
Limiti del content –based filtering ,[object Object],[object Object],[object Object]
Un’architettura che integra il contenuto nel processo di personalizzazione ,[object Object],[object Object]
Web Logs Contenuto del sito web Tassonomia Tesaurus Clusters dei documenti Usage pattern C- Logs Web Log Preprocessati Motore di raccomandazione Meccanismo di pubblicazione Preprocessing dei dati Web Usage Mining Clustering dei documenti Creazione dei C-Logs Fonte: Adattamento da (Eirinaki et al., 2003)
Il web semantico ,[object Object],[object Object]
Il web semantico URI UNICODE XML + NAMESPACE + XML SCHEMA RDF + RDF SCHEMA FIRMA DIGITALE OWL LOGICA PROVA FIDUCIA D O M A N I O G G I I E R I Fonte: adattamento da (Berners-Lee, 2001)
RDF ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
RDF (Berners-Lee et al., 2001). La frase “Ora Lassila è il creatore della pagina http://www.w3c.org/home/Lassila,  http://www.w3.org/Home/Lassila Ora Lassila Creator
Ontologie ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Ontologie ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Tipi di ontologie ,[object Object],[object Object],[object Object],[object Object]
Struttura del sistema di personalizzazione che integra conoscenza di dominio e profili d’uso ,[object Object],[object Object]
Struttura del sistema di personalizzazione che integra conoscenza di dominio e profili d’uso Fonte: adattamento da (Dai e Mobasher, 2002) Preparazione dei dati  Usage Mining Files del sito e metadati Usage data Conoscenza di dominio Preprocessing dei dati Identificazione delle pageviews, sessioni, utenti e transazioni File delle transazioni  utente Derivazione dei profili aggregati Transaction clustering pageview/item clustering Association rule discovery Sequential pattern discovery Profili d’uso
Fase di raccomandazione Conoscenza  di  dominio Profili d’uso aggregati Profilo d’uso individuale Motore di Raccomandazione Profilo utente integrato Sessione attiva  Client browser Raccomandazioni Web server Fonte: adattamento da Dai e Mobasher, 2002
Tecniche per la personalizzazione ,[object Object],[object Object],[object Object]
Collaborative filtering ,[object Object],www.amazon.com
Limiti del collaborative filtering ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Tecniche per la personalizzazione ,[object Object],[object Object],[object Object],[object Object]
Social data mining ,[object Object],[object Object]
Passaparola ,[object Object],[object Object],[object Object],[object Object]
Marketing virale ,[object Object],[object Object],[object Object],[object Object],[object Object]
Passaparola on line ,[object Object],[object Object],[object Object],[object Object]
Processo di social data mining ,[object Object],[object Object],[object Object]
Comunità virtuali ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
I blog ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
I blog ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Social network ,[object Object],[object Object],[object Object]
User profile sociali ,[object Object],[object Object],[object Object],[object Object],[object Object]
User profile generati automaticamente   ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],(Kuflik e Shoval, 2003)
User profile nei blog
User profile nei blog
Fiducia nei social network ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Analisi dei network ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Small World ,[object Object],[object Object],[object Object],[object Object]
Small World ,[object Object],[object Object],[object Object],[object Object],[object Object]
Small World In un network Small World ci si aspetta di trovare un gruppo ampiamente unificato, un network in cui sia impossibile nascondersi per quanto è interconnesso.
Free scale ,[object Object],[object Object],[object Object]
Social network e modelli ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
InterestMap ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
InterestMap ,[object Object],[object Object],[object Object],[object Object],[object Object]
InterestMap ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
InterestMap ,[object Object],[object Object],[object Object],[object Object]
InterestMap
Miglioramenti rispetto al collaborative filtering ,[object Object],[object Object],[object Object],[object Object],[object Object]
Limiti del social data mining ,[object Object],[object Object],[object Object],[object Object]
Il permission marketing ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Limiti del social data mining ,[object Object],[object Object],[object Object]
Sistema di analisi del linguaggio naturale Fonte: adattamento da (Glance et al., 2005).
Sistema di analisi del linguaggio naturale ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Sistema di analisi del linguaggio naturale ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Axim Dell ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Axim Dell ,[object Object],[object Object],[object Object],Fonte: adattamento da (Glance et al., 2005).
Prospettive future ,[object Object],[object Object],[object Object],[object Object],Sistemi di personalizzazione migliori, più efficaci e meno intrusivi per gli utenti
User profile e web semantico (FOAF) ,[object Object],[object Object],[object Object]
User profile e web semantico (FOAF) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
User profile e web semantico (FOAF) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Fiducia nei network FOAF ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Bridging the gap between on-line shoppers and online shopping websites.   A user centered analysis
“ Bridging the gap between on-line shoppers and online shopping websites. A user centered analysis”   ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Fasi del progetto ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Lo studio pilota Analisi dettagliata di tutte le caratteristiche di 30 siti web di e-commerce considerati. Individuazione di sezioni comuni tra i vari siti Analisi delle caratteristiche di 20 siti web riconducibili alle sezioni individuate Sintesi delle caratteristiche nella scheda di valutazione con diversi livelli di astrazione
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],On line clothes on line shopping website.   Shopping at Bonprix www.bonprix.co.uk
Le sezioni ,[object Object],[object Object],[object Object],[object Object]
Le sezioni ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Le sezioni ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Le sezioni ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
La scheda di valutazione ,[object Object],[object Object],[object Object],[object Object]
Successive fasi del progetto ,[object Object],[object Object],[object Object]

Más contenido relacionado

Destacado

Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorniMaurizio Girometti
 
Churn Analysis
Churn AnalysisChurn Analysis
Churn AnalysisDavid Cho
 
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...Tiziana Capozzoli
 
"Il Paradiso della Brugola" a cura di Luca Callegari
"Il Paradiso della Brugola" a cura di Luca Callegari"Il Paradiso della Brugola" a cura di Luca Callegari
"Il Paradiso della Brugola" a cura di Luca CallegariTarget Research
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data MiningAndrea Frison
 

Destacado (6)

Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorni
 
Churn Analysis
Churn AnalysisChurn Analysis
Churn Analysis
 
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
 
Progetto celine
Progetto celineProgetto celine
Progetto celine
 
"Il Paradiso della Brugola" a cura di Luca Callegari
"Il Paradiso della Brugola" a cura di Luca Callegari"Il Paradiso della Brugola" a cura di Luca Callegari
"Il Paradiso della Brugola" a cura di Luca Callegari
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data Mining
 

Similar a La tesi in slide

La metodologia statistica nel data mining
La metodologia statistica nel data miningLa metodologia statistica nel data mining
La metodologia statistica nel data miningFrancesco Tamburini
 
Algoritmi di clustering
Algoritmi di clusteringAlgoritmi di clustering
Algoritmi di clusteringRosario Turco
 
Data mining 00-corso2017
Data mining 00-corso2017Data mining 00-corso2017
Data mining 00-corso2017Studiabo
 
Customer Profiling & Predictive Analysis
Customer Profiling & Predictive AnalysisCustomer Profiling & Predictive Analysis
Customer Profiling & Predictive AnalysisStefano Maria De' Rossi
 
COUGAR: Clustering Of Unknown malware using Genetic Algorithm Routines
COUGAR: Clustering Of Unknown malware using Genetic Algorithm RoutinesCOUGAR: Clustering Of Unknown malware using Genetic Algorithm Routines
COUGAR: Clustering Of Unknown malware using Genetic Algorithm RoutinesDavidePanarella
 
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...alicesantoro4
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Marco D'Alessandro
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Alexandru Dinu
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionaliMau-Messenger
 
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...mfurlanetto
 
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Stefano Saladino
 
Mobile price classification
Mobile price classificationMobile price classification
Mobile price classificationMircoBarbero
 
Big Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaBig Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaGiulio Lazzaro
 
Analisi dati applicata all'efficienza energetica
Analisi dati applicata all'efficienza energeticaAnalisi dati applicata all'efficienza energetica
Analisi dati applicata all'efficienza energeticaAlessio Passalacqua
 
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain Manager.it
 

Similar a La tesi in slide (20)

La metodologia statistica nel data mining
La metodologia statistica nel data miningLa metodologia statistica nel data mining
La metodologia statistica nel data mining
 
Algoritmi di clustering
Algoritmi di clusteringAlgoritmi di clustering
Algoritmi di clustering
 
Introduzione al datamining
Introduzione al dataminingIntroduzione al datamining
Introduzione al datamining
 
Data mining 00-corso2017
Data mining 00-corso2017Data mining 00-corso2017
Data mining 00-corso2017
 
Customer Profiling & Predictive Analysis
Customer Profiling & Predictive AnalysisCustomer Profiling & Predictive Analysis
Customer Profiling & Predictive Analysis
 
Sentiment candida 27_may
Sentiment candida 27_maySentiment candida 27_may
Sentiment candida 27_may
 
COUGAR: Clustering Of Unknown malware using Genetic Algorithm Routines
COUGAR: Clustering Of Unknown malware using Genetic Algorithm RoutinesCOUGAR: Clustering Of Unknown malware using Genetic Algorithm Routines
COUGAR: Clustering Of Unknown malware using Genetic Algorithm Routines
 
8 Statistica
8 Statistica8 Statistica
8 Statistica
 
Data Mining
Data MiningData Mining
Data Mining
 
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...
Extended Summary of "Genetic Programming Approaches To Learning Fair Classifi...
 
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
Classificazione automatica per dati ad alta dimensionalità: un approccio fuzz...
 
Presentazione ufficiale
Presentazione ufficialePresentazione ufficiale
Presentazione ufficiale
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionali
 
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...
Sintesi automatica di una metrica di similarità tra stringhe tramite tecniche...
 
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
 
Mobile price classification
Mobile price classificationMobile price classification
Mobile price classification
 
Big Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla praticaBig Data Analysis: dalla teoria alla pratica
Big Data Analysis: dalla teoria alla pratica
 
Analisi dati applicata all'efficienza energetica
Analisi dati applicata all'efficienza energeticaAnalisi dati applicata all'efficienza energetica
Analisi dati applicata all'efficienza energetica
 
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
 

La tesi in slide

  • 1. L’applicazione del data mining ai siti web di e-commerce Dal web usage mining al social data mining
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10. Esempio m … … … Classe (y i ) x ij Esempio i … … .. … Esempio4 Classe1 Esempio3 Classe2 Esempio2 Classe1 Esempio1 Classe Attributo n Attributo2 Attributo1
  • 11. Classificazione Il caso Carla è rappresentato dal punto nero in uno spazio a quattro dimensioni. La posizione nello spazio è determinata dai valori assunti da Carla rispetto ai quattro attributi .
  • 12.
  • 13.
  • 14.
  • 16.
  • 17.
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24. Curva ROC Questa curva ha come coordinate in ascisse (1- la specificità, cioè la probabilità dell’errore di secondo tipo) e in ordinata la sensitività, cioè (1-la probabilità dell’errore di primo tipo) 1- la probabilità dell’errore di secondo tipo (falsi negativi)
  • 25.
  • 26.
  • 27.
  • 28.
  • 29.
  • 30.
  • 31.
  • 32.
  • 33.
  • 34.
  • 35. Il processo di personalizzazione Analisi dei dati Raccolta dei web data User profiling e User profiling Collaborative filtering Content based filtering Web usage mining Scelta del tipo di personalizzazione Contenuto Interfaccia Presentazione
  • 36.
  • 37.
  • 38.
  • 39.
  • 40.
  • 41.
  • 42.
  • 43.
  • 44. User profile Fonte: adattamento da (van Dijk et alt., 2005, p.13) … . … .. Expertise: fisica quantistica, giardinaggio, motori, etc Conosco Comportamento: lavoro, ascolto musica, etc Faccio Obiettivi: carriera, vita sociale, etc Voglio Circostanze: studio, cerco casa/lavoro/un’auto, organizzo un viaggio, etc Possiedo Interessi: pittura, immersioni, internet, etc Mi piace Preferenze: musica, arte, notizie, cibo, viaggi, etc Preferisco Me: personalità, Io sono + Identificatori: nome utente, password, domande segrete,etc Io sono
  • 45.
  • 46.
  • 47.
  • 48. Preparazione dei dati Usage Mining File del sito e metadati Server Log Pulizia dei dati Identificazione degli utenti e delle transazioni Statistiche d’uso File delle transazioni utente Transaction clustering Usage clustering Association rule discovery Itemset frequenti Cluster di URL Motore di Raccomandazione Sessione attiva Client browser Raccomandazioni Web server Componente off line Componente on line Struttura del Web Personalizer Fonte: adattamento da (Mobasher et al., 2000)
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.
  • 54.
  • 55.
  • 56.
  • 57. Web Logs Contenuto del sito web Tassonomia Tesaurus Clusters dei documenti Usage pattern C- Logs Web Log Preprocessati Motore di raccomandazione Meccanismo di pubblicazione Preprocessing dei dati Web Usage Mining Clustering dei documenti Creazione dei C-Logs Fonte: Adattamento da (Eirinaki et al., 2003)
  • 58.
  • 59. Il web semantico URI UNICODE XML + NAMESPACE + XML SCHEMA RDF + RDF SCHEMA FIRMA DIGITALE OWL LOGICA PROVA FIDUCIA D O M A N I O G G I I E R I Fonte: adattamento da (Berners-Lee, 2001)
  • 60.
  • 61. RDF (Berners-Lee et al., 2001). La frase “Ora Lassila è il creatore della pagina http://www.w3c.org/home/Lassila, http://www.w3.org/Home/Lassila Ora Lassila Creator
  • 62.
  • 63.
  • 64.
  • 65.
  • 66. Struttura del sistema di personalizzazione che integra conoscenza di dominio e profili d’uso Fonte: adattamento da (Dai e Mobasher, 2002) Preparazione dei dati Usage Mining Files del sito e metadati Usage data Conoscenza di dominio Preprocessing dei dati Identificazione delle pageviews, sessioni, utenti e transazioni File delle transazioni utente Derivazione dei profili aggregati Transaction clustering pageview/item clustering Association rule discovery Sequential pattern discovery Profili d’uso
  • 67. Fase di raccomandazione Conoscenza di dominio Profili d’uso aggregati Profilo d’uso individuale Motore di Raccomandazione Profilo utente integrato Sessione attiva Client browser Raccomandazioni Web server Fonte: adattamento da Dai e Mobasher, 2002
  • 68.
  • 69.
  • 70.
  • 71.
  • 72.
  • 73.
  • 74.
  • 75.
  • 76.
  • 77.
  • 78.
  • 79.
  • 80.
  • 81.
  • 82.
  • 85.
  • 86.
  • 87.
  • 88.
  • 89. Small World In un network Small World ci si aspetta di trovare un gruppo ampiamente unificato, un network in cui sia impossibile nascondersi per quanto è interconnesso.
  • 90.
  • 91.
  • 92.
  • 93.
  • 94.
  • 95.
  • 97.
  • 98.
  • 99.
  • 100.
  • 101. Sistema di analisi del linguaggio naturale Fonte: adattamento da (Glance et al., 2005).
  • 102.
  • 103.
  • 104.
  • 105.
  • 106.
  • 107.
  • 108.
  • 109.
  • 110.
  • 111. Bridging the gap between on-line shoppers and online shopping websites. A user centered analysis
  • 112.
  • 113.
  • 114. Lo studio pilota Analisi dettagliata di tutte le caratteristiche di 30 siti web di e-commerce considerati. Individuazione di sezioni comuni tra i vari siti Analisi delle caratteristiche di 20 siti web riconducibili alle sezioni individuate Sintesi delle caratteristiche nella scheda di valutazione con diversi livelli di astrazione
  • 115.
  • 116.
  • 117.
  • 118.
  • 119.
  • 120.
  • 121.