SlideShare una empresa de Scribd logo
1 de 21
Descargar para leer sin conexión
Sentiment Analysis: 
come estrarre dati e commenti degli utenti 
da articoli e social network 
Valentina Porcu 
valentina@semioanalysis.com 
Aggiornamento - 1 Ottobre 2014
L’estrazione dei commenti per: 
• analizzare l’interesse intorno a un soggetto o a un 
marchio 
• variazioni dell’interesse nel tempo (ad esempio in 
seguito a una notizia) 
• opinione dei commentatori riguardo al 
brand/soggetto in esame
Per questo motivo si parla di 
sentiment analysis 
cosa gli utenti pensano di un prodotto/servizio/candidato 
buzz analysis 
monitorare l’interesse nei confronti di un brand
Creare una base dati di commenti degli utenti 
1. l’intervallo di tempo da analizzare 
2. le pagine dei social network o siti che contengono le 
conversazioni 
3. estrarre i dati
Copiare i dati a mano? 
É più veloce utilizzare le tecniche per 
l’estrazione automatica di dati 
o 
web scraping
Se sapete programmare 
Esistono vari strumenti e librerie su più linguaggi di programmazione: 
Scrapy 
Portia 
Gemme di Ruby (Scrubit, Scrapi) 
Librerie di Python (BeautifulSoup, Urllib2) 
Quelle di PHP (Curl)
Se non sapete programmare 
Gli strumenti automatici, ad esempio: 
Mozenda 
Heritrix 
Import.io 
FMiner 
Outwit 
Wire
Utilizzi: le lead lists 
vengono utilizzati soprattutto per le cosiddette lead lists, delle 
liste di contatti comprensivi di email e telefoni “confezionate” 
per i motivi più svariati, dalla creazione di mailing list alle 
analisi di benchmark o sui competitors
A noi, in questo caso, interessa estrarre i commenti degli 
utenti 
esistono vari modi per gestire i commenti degli utenti dal punto 
di vista di un sito web 
quindi non è automatico utilizzare sempre lo stesso strumento
Ad esempio, Outwit, anche in versione gratuita, può essere utilizzato 
per i siti che gestiscono i commenti sulla normale pagina html
Oppure Import.io può essere utilizzato in modalità crawler o extractor 
per estrarre i commenti ai prodotti di Amazon
Per estrarre le conversazioni dalle pagine pubbliche di Facebook, ad 
esempio, possiamo usare Datatool
O, infine, potete utilizzare il Comment Extractor per estrarre i commenti dagli articoli con 
Disqus, da Amazon, dalle pagine pubbliche di Facebook, da IMDB o da Youtube 
copiando il link che vi interessa
e incollandolo nel Comment Extractor
I file di output sono solitamente in formato xls, csv o json, quasi tutti gestibili con excel
Oltre ai commenti sui siti uno degli strumenti più importanti per la 
sentiment: 
…è senza dubbio
Cosa analizzare su Twitter 
Testi 
Numero di retweet 
Numero di preferiti 
Risposte
Gli strumenti per estrarre i dati da Twitter 
Sono per la maggior parte a pagamento, e forniscono delle prime 
analisi dati 
Qualche esempio: 
Datasift 
Tweetarchivist
Oppure…per raccogliere i dati (senza analisi) si può usare 
Twitter Scraper
Scopri come utilizzare Comment Extractor e Twitter Scraper 
http://www.semioanalysis.com/downloads/ 
…puoi anche scaricare le demo dei software
Se l’argomento ti interessa puoi trovarmi qui 
valentina@semioanalysis.com 
www.semioanalysis.com 
Grazie! 
Valentina

Más contenido relacionado

Destacado

Social Network Analysis Applicata
Social Network Analysis ApplicataSocial Network Analysis Applicata
Social Network Analysis ApplicataGiovanni Carturan
 
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...Luigiantonio Ionio
 
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...Me-Source S.r.l./Blogmeter
 
Social media analytics tools
Social media analytics toolsSocial media analytics tools
Social media analytics toolsDML Srl
 
Analisi pagina Facebook della concorrenza
Analisi pagina Facebook della concorrenzaAnalisi pagina Facebook della concorrenza
Analisi pagina Facebook della concorrenzaRoberto Marmo
 
Social Media Marketing per hotel: strategie, strumenti e contenuti
Social Media Marketing per hotel: strategie, strumenti e contenutiSocial Media Marketing per hotel: strategie, strumenti e contenuti
Social Media Marketing per hotel: strategie, strumenti e contenutiDigital Marketing Turistico
 
Social Media Marketing per il turismo 2.0
Social Media Marketing per il turismo 2.0Social Media Marketing per il turismo 2.0
Social Media Marketing per il turismo 2.0Claudio Vaccaro
 

Destacado (8)

Social Network Analysis Applicata
Social Network Analysis ApplicataSocial Network Analysis Applicata
Social Network Analysis Applicata
 
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...
Un modello di Semantic Sentiment Analysis basato su tecniche di NLP e risorse...
 
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...
Social Recruiting e Metrics: Facebook Social Analytics e Twitter Social Analy...
 
Ascoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysisAscoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysis
 
Social media analytics tools
Social media analytics toolsSocial media analytics tools
Social media analytics tools
 
Analisi pagina Facebook della concorrenza
Analisi pagina Facebook della concorrenzaAnalisi pagina Facebook della concorrenza
Analisi pagina Facebook della concorrenza
 
Social Media Marketing per hotel: strategie, strumenti e contenuti
Social Media Marketing per hotel: strategie, strumenti e contenutiSocial Media Marketing per hotel: strategie, strumenti e contenuti
Social Media Marketing per hotel: strategie, strumenti e contenuti
 
Social Media Marketing per il turismo 2.0
Social Media Marketing per il turismo 2.0Social Media Marketing per il turismo 2.0
Social Media Marketing per il turismo 2.0
 

Come estrarre dati e commenti degli utenti da articoli e social network

  • 1. Sentiment Analysis: come estrarre dati e commenti degli utenti da articoli e social network Valentina Porcu valentina@semioanalysis.com Aggiornamento - 1 Ottobre 2014
  • 2. L’estrazione dei commenti per: • analizzare l’interesse intorno a un soggetto o a un marchio • variazioni dell’interesse nel tempo (ad esempio in seguito a una notizia) • opinione dei commentatori riguardo al brand/soggetto in esame
  • 3. Per questo motivo si parla di sentiment analysis cosa gli utenti pensano di un prodotto/servizio/candidato buzz analysis monitorare l’interesse nei confronti di un brand
  • 4. Creare una base dati di commenti degli utenti 1. l’intervallo di tempo da analizzare 2. le pagine dei social network o siti che contengono le conversazioni 3. estrarre i dati
  • 5. Copiare i dati a mano? É più veloce utilizzare le tecniche per l’estrazione automatica di dati o web scraping
  • 6. Se sapete programmare Esistono vari strumenti e librerie su più linguaggi di programmazione: Scrapy Portia Gemme di Ruby (Scrubit, Scrapi) Librerie di Python (BeautifulSoup, Urllib2) Quelle di PHP (Curl)
  • 7. Se non sapete programmare Gli strumenti automatici, ad esempio: Mozenda Heritrix Import.io FMiner Outwit Wire
  • 8. Utilizzi: le lead lists vengono utilizzati soprattutto per le cosiddette lead lists, delle liste di contatti comprensivi di email e telefoni “confezionate” per i motivi più svariati, dalla creazione di mailing list alle analisi di benchmark o sui competitors
  • 9. A noi, in questo caso, interessa estrarre i commenti degli utenti esistono vari modi per gestire i commenti degli utenti dal punto di vista di un sito web quindi non è automatico utilizzare sempre lo stesso strumento
  • 10. Ad esempio, Outwit, anche in versione gratuita, può essere utilizzato per i siti che gestiscono i commenti sulla normale pagina html
  • 11. Oppure Import.io può essere utilizzato in modalità crawler o extractor per estrarre i commenti ai prodotti di Amazon
  • 12. Per estrarre le conversazioni dalle pagine pubbliche di Facebook, ad esempio, possiamo usare Datatool
  • 13. O, infine, potete utilizzare il Comment Extractor per estrarre i commenti dagli articoli con Disqus, da Amazon, dalle pagine pubbliche di Facebook, da IMDB o da Youtube copiando il link che vi interessa
  • 14. e incollandolo nel Comment Extractor
  • 15. I file di output sono solitamente in formato xls, csv o json, quasi tutti gestibili con excel
  • 16. Oltre ai commenti sui siti uno degli strumenti più importanti per la sentiment: …è senza dubbio
  • 17. Cosa analizzare su Twitter Testi Numero di retweet Numero di preferiti Risposte
  • 18. Gli strumenti per estrarre i dati da Twitter Sono per la maggior parte a pagamento, e forniscono delle prime analisi dati Qualche esempio: Datasift Tweetarchivist
  • 19. Oppure…per raccogliere i dati (senza analisi) si può usare Twitter Scraper
  • 20. Scopri come utilizzare Comment Extractor e Twitter Scraper http://www.semioanalysis.com/downloads/ …puoi anche scaricare le demo dei software
  • 21. Se l’argomento ti interessa puoi trovarmi qui valentina@semioanalysis.com www.semioanalysis.com Grazie! Valentina