SlideShare una empresa de Scribd logo
1 de 16
Descargar para leer sin conexión
Big Data Analysis: dalla
teoria alla pratica
Presentazione Social Media Web & Smart Apps
Studente Giulio Lazzaro mat. 835232
Prof. Gianluigi Cogo
A.A. 2013/2014 06/06/2014
Università Ca’ Foscari Venezia
Big data, cosa sono
Raccolte di dati con volumi estremamente elevati,
raggruppati per genere in dataset.
Caratteristiche:
 Volume
 Velocità
 Varietà
 Veracità
 Valore
Immagine: http://www.datasciencecentral.com/forum/topics/the-3vs-that-define-big-data
Big Data Analysis
Ricavare informazioni (utili e di valore) dai Big Data.
I dati presi singolarmente possono non aver valore,
mentre insiemi di dati possono avere informazioni
aggiuntive nascoste (valore aggiunto).
Perché analizzarli
Sono la nuova frontiera dell’informazione.
Sfruttati in IT, comunicazioni, medicina, trasporti,
pubbliche amministrazioni, istruzione, catasto ecc.
Le aziende possono massimizzare i loro profitti,
ottimizzare i loro processi e offrire nuovi servizi:
business analytics.
Dati più comuni: machine data
Dati generati da macchine
• Log
• Coordinate GPS
• File di testo, configurazione ecc.
Dati più comuni: database
Database: Relazionali e non solo, sono utilizzati in
ogni campo.
Gli strumenti per l’analisi
• Splunk: indicizza, processa e analizza i dati. Tramite
dashboard mostra statistiche e risultati
• Hadoop: programma scalabile di analisi big data,
sfrutta l’algoritmo MapReduce di Google
• Fluentd e Logstash: raccolta di log (centralizzazione)
• Molti altri strumenti specializzati
• Algoritmi e abilità (data scientist).
Vantaggi offerti
Semplicità e astrazione. Le dashboard contengono i
risultati che ci interessano.
Splunk Dashboard - Immagine: http://www.linux-
magazine.com/Online/Features/Unified-Event-Monitoring-with-Splunk
Computazione
Il modello Mapreduce massimizza le prestazioni
dividendo dati e lavoro da eseguire su più nodi.
I tipi di analisi
• Descriptive analytics: semplice «lettura» dei dati
• Diagnostic analytics: ricavare ulteriori informazioni
dai dati in possesso tramite l’analisi
• Predictive analytics: creare modelli dai dati raccolti,
in modo da poterli poi usare per prevedere
l’andamento futuro
• Prescriptive analytics: usare i modelli di dati ricavati
per analizzare e ottimizzare processi ripetitivi.
Buone norme
Confirmation bias
Di solito si cerca di dare ragione alle proprie ipotesi
invece di confutarle.
Si dovrebbe essere in grado di confutare le proprie
teorie e se necessario cambiare strada.
Immagine: http://online.wsj.com/
Buone norme
Irrilevanza e distrazione
Bisogna concentrarsi nei dati veramente utili senza
includere dati non inerenti che potrebbero fornire
risultati fuorvianti.
Es: refresh di un browser o nuova richiesta
Buone norme
Causa e correlazione
Eventi che si manifestano assieme non sono
necessariamente correlati.
Buone norme
Statistical significance
Non bisogna limitarsi a piccole porzioni di dati, la
statistica è sui grandi numeri.
Es: prendere una porzione di dati totalmente diversa
dal resto conduce ad un’analisi errata
Buone norme
Varietà dei dati da analizzare
A volte i dati da analizzare per poter fare un’analisi
accurata sono di diverso tipo.
Es: limitarsi ai commenti negativi escludendo le mail
di lamentela.
Riferimenti
• http://hadoop.apache.org/
• http://it.splunk.com/
• http://db-engines.com/en/ranking
• http://logstash.net/
• http://fluentd.org/
• http://en.wikipedia.org/wiki/MapReduce

Más contenido relacionado

La actualidad más candente

Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big DataVincenzo Manzoni
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Keen Consulting
 
Offering - Big data: le fondamenta per i nuovi business
Offering - Big data: le fondamenta per i nuovi businessOffering - Big data: le fondamenta per i nuovi business
Offering - Big data: le fondamenta per i nuovi businessXenesys
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Big data e analisi predittiva
Big data e analisi predittivaBig data e analisi predittiva
Big data e analisi predittivaAntonio Bucciol
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazioneGianfranco Andriola
 
Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty SMAU
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Data Driven Innovation
 
Big Data e Deep Learning: verso una nuova generazione di programmi intelligenti
Big Data e Deep Learning: verso una nuova generazione di programmi intelligentiBig Data e Deep Learning: verso una nuova generazione di programmi intelligenti
Big Data e Deep Learning: verso una nuova generazione di programmi intelligentiData Driven Innovation
 
IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Italy
 
Offering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioOffering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioXenesys
 
Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Carlo Vaccari
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligenceWebeing.net
 
Big Data: Analisi del Sentiment
Big Data: Analisi del SentimentBig Data: Analisi del Sentiment
Big Data: Analisi del SentimentMiriade Spa
 
Introduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati datiIntroduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati datiVincenzo Manzoni
 

La actualidad más candente (20)

Le tecnologie dei Big Data
Le tecnologie dei Big DataLe tecnologie dei Big Data
Le tecnologie dei Big Data
 
FANTIN BIG DATA (1)
FANTIN BIG DATA (1)FANTIN BIG DATA (1)
FANTIN BIG DATA (1)
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
 
Offering - Big data: le fondamenta per i nuovi business
Offering - Big data: le fondamenta per i nuovi businessOffering - Big data: le fondamenta per i nuovi business
Offering - Big data: le fondamenta per i nuovi business
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Big data e analisi predittiva
Big data e analisi predittivaBig data e analisi predittiva
Big data e analisi predittiva
 
Big data e pubblica amministrazione
Big data e pubblica amministrazioneBig data e pubblica amministrazione
Big data e pubblica amministrazione
 
Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
 
Big Data e Deep Learning: verso una nuova generazione di programmi intelligenti
Big Data e Deep Learning: verso una nuova generazione di programmi intelligentiBig Data e Deep Learning: verso una nuova generazione di programmi intelligenti
Big Data e Deep Learning: verso una nuova generazione di programmi intelligenti
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
Appunti di big data
Appunti di big dataAppunti di big data
Appunti di big data
 
Data Mining
Data MiningData Mining
Data Mining
 
IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014
 
Offering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioOffering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccio
 
Big data analytics vaccari oct2013
Big data analytics vaccari oct2013Big data analytics vaccari oct2013
Big data analytics vaccari oct2013
 
Business intelligence
Business intelligenceBusiness intelligence
Business intelligence
 
Big Data: Analisi del Sentiment
Big Data: Analisi del SentimentBig Data: Analisi del Sentiment
Big Data: Analisi del Sentiment
 
Introduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati datiIntroduzione ai Big Data e alla scienza dei dati - I formati dati
Introduzione ai Big Data e alla scienza dei dati - I formati dati
 

Destacado

Come diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniCome diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniDonatella Cambosu
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Vincenzo Manzoni
 
MIT Big Data Certificate
MIT Big Data CertificateMIT Big Data Certificate
MIT Big Data CertificateSteve Hockey
 
Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big DataMiriade Spa
 
Diventare ricchi con Python
Diventare ricchi con PythonDiventare ricchi con Python
Diventare ricchi con Pythonantonio.cangiano
 
Practise random acts of kindness - week 1
Practise random acts of kindness - week 1Practise random acts of kindness - week 1
Practise random acts of kindness - week 1teny1980
 
(Lovern tamra historyingraphicdesign)powerpoint
(Lovern tamra historyingraphicdesign)powerpoint(Lovern tamra historyingraphicdesign)powerpoint
(Lovern tamra historyingraphicdesign)powerpointTamra Lovern
 
Indikasi Tidak Umum Pada Penggunaan Lower Inclined Plane
Indikasi Tidak Umum Pada Penggunaan Lower Inclined PlaneIndikasi Tidak Umum Pada Penggunaan Lower Inclined Plane
Indikasi Tidak Umum Pada Penggunaan Lower Inclined PlaneUniversitas Sumatera Utara
 
I am grateful for jonathan rivera
I am grateful for  jonathan riveraI am grateful for  jonathan rivera
I am grateful for jonathan riverariverajonsociology
 
Three things for wildcard ssl certs
Three things for wildcard ssl certsThree things for wildcard ssl certs
Three things for wildcard ssl certstas-hiro
 
Tiens Dicho Home Care presentation
Tiens Dicho Home Care presentationTiens Dicho Home Care presentation
Tiens Dicho Home Care presentationSilvana Preda
 

Destacado (19)

Come diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo PellegriniCome diventare data scientist - Paolo Pellegrini
Come diventare data scientist - Paolo Pellegrini
 
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
Le opportunita dei Big Data - Palazzolo Digital Festival 2013 (PDF13)
 
MIT Big Data Certificate
MIT Big Data CertificateMIT Big Data Certificate
MIT Big Data Certificate
 
Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar Big Data & Bird & Bird - seminar
Big Data & Bird & Bird - seminar
 
Come gestire un progetto Big Data
Come gestire un progetto Big DataCome gestire un progetto Big Data
Come gestire un progetto Big Data
 
Diventare ricchi con Python
Diventare ricchi con PythonDiventare ricchi con Python
Diventare ricchi con Python
 
Practise random acts of kindness - week 1
Practise random acts of kindness - week 1Practise random acts of kindness - week 1
Practise random acts of kindness - week 1
 
White stone polygon
White stone polygonWhite stone polygon
White stone polygon
 
Alvaro
AlvaroAlvaro
Alvaro
 
(Lovern tamra historyingraphicdesign)powerpoint
(Lovern tamra historyingraphicdesign)powerpoint(Lovern tamra historyingraphicdesign)powerpoint
(Lovern tamra historyingraphicdesign)powerpoint
 
Indikasi Tidak Umum Pada Penggunaan Lower Inclined Plane
Indikasi Tidak Umum Pada Penggunaan Lower Inclined PlaneIndikasi Tidak Umum Pada Penggunaan Lower Inclined Plane
Indikasi Tidak Umum Pada Penggunaan Lower Inclined Plane
 
Ashley
AshleyAshley
Ashley
 
Snoring
SnoringSnoring
Snoring
 
Demo ni nic
Demo ni nicDemo ni nic
Demo ni nic
 
I am grateful for jonathan rivera
I am grateful for  jonathan riveraI am grateful for  jonathan rivera
I am grateful for jonathan rivera
 
visihelp
visihelpvisihelp
visihelp
 
Three things for wildcard ssl certs
Three things for wildcard ssl certsThree things for wildcard ssl certs
Three things for wildcard ssl certs
 
Realmadrid-Atleticodemadrid
Realmadrid-AtleticodemadridRealmadrid-Atleticodemadrid
Realmadrid-Atleticodemadrid
 
Tiens Dicho Home Care presentation
Tiens Dicho Home Care presentationTiens Dicho Home Care presentation
Tiens Dicho Home Care presentation
 

Similar a Big Data Analysis: dalla teoria alla pratica

Come sfruttare il potere dei dati: alla scoperta dell’Analisi Predittiva
Come sfruttare il potere dei dati: alla scoperta dell’Analisi PredittivaCome sfruttare il potere dei dati: alla scoperta dell’Analisi Predittiva
Come sfruttare il potere dei dati: alla scoperta dell’Analisi PredittivaKEA s.r.l.
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Miningvaluccia84
 
Il data warehouse nella business intelligence
Il data warehouse nella business intelligenceIl data warehouse nella business intelligence
Il data warehouse nella business intelligenceAndrea Mecchia
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Alexandru Dinu
 
Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Medi-Pragma
 
Viaggio alla scoperta dei Big Data
Viaggio alla scoperta dei Big DataViaggio alla scoperta dei Big Data
Viaggio alla scoperta dei Big DataKEA s.r.l.
 
2014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 62014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 6Gianluigi Cogo
 
Dati ambientali e comunicazione online
Dati ambientali e comunicazione onlineDati ambientali e comunicazione online
Dati ambientali e comunicazione onlineGiulia Annovi
 
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Stefano Saladino
 
White Paper - L'analisi dei dati
White Paper - L'analisi dei datiWhite Paper - L'analisi dei dati
White Paper - L'analisi dei datiSogesi
 
Articolo qualita 3_2018_nicola_mezzetti
Articolo qualita 3_2018_nicola_mezzettiArticolo qualita 3_2018_nicola_mezzetti
Articolo qualita 3_2018_nicola_mezzettiNicola Mezzetti
 
La capacità di fare previsioni: ecco la base dell’intelligenza artificiale
La capacità di fare previsioni: ecco la base dell’intelligenza artificialeLa capacità di fare previsioni: ecco la base dell’intelligenza artificiale
La capacità di fare previsioni: ecco la base dell’intelligenza artificialeKEA s.r.l.
 
Big Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaBig Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaGianluigi Cogo
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionaliMau-Messenger
 
Presentazione bigdata Madee
Presentazione bigdata MadeePresentazione bigdata Madee
Presentazione bigdata MadeeGianluigi Cogo
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3Fabio Lazzarini
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSMAU
 

Similar a Big Data Analysis: dalla teoria alla pratica (20)

Come sfruttare il potere dei dati: alla scoperta dell’Analisi Predittiva
Come sfruttare il potere dei dati: alla scoperta dell’Analisi PredittivaCome sfruttare il potere dei dati: alla scoperta dell’Analisi Predittiva
Come sfruttare il potere dei dati: alla scoperta dell’Analisi Predittiva
 
Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Mining
 
Il data warehouse nella business intelligence
Il data warehouse nella business intelligenceIl data warehouse nella business intelligence
Il data warehouse nella business intelligence
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
 
Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?Big data & RWE rischio o opportunità?
Big data & RWE rischio o opportunità?
 
Viaggio alla scoperta dei Big Data
Viaggio alla scoperta dei Big DataViaggio alla scoperta dei Big Data
Viaggio alla scoperta dei Big Data
 
2014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 62014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 6
 
Dati ambientali e comunicazione online
Dati ambientali e comunicazione onlineDati ambientali e comunicazione online
Dati ambientali e comunicazione online
 
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
Carlo Bono - Introduzione alla Data Analysis e al Machine Learning - Rinascit...
 
Big DATA
Big DATABig DATA
Big DATA
 
White Paper - L'analisi dei dati
White Paper - L'analisi dei datiWhite Paper - L'analisi dei dati
White Paper - L'analisi dei dati
 
Articolo qualita 3_2018_nicola_mezzetti
Articolo qualita 3_2018_nicola_mezzettiArticolo qualita 3_2018_nicola_mezzetti
Articolo qualita 3_2018_nicola_mezzetti
 
La capacità di fare previsioni: ecco la base dell’intelligenza artificiale
La capacità di fare previsioni: ecco la base dell’intelligenza artificialeLa capacità di fare previsioni: ecco la base dell’intelligenza artificiale
La capacità di fare previsioni: ecco la base dell’intelligenza artificiale
 
Big Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital AccademiaBig Data per Madee 7 at Digital Accademia
Big Data per Madee 7 at Digital Accademia
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionali
 
Bigdata per Madee 4
Bigdata per Madee 4Bigdata per Madee 4
Bigdata per Madee 4
 
Presentazione bigdata Madee
Presentazione bigdata MadeePresentazione bigdata Madee
Presentazione bigdata Madee
 
La salute e i big data
La salute e i big dataLa salute e i big data
La salute e i big data
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISM
 

Big Data Analysis: dalla teoria alla pratica

  • 1. Big Data Analysis: dalla teoria alla pratica Presentazione Social Media Web & Smart Apps Studente Giulio Lazzaro mat. 835232 Prof. Gianluigi Cogo A.A. 2013/2014 06/06/2014 Università Ca’ Foscari Venezia
  • 2. Big data, cosa sono Raccolte di dati con volumi estremamente elevati, raggruppati per genere in dataset. Caratteristiche:  Volume  Velocità  Varietà  Veracità  Valore Immagine: http://www.datasciencecentral.com/forum/topics/the-3vs-that-define-big-data
  • 3. Big Data Analysis Ricavare informazioni (utili e di valore) dai Big Data. I dati presi singolarmente possono non aver valore, mentre insiemi di dati possono avere informazioni aggiuntive nascoste (valore aggiunto).
  • 4. Perché analizzarli Sono la nuova frontiera dell’informazione. Sfruttati in IT, comunicazioni, medicina, trasporti, pubbliche amministrazioni, istruzione, catasto ecc. Le aziende possono massimizzare i loro profitti, ottimizzare i loro processi e offrire nuovi servizi: business analytics.
  • 5. Dati più comuni: machine data Dati generati da macchine • Log • Coordinate GPS • File di testo, configurazione ecc.
  • 6. Dati più comuni: database Database: Relazionali e non solo, sono utilizzati in ogni campo.
  • 7. Gli strumenti per l’analisi • Splunk: indicizza, processa e analizza i dati. Tramite dashboard mostra statistiche e risultati • Hadoop: programma scalabile di analisi big data, sfrutta l’algoritmo MapReduce di Google • Fluentd e Logstash: raccolta di log (centralizzazione) • Molti altri strumenti specializzati • Algoritmi e abilità (data scientist).
  • 8. Vantaggi offerti Semplicità e astrazione. Le dashboard contengono i risultati che ci interessano. Splunk Dashboard - Immagine: http://www.linux- magazine.com/Online/Features/Unified-Event-Monitoring-with-Splunk
  • 9. Computazione Il modello Mapreduce massimizza le prestazioni dividendo dati e lavoro da eseguire su più nodi.
  • 10. I tipi di analisi • Descriptive analytics: semplice «lettura» dei dati • Diagnostic analytics: ricavare ulteriori informazioni dai dati in possesso tramite l’analisi • Predictive analytics: creare modelli dai dati raccolti, in modo da poterli poi usare per prevedere l’andamento futuro • Prescriptive analytics: usare i modelli di dati ricavati per analizzare e ottimizzare processi ripetitivi.
  • 11. Buone norme Confirmation bias Di solito si cerca di dare ragione alle proprie ipotesi invece di confutarle. Si dovrebbe essere in grado di confutare le proprie teorie e se necessario cambiare strada. Immagine: http://online.wsj.com/
  • 12. Buone norme Irrilevanza e distrazione Bisogna concentrarsi nei dati veramente utili senza includere dati non inerenti che potrebbero fornire risultati fuorvianti. Es: refresh di un browser o nuova richiesta
  • 13. Buone norme Causa e correlazione Eventi che si manifestano assieme non sono necessariamente correlati.
  • 14. Buone norme Statistical significance Non bisogna limitarsi a piccole porzioni di dati, la statistica è sui grandi numeri. Es: prendere una porzione di dati totalmente diversa dal resto conduce ad un’analisi errata
  • 15. Buone norme Varietà dei dati da analizzare A volte i dati da analizzare per poter fare un’analisi accurata sono di diverso tipo. Es: limitarsi ai commenti negativi escludendo le mail di lamentela.
  • 16. Riferimenti • http://hadoop.apache.org/ • http://it.splunk.com/ • http://db-engines.com/en/ranking • http://logstash.net/ • http://fluentd.org/ • http://en.wikipedia.org/wiki/MapReduce