2. Dati e Big Data
• Perché ci interessano?
George H.L. Mallory (Mobberley, 1886 – Everest, 1924)
20/05/2016 2
3. Big data: i dati sono proprio tanti
• Quanti dati ci sono al mondo?
(fonte: IDC)
– 160 Exabyte, 2006 (1EB = 1018B)
– 4.4 Zettabyte, 2013 (1ZB = 1021B)
– 44 Zettabyte previsti nel 2020
• Zettabyte: 1,000,000,000,000,000,000,000 byte
– Un miliardo di dischi da 1TB, se li mettiamo uno sull'altro (e
ognuno è alto 1cm) abbiamo una pila alta 10mila km
• Quanti dati sono prodotti in un giorno?
– Facebook (ricerche varie su Internet): 500 TB
20/05/2016 3
4. Le quattro V dei Big Data
• Volume
• Velocity
• Variety
• Veracity
20/05/2016 4
5. Le cinque V dei Big Data
• Volume
• Velocity
• Variety
• Veracity
• Value
• "Data is not information, information is not knowledge,
knowledge is not understanding, understanding is not wisdom"
(Cliff Stoll)
20/05/2016 5
6. 20/05/2016 6
Dati e informazioni
• Interessano alle persone curiose
• Mi hanno sempre affascinato, fin da quando ero bambino …
7. La mia prima fonte di informazioni (1962-63)
20/05/2016 7
10. I dati nello sport
• I dati che io raccoglievo non servivano a niente, se non alla mia
curiosità (e alla mia mente contorta …)
• Negli anni, le statistiche si sono sempre più diffuse nello sport e
hanno superato il livello della curiosità e raggiunto quello del
valore:
– Moneyball, libro e film
20/05/2016 10
11. Moneyball
• Le squadre di baseball, fino al 2002,
utilizzavano, per valutare i giocatori, alcune
statistiche (batting average, RBI, stolen
bases)
• Il protagonista intuisce (e verifca
analiticamente) che altre statistiche (slugging
percentage, on-base percentage) sono più
strettamente correlate al risultato e ingaggia
giocatori meno costosi, ottenendo risultati
straordinari spendendo poco
• Morale:
– I dati si possono utilizzare, ma si deve
sapere quali e come
20/05/2016 11
12. Qualche anno dopo
• Sono diventato professore (di basi di dati, e quindi i dati sono
almeno serviti a darmi da vivere … )
• Nel 1998 ho organizzato un convegno (WebDB) e con la
pubblicazione degli atti con una prestigiosa casa editrice
• Uno degli autori, un giovane dottorando di Stanford, era in
ritardo con il suo contributo e lo ho sollecitato
20/05/2016 12
13. 20/05/2016 13
• "A company":
– Google!
• Morale:
– Algoritmi e dati possono avere valore, molto valore, ma si
deve saperlo cogliere
14. Il valore dei dati
• Capacità di utilizzo e di analisi
• Interpretazione:
– eterogeneità di formato, supporto, convenzioni, ...
20/05/2016 14
16. 20/05/2016 16
Interpretazione dei dati
• che cosa significano questi numeri?
• cartelli stradali (in Finlandia, ad esempio); sono orari
• ma la differenza?
• senza "interpretazione," il dato serve a ben poco
Lun-Ven Sabato Festivo
17. Il mio tempo è finito, vi ho annoiato ...
• Diamo spazio ai protagonisti veri dell'evento e parliamo davvero
di big data (non solo di dati)
• Ascolteremo tante cose interessanti
– tecniche, metodologiche, interdisciplinari
• Ne aggiungo una importante:
– La gestione dei dati e dei Big data richiede competenze
variegate e interdisciplinari, fra cui quelle fondate su solide
basi tecniche
– Le aziende lamentano mancanza di competenze
– Le università possono contribuire e molto (e con una visione
a lungo termine, più di altri soggetti)
20/05/2016 17
18. Percorso Big Data
• Nel Corso di Laurea Magistrale in Ingegneria Informatica dell’Università Roma Tre
• Tematiche:
– tecnologie avanzate per le basi di dati
– intelligenza artificiale
– machine learning
– architetture e le tecnologie per i big data
– analisi dell’informazione su Web
– sicurezza dei sistemi informatici
– sviluppo di applicazioni mobili
– strumenti per la visualizzazione dell’informazione
• Alcuni corsi in inglese con docenti internazionali di elevata qualificazione
• Tutti i corsi prevedono esercitazioni pratiche svolte in laboratori all’avanguardia.
• Le aziende più qualificate del settore contribuiscono con progetti congiunti e seminari
• Le attività didattiche si svolgono in un campus organizzato e piacevole
• Gli studenti hanno a disposizione una nuova biblioteca ed ampi spazi per lo studio.
• La mensa universitaria è efficiente e vicina, così come gli impianti sportivi.
20/05/2016 18
19. Un appello
• Gli investimenti in tecnologia e in formazione, a medio e lungo
termine, hanno un ritorno incalcolabile, ma le discontinuità
generano danno enormi.
• Le Università del nostro paese (che hanno potenzialità
indiscusse, come testimoniato dagli apprezzamenti che molti di
noi ricevono in sedi internazionali) sono state oggetto di tagli
pesanti negli ultimi anni (potrei mostrarvi i dati …)
• La conseguenza principale è stata l’impossibilità di assumere
giovani e questo avrà gravi conseguenze fra qualche anno se
non si pone rimedio. Stiamo perdendo una
generazione: abbiamo pochissimi docenti sotto i quarant’anni.
• L'opinione pubblica sembra non essere consapevole dei rischi
che il paese corre, aiutateci a farlo capire!
20/05/2016 19