1. AIMOOC 4.2 valerio freschi
Spazio in cui inserire il
ritaglio di un’immagine
evocativa dell’argomento
della lezione
INTELLIGENZA ARTIFICIALE #AIMOOC
valerio freschi
4.2 MACHINE LEARNING
mooc.uniurb.it/aimooc
2. AIMOOC 4.2 valerio freschi
Machine learning
• Di cosa parliamo quando diciamo ML
• Machine: sostantivo in forma aggettivata —> automatico
• Learning: apprendimento
• Machine Learning / Apprendimento automatico
• Come possono i computer imparare?
3. AIMOOC 4.2 valerio freschi
Machine learning: cos’è?
• Macchina
• “Congegno […] atto a compiere determinate funzioni altrimenti svolte dall’uomo” (Vocabolario
Zingarelli Lingua italiana 2016)
• Imparare
• “Acquisire una serie di conoscenze mediante studio, esercizio, osservazione / apprendere qualcosa per
mezzo dell’esperienza” (Vocabolario Zingarelli Lingua italiana 2016)
• Machine Learning
• “ML is a field of study that gives the computer the ability to learn without being explicitly
programmed” (A. Samuel, 1959)
• “A computer program is said to learn from experience E with respect to some class of tasks T and
performance measure P, if its performance at tasks in T, as measured by P, improves with experience
E.” (T.Mitchell, 1998)
4. AIMOOC 4.2 valerio freschi
Perché Machine learning?
• Per molti problemi è troppo complesso programmare un software
manualmente
• Riconoscimento di oggetti e di persone
• Comprensione del parlato
• Il sistema in alcuni casi si deve adattare ad un ambiente che si modifica
• L’approccio ML consiste nel progettare algoritmi che apprendono
automaticamente dai dati o, in generale, dall’esperienza
• Contributi da molti campi del sapere
5. AIMOOC 4.2 valerio freschi
ML: definizioni introduttive
• Algoritmi di machine learning —> ricerca attraverso un (molto ampio) spazio di
programmi (modelli) “candidati”
• La ricerca è guidata dall’esperienza di addestramento per identificare il
programma che ottimizza una data metrica prestazionale
• Una tassonomia di base:
• Apprendimento supervisionato
• Apprendimento non supervisionato
• Apprendimento per rinforzo
• Molte variazioni sul tema
6. AIMOOC 4.2 valerio freschi
Un problema tipico di ML: classificazione
• 1) Raccolta dati
• Training set
7. AIMOOC 4.2 valerio freschi
Classificazione
• 2) Progettazione delle
feature
• Quali caratteristiche ci
permettono di distinguere?
• Colore, dimensione e/o forma
delle orecchie, del naso, una
combinazione di queste…
• Spazio delle features
• E se il sistema fosse in grado
di apprenderle?
8. AIMOOC 4.2 valerio freschi
Classificazione
• 3) Addestramento del modello
• Dallo spazio delle feature —>
problema di natura geometrica
• Trovare una curva che separa le
due classi
• Se è una retta: 2 parametri
(pendenza, intercetta)
• La retta (in nero) rappresenta il
modello addestrato
9. AIMOOC 4.2 valerio freschi
Classificazione
• 4) Validazione del modello
• Per valutare l’efficacia del
nostro sistema addestrato,
questo viene sottoposto a
validazione
10. AIMOOC 4.2 valerio freschi
Classificazione
• 4) Validazione del modello
• Per valutare l’efficacia del
nostro sistema addestrato,
questo viene sottoposto a
validazione
• Cause di errore:
• Scelta delle feature
• Tipologia di modello (lineare
vs non lineare)
• Dimensione del training set
12. AIMOOC 4.2 valerio freschi
Classificazione: le applicazioni
• Riconoscimento automatico di oggetti
• Riconoscimento automatico di cifre scritte a mano (ordinamento posta)
• Segnali stradali (guida assistita o autonoma)
• Riconoscimento del parlato
• Sentiment analysis
• Riconoscimento opinione su un prodotto o servizio (da stream di social
media)
• Riconoscimento dei gesti (tra un insieme finito di alternative)
• Diagnosi mediche assistite dal calcolatore
14. AIMOOC 4.2 valerio freschi
Apprendimento supervisionato
• Dati un insieme di input 𝕏 e di etichette 𝕐, l’algoritmo di
apprendimento consiste nel trovare un “mapping” 𝑓: 𝕏 → 𝕐
• Problemi di regressione 𝕐 è continuo
• Problemi di classificazione 𝕐 è discreto
• La funzione 𝑓 rappresenta il programma (modello) candidato
risultante dal processo di apprendimento
15. AIMOOC 4.2 valerio freschi
Apprendimento non supervisionato
• Assegnato un insieme di input 𝕏 scoprire la “struttura” dei dati
• Si tratta di apprendere, in maniera automatica, regole computazionali
che descrivono 𝕏
• Le regole permettono di semplificare il dataset per
• Semplificare l’apprendimento supervisionato
• Analisi e interpretazione (umani)
• Principali problemi
• Riduzione della dimensionalità
• Clustering
16. AIMOOC 4.2 valerio freschi
Apprendimento non supervisionato
• Riduzione della dimensionalità
• Principio di funzionamento: proiezione su un sottospazio di
dimensione inferiore
17. AIMOOC 4.2 valerio freschi
Apprendimento non supervisionato
• Riduzione della dimensionalità
• Cos’è la dimensione di un dato in
ML?
• Le immagini digitali sono di fatto
array 3-dimensionali (larghezza x
altezza x 3) di interi tra 0 e 255
• 248 × 400 × 3 = 297600
• Un immagine 1Mega pixel → 3 ×
106
dimensioni
18. AIMOOC 4.2 valerio freschi
Apprendimento non supervisionato
• Clustering: assegnare gli elementi di input a determinati gruppi
• applicazioni:
• Aggregazione news
• Social network analysis
• Microarray gene cluster analysis
19. AIMOOC 4.2 valerio freschi
Apprendimento non supervisionato
• Clustering: raggruppare punti con simili caratteristiche strutturali
20. AIMOOC 4.2 valerio freschi
Ottimizzazione matematica
• Ricerca del minimo di una funzione di costo
21. AIMOOC 4.2 valerio freschi
Ottimizzazione matematica
• Ricerca del minimo di una funzione di costo
22. AIMOOC 4.2 valerio freschi
ML e visione artificiale
• Computer vision: rilevazione di
oggetti, etichettatura delle immagini,
e molte altre applicazioni di questo
tipo vengono oggi eseguite tramite
tecniche di ML
• Sfruttando architetture di calcolo
moderne (come le GPU delle schede
video) è possibile costruire sistemi di
apprendimento con miliardi di
parametri (e.g. DNN) addestrabili su
ampie basi di dati
23. AIMOOC 4.2 valerio freschi
ML e elaborazione del linguaggio naturale
• Speech: Speech to text, assistenti personali virtuali
• Neural machine translation
24. AIMOOC 4.2 valerio freschi
ML e sistemi di raccomandazione
• I RS sono sistemi di ML basati su dati che collegano elementi tra un
insieme di utenti (e.g. persone) ed un insieme di articoli (e.g. prodotti)
• Il collegamento indica che un utente ha indicato un interesse nei
confronti di un prodotto (ad esempio lo ha acquistato in passato)
• Il sistema si prefigge di suggerire altri articoli ad un dato utente ai quali
potrebbe essere interessato, sulla base dei dati di tutti gli utenti
26. AIMOOC 4.2 valerio freschi
ML e giochi di strategia
• Go è conosciuto come uno dei più difficili giochi, dal
punto di vista della sfida per l’intelligenza artificiale
• Fino a una decina di anni fa i sistemi più avanzati
riuscivano ad arrivare ad un livello amatoriale
• I metodi standard di IA basati sul provare il maggior
numero possibile di mosse e posizioni tramite alberi di
ricerca non possono gestire il numero di possibili
mosse e valutare ogni posizione
• Ci sono 10170 possibili configurazioni del gioco (> del
numero di atomi nell’universo conosciuto)
27. AIMOOC 4.2 valerio freschi
ML e giochi di strategia
• Deepmind (Google) ha progettato AlphaGo, un software che combina ricerche su
alberi con deep neural networks.
• Due reti neurali sono state addestrate in modo supervisionato
• AlphaGo è stato addestrato tramite numerose partite (a livello amatoriale e poi
professionista). Poi è stato fatto giocare contro diverse versioni di sè stesso migliaia
di volte, ogni volta apprendendo dai propri errori
• Tramite processo di apprendimento per rinforzo AlphaGo è migliorato nel corso del
tempo nelle capacità di imparare e prendere decisioni fino ad arrivare a sconfiggere
campioni del gioco
• “I thought AlphaGo was based on probability calculation and that it was merely a
machine. But when I saw this move, I changed my mind. Surely, AlphaGo is creative”.
(Lee Sedol, winner of 18 world Go titles)
28. AIMOOC 4.2 valerio freschi
ML e scienza (bio/chem/med)
• Il problema:
• batteri antibiotico-
resistenti
• mancanza di incentivi
economici
• Le cifre: si stima che le
morti attribuibili a infezioni
resistenti possano arrivare
a 10 milioni all’anno entro
il 2050
29. AIMOOC 4.2 valerio freschi
Applicazioni di ML: scoperta di nuovi
antibiotici
• Un modello di deep learning è stato addestrato per fare selezionare le
proprietà di antibiotici sulla base della struttura della molecola
• Si è giunti ad identificare una molecola (dal Drug Repurposing Hub)
con attività antibatterica —> Halicin
• É stato dimostrata l’attività antibiotica ad ampio spettro di Halicin su
topi di laboratorio
• Altri antibiotici ad ampio spettro con strutture distinte sono stati
“predetti” a partire dal database ZINC15
30. AIMOOC 4.2 valerio freschi
Applicazioni di ML: scoperta di nuovi
antibiotici
• Un modello di deep learning è stato addestrato per fare selezionare le
proprietà di antibiotici sulla base della struttura della molecola
• Si è giunti ad identificare una molecola (dal Drug Repurposing Hub)
con attività antibatterica —> Halicin
• É stato dimostrata l’attività antibiotica ad ampio spettro di Halicin su
topi di laboratorio
• Altri antibiotici ad ampio spettro con strutture distinte sono stati
“predetti” a partire dal database ZINC15
31. AIMOOC 4.2 valerio freschi
Machine learning
• Grazie per l’attenzione!
Figure sources:
Slides 5-10,12, 15,18-20,24 “Machine Learning Refined”, Watt, Bohrani, Katsaggelos, Cambridge University Press (2020)
Slide 16: Stanford University CS231n course notes: Convolutional Neural Networks for Visual Recognition (2020)
Slide 21,22: “Machine learning: Trends, perspectives, and prospects”, Jordan, Mitchell, Science (2015)
Slide 22: Google Translate website
Slide 22: University of Toronto CSC2515 course notes: Machine learning (2020)
Slide 25: Google Deepmind AlphaGo website