SlideShare una empresa de Scribd logo
1 de 24
Introduction to Deep Learning
Dmitry Petukhov,
Machine Learning Consultant, Microsoft Most Valuable AI Professional
&& Coffee Addicted
#AI #DeepLearning
AI vs ML vs DL
Artificial Intelligence
Machine Learning
Deep Learning
Source: deeplearningbook.org
AI: Current State
Picture credit: McKinsey&Company, 2017
AI: Important Trends
=> Accuracy increase
Scientific research
Computing capacity
CPU > GPU > TPU
Data volume
Volume. Velocity. Variety.
Complexity of the AI models
Layers Count and Design
Democratizing
ML Frameworks, ML as a Service, GPU in Cloud
Deep Learning in ImageNet
14M images, 1K classes
Picture credit: arxiv.org
AI vs Man
Soon (or already?) better than human intelligence:
− Computer vision (2016)
− Text translation (2017)
− Text generation (OpenAI, 2019)
− Games: Pacman, Dota 2, Go (AplhaGo and AlphaZero), StarCraft II (2015-2019)
− Medicine: heart attack, neurodegenerative diseases, oncology, and more
Neural Network Course. Typical start
Source: stanford.edu
Как стать
таким умным?
Artificial Neural Networks
Neural Networks Zoo
Picture credit: asimovinstitute.org
Feed-Forward Neural Network, FFNN
Multi-Layer Neural Networks, MLNFully-connected FFNN
Pros and cons:
+ простая реализация
+ универсальный аппроксиматор
=> вскрывает сложные нелинейные зависимости
- нет возможности запоминать порядок времени
- не обладают памятью (кроме полученной при обучении).
Pros and cons те же, что и FFNN, а также:
+ высокоуровневые предикторы на последних слоях
- много параметров (вычислительно неэффективно)
- затухающие градиенты
- переобучение.
Rosenblatt, Frank. The perceptron: a probabilistic model for information storage(…), 1958. Original Paper PDF
Convolution and subsampling
Picture credit: developer.apple.com
Что делаем?
* выделяем локальные признака (features)
Что делаем?
* уменьшаем размерность в N раз (N > 1)
* оставляем сильные сигналы (для max polling)
* добавляем инвариантность к небольшим сдвигам
2. Subsampling1. Convolution
Convolutional Neural Networks, CNN
Picture credit: wikipedia.org
LeCun, Yann, et al. Gradient-based learning applied to document recognition, 1998. Original Paper PDF
Pros and cons:
+ сильно меньше параметров, чем у FFNN
+ устойчивость к небольшим сдвигам
- переобучение
Use Cases:
* для задач компьютерного зрения: распознание образов,
обнаружение объектов и т.д.
* ключевая роль в архитектурах моделей ResNet, Inception и прочих;
* ключевая роль в задачах переносов стилей (artistic style);
* увеличение разрешения и раскраска изображения.
CNNs Evolution
Fully-convolutional
network
Deconvolution
networks
http://cvlab.postech.ac.kr/research/deconvnet/
Recurrent Neural Networks, RNN
Pros and cons:
+ Тьюринг-полны
=> можно реализовать любую вычислимую функцию
+ работа с контекстом и последовательностями
- проблема затухающего/взрывного градиента
Use Cases:
* Анализ временных последовательностей
* Видео: следующий кадр на основе предыдущих, описание каждого
кадра видео естественным языком (составная часть)
* Фото: предсказание следующего пикселя, определение стиля
изображения, описание картинки естественным языком (составная
часть)
* Текст: предсказание следующего слова, определение тональности
текста
Elman, Jeffrey L. Finding structure in time, 1990. Original Paper PDF
Picture credit: kvitajakub.github.io
Long Short Term Memory, LSTM
Hochreiter, Sepp, and Jürgen Schmidhuber. Long short-term memory, 1997. Original Paper PDF
Picture credit: kvitajakub.github.io
Use Cases:
* те же, что и классические RNN (только умнее)
* генерация разнообразных текстов (Шекспира, Latex-разметку или
С-код), сочинение несложных музыкальных произведений
Pros and cons:
те же что и RNN, кроме
+ решена проблема затухающего/взрывного градиента
У каждого нейрона есть 3 фильтра (gates):
1. входной фильтр (input gate): состояние с предыдущего шага;
2. выходной фильтр (output gate): состояние на следующий слой;
3. фильтр забывания (forget gate): состояние, которое стоит
забыть.
RNN Evolution
Bidirectional RNN, BiRNN / BiLSTM / BiGRUGated Recurrent Units, GRU
Picture credit: colah.github.io
Picture credit: kvitajakub.github.io
Multimodal Learning
Picture credit: https://www.cs.utexas.edu/~vsub/
Oriol Vinyals, et al. Show and Tell: A Neural Image Caption Generator, 2014. Original Paper PDF
Use Cases:
* Image to text
* Video to text
Generative Adversarial Networks, GAN
Goodfellow, Ian, et al. Generative adversarial nets, 2014. Original Paper PDF
Две соревнующиеся сети (чаще CNN или FFNN):
1. Генератор: генерирует данные;
2. Дискриминатор: получает то реальные, то
сгенерированные данные и определяет их тип.
Pros and cons:
+ многообещающая архитектура;
- непросто обучить, т.к. нужны «равные соперники».
Use Cases:
* Text to image
* Image to image
* Fake news
* Молекулы-кандидаты для лекарств.
Picture credit: asimovinstitute.org
GAN Evolution Generative models are one of the most promising
approaches towards this goal.
OpenAI4.5 years of GAN progress on face generation
https://arxiv.org/abs/1406.2661 | https://arxiv.org/abs/1511.06434 | https://arxiv.org/abs/1606.07536 | https://arxiv.org/abs/1710.10196 | https://arxiv.org/abs/1812.04948
Test yourself whichfaceisreal.com
Picture credit: www.azure.com/ai
Microsoft AI Platform
…or Amazon Web Services, Google Cloud Platform, Яндекс.Облако
Azure Data Science VM
Picture credit: Azure Docs
NVidia Tesla GPU
Ubuntu / Windows Server
TensorFlow / CNTK
Python / R
DSVM
Microsoft Azure
Keras
Deep Learning Demo
library(Quandl)
library(dplyr)
library(forecast)
dt <- Quandl("BCHARTS/BITBAYUSD) %>%
select(Date, Close)
dt.train <- dt %>% filter(Date < max(Date) - months(2))
dt.test <- dt %>% filter(Date > max(dt.train$Date))
timeseries <- ts(dt.train$Close, frequency = 1)
model <- ets(timeseries)
© 2019, Dmitry Petukhov. CC BY-SA 4.0 license. Microsoft and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.
Thank you!
Q&A
Now or later (see contacts below)
Join to us
DΛTA GEEKS Community meetup.com/Data-Geeks-Community/
Stay connected
Be friend at the Facebook/@codezombie
Read me at the Habr/@codezombie
All contacts on http://0xCode.in/@codez0mb1e
Download slides from
http://0xcode.in/deep-learning-intro or

Más contenido relacionado

Similar a Introduction to Deep Learning

CV2011 Lecture 1. Part 1. Introduction to computer vision
CV2011 Lecture 1. Part 1. Introduction to computer visionCV2011 Lecture 1. Part 1. Introduction to computer vision
CV2011 Lecture 1. Part 1. Introduction to computer vision
Anton Konushin
 
Start
StartStart
Start
IKTO
 
оцифровкадвижений глобус (1) 1
оцифровкадвижений глобус (1) 1оцифровкадвижений глобус (1) 1
оцифровкадвижений глобус (1) 1
Павел Короткий
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
it-network
 

Similar a Introduction to Deep Learning (20)

Введение в профессию исследователя приложений без исходных кодов
Введение в профессию исследователя приложений без исходных кодовВведение в профессию исследователя приложений без исходных кодов
Введение в профессию исследователя приложений без исходных кодов
 
Умник
УмникУмник
Умник
 
закон иерархических компенсаций седова и C++ core guidelines
закон иерархических компенсаций седова и C++ core guidelinesзакон иерархических компенсаций седова и C++ core guidelines
закон иерархических компенсаций седова и C++ core guidelines
 
закон иерархических компенсаций седова и C++ core guidelines
закон иерархических компенсаций седова и C++ core guidelinesзакон иерархических компенсаций седова и C++ core guidelines
закон иерархических компенсаций седова и C++ core guidelines
 
CV2011 Lecture 1. Part 1. Introduction to computer vision
CV2011 Lecture 1. Part 1. Introduction to computer visionCV2011 Lecture 1. Part 1. Introduction to computer vision
CV2011 Lecture 1. Part 1. Introduction to computer vision
 
Start
StartStart
Start
 
Start
StartStart
Start
 
CUDA & CAFFE
CUDA & CAFFE CUDA & CAFFE
CUDA & CAFFE
 
Лекция 8
Лекция 8Лекция 8
Лекция 8
 
оцифровкадвижений глобус (1) 1
оцифровкадвижений глобус (1) 1оцифровкадвижений глобус (1) 1
оцифровкадвижений глобус (1) 1
 
Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2Denis Perevalov -- Computer Vision with OpenCV 2
Denis Perevalov -- Computer Vision with OpenCV 2
 
Современные коллаборативные технологии в учебном процессе: теория и практика ...
Современные коллаборативные технологии в учебном процессе: теория и практика ...Современные коллаборативные технологии в учебном процессе: теория и практика ...
Современные коллаборативные технологии в учебном процессе: теория и практика ...
 
мбоу сош№1 правка
мбоу сош№1 правкамбоу сош№1 правка
мбоу сош№1 правка
 
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
IT Network BACon agile spring. Дмитрий Гузенко - BA for Data Science & Machin...
 
Bacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsmlBacon.2018.it pro network.ba for dsml
Bacon.2018.it pro network.ba for dsml
 
Отказоустойчивые игры с облаком – как делают игры на много пользователей
Отказоустойчивые игры с облаком – как делают игры на много пользователейОтказоустойчивые игры с облаком – как делают игры на много пользователей
Отказоустойчивые игры с облаком – как делают игры на много пользователей
 
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: тренды, достижения и вызовы
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: тренды, достижения и вызовыИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: тренды, достижения и вызовы
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: тренды, достижения и вызовы
 
A.g.demenev(perm su) 2014
A.g.demenev(perm su) 2014A.g.demenev(perm su) 2014
A.g.demenev(perm su) 2014
 
Тяжело в учении - легко в бою
Тяжело в учении - легко в боюТяжело в учении - легко в бою
Тяжело в учении - легко в бою
 
IT future for childs
IT future for childsIT future for childs
IT future for childs
 

Más de Dmitry Petukhov

Más de Dmitry Petukhov (15)

Introduction to Auto ML
Introduction to Auto MLIntroduction to Auto ML
Introduction to Auto ML
 
Intelligent Banking: AI cases in Retail and Commercial Banking
Intelligent Banking: AI cases in Retail and Commercial BankingIntelligent Banking: AI cases in Retail and Commercial Banking
Intelligent Banking: AI cases in Retail and Commercial Banking
 
IaaS, PaaS, and DevOps for Data Scientist
IaaS, PaaS, and DevOps for Data ScientistIaaS, PaaS, and DevOps for Data Scientist
IaaS, PaaS, and DevOps for Data Scientist
 
Introduction to Machine Learning
Introduction to Machine LearningIntroduction to Machine Learning
Introduction to Machine Learning
 
Microsoft Machine Learning Server. Architecture View
Microsoft Machine Learning Server. Architecture ViewMicrosoft Machine Learning Server. Architecture View
Microsoft Machine Learning Server. Architecture View
 
AI in IoT: Use Cases and Challenges
AI in IoT: Use Cases and ChallengesAI in IoT: Use Cases and Challenges
AI in IoT: Use Cases and Challenges
 
Azure Machine Learning
Azure Machine LearningAzure Machine Learning
Azure Machine Learning
 
Machine Intelligence for Fraud Prediction
Machine Intelligence for Fraud PredictionMachine Intelligence for Fraud Prediction
Machine Intelligence for Fraud Prediction
 
Machine Learning with Microsoft Azure
Machine Learning with Microsoft AzureMachine Learning with Microsoft Azure
Machine Learning with Microsoft Azure
 
Democratizing Artificial Intelligence
Democratizing Artificial IntelligenceDemocratizing Artificial Intelligence
Democratizing Artificial Intelligence
 
AI for Retail Banking
AI for Retail BankingAI for Retail Banking
AI for Retail Banking
 
R + Apache Spark
R + Apache SparkR + Apache Spark
R + Apache Spark
 
Introduction to R
Introduction to RIntroduction to R
Introduction to R
 
Microsoft Azure + R
Microsoft Azure + RMicrosoft Azure + R
Microsoft Azure + R
 
Machine Learning in Microsoft Azure
Machine Learning in Microsoft AzureMachine Learning in Microsoft Azure
Machine Learning in Microsoft Azure
 

Introduction to Deep Learning

  • 1. Introduction to Deep Learning Dmitry Petukhov, Machine Learning Consultant, Microsoft Most Valuable AI Professional && Coffee Addicted #AI #DeepLearning
  • 2. AI vs ML vs DL Artificial Intelligence Machine Learning Deep Learning Source: deeplearningbook.org
  • 3. AI: Current State Picture credit: McKinsey&Company, 2017
  • 4. AI: Important Trends => Accuracy increase Scientific research Computing capacity CPU > GPU > TPU Data volume Volume. Velocity. Variety. Complexity of the AI models Layers Count and Design Democratizing ML Frameworks, ML as a Service, GPU in Cloud
  • 5. Deep Learning in ImageNet 14M images, 1K classes Picture credit: arxiv.org
  • 6. AI vs Man Soon (or already?) better than human intelligence: − Computer vision (2016) − Text translation (2017) − Text generation (OpenAI, 2019) − Games: Pacman, Dota 2, Go (AplhaGo and AlphaZero), StarCraft II (2015-2019) − Medicine: heart attack, neurodegenerative diseases, oncology, and more
  • 7. Neural Network Course. Typical start Source: stanford.edu Как стать таким умным?
  • 9. Neural Networks Zoo Picture credit: asimovinstitute.org
  • 10. Feed-Forward Neural Network, FFNN Multi-Layer Neural Networks, MLNFully-connected FFNN Pros and cons: + простая реализация + универсальный аппроксиматор => вскрывает сложные нелинейные зависимости - нет возможности запоминать порядок времени - не обладают памятью (кроме полученной при обучении). Pros and cons те же, что и FFNN, а также: + высокоуровневые предикторы на последних слоях - много параметров (вычислительно неэффективно) - затухающие градиенты - переобучение. Rosenblatt, Frank. The perceptron: a probabilistic model for information storage(…), 1958. Original Paper PDF
  • 11. Convolution and subsampling Picture credit: developer.apple.com Что делаем? * выделяем локальные признака (features) Что делаем? * уменьшаем размерность в N раз (N > 1) * оставляем сильные сигналы (для max polling) * добавляем инвариантность к небольшим сдвигам 2. Subsampling1. Convolution
  • 12. Convolutional Neural Networks, CNN Picture credit: wikipedia.org LeCun, Yann, et al. Gradient-based learning applied to document recognition, 1998. Original Paper PDF Pros and cons: + сильно меньше параметров, чем у FFNN + устойчивость к небольшим сдвигам - переобучение Use Cases: * для задач компьютерного зрения: распознание образов, обнаружение объектов и т.д. * ключевая роль в архитектурах моделей ResNet, Inception и прочих; * ключевая роль в задачах переносов стилей (artistic style); * увеличение разрешения и раскраска изображения.
  • 14. Recurrent Neural Networks, RNN Pros and cons: + Тьюринг-полны => можно реализовать любую вычислимую функцию + работа с контекстом и последовательностями - проблема затухающего/взрывного градиента Use Cases: * Анализ временных последовательностей * Видео: следующий кадр на основе предыдущих, описание каждого кадра видео естественным языком (составная часть) * Фото: предсказание следующего пикселя, определение стиля изображения, описание картинки естественным языком (составная часть) * Текст: предсказание следующего слова, определение тональности текста Elman, Jeffrey L. Finding structure in time, 1990. Original Paper PDF Picture credit: kvitajakub.github.io
  • 15. Long Short Term Memory, LSTM Hochreiter, Sepp, and Jürgen Schmidhuber. Long short-term memory, 1997. Original Paper PDF Picture credit: kvitajakub.github.io Use Cases: * те же, что и классические RNN (только умнее) * генерация разнообразных текстов (Шекспира, Latex-разметку или С-код), сочинение несложных музыкальных произведений Pros and cons: те же что и RNN, кроме + решена проблема затухающего/взрывного градиента У каждого нейрона есть 3 фильтра (gates): 1. входной фильтр (input gate): состояние с предыдущего шага; 2. выходной фильтр (output gate): состояние на следующий слой; 3. фильтр забывания (forget gate): состояние, которое стоит забыть.
  • 16. RNN Evolution Bidirectional RNN, BiRNN / BiLSTM / BiGRUGated Recurrent Units, GRU Picture credit: colah.github.io Picture credit: kvitajakub.github.io
  • 17. Multimodal Learning Picture credit: https://www.cs.utexas.edu/~vsub/ Oriol Vinyals, et al. Show and Tell: A Neural Image Caption Generator, 2014. Original Paper PDF Use Cases: * Image to text * Video to text
  • 18. Generative Adversarial Networks, GAN Goodfellow, Ian, et al. Generative adversarial nets, 2014. Original Paper PDF Две соревнующиеся сети (чаще CNN или FFNN): 1. Генератор: генерирует данные; 2. Дискриминатор: получает то реальные, то сгенерированные данные и определяет их тип. Pros and cons: + многообещающая архитектура; - непросто обучить, т.к. нужны «равные соперники». Use Cases: * Text to image * Image to image * Fake news * Молекулы-кандидаты для лекарств. Picture credit: asimovinstitute.org
  • 19. GAN Evolution Generative models are one of the most promising approaches towards this goal. OpenAI4.5 years of GAN progress on face generation https://arxiv.org/abs/1406.2661 | https://arxiv.org/abs/1511.06434 | https://arxiv.org/abs/1606.07536 | https://arxiv.org/abs/1710.10196 | https://arxiv.org/abs/1812.04948 Test yourself whichfaceisreal.com
  • 20. Picture credit: www.azure.com/ai Microsoft AI Platform …or Amazon Web Services, Google Cloud Platform, Яндекс.Облако
  • 21. Azure Data Science VM Picture credit: Azure Docs NVidia Tesla GPU Ubuntu / Windows Server TensorFlow / CNTK Python / R DSVM Microsoft Azure Keras
  • 22. Deep Learning Demo library(Quandl) library(dplyr) library(forecast) dt <- Quandl("BCHARTS/BITBAYUSD) %>% select(Date, Close) dt.train <- dt %>% filter(Date < max(Date) - months(2)) dt.test <- dt %>% filter(Date > max(dt.train$Date)) timeseries <- ts(dt.train$Close, frequency = 1) model <- ets(timeseries)
  • 23. © 2019, Dmitry Petukhov. CC BY-SA 4.0 license. Microsoft and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries. Thank you!
  • 24. Q&A Now or later (see contacts below) Join to us DΛTA GEEKS Community meetup.com/Data-Geeks-Community/ Stay connected Be friend at the Facebook/@codezombie Read me at the Habr/@codezombie All contacts on http://0xCode.in/@codez0mb1e Download slides from http://0xcode.in/deep-learning-intro or

Notas del editor

  1. Количественный (ML) и качественный (DL) рост
  2. Паркинсона по голосу Ранняя диагностика диабетической ретинопатии по фото глаза Меланому по фото в большом разрешении (AUC > .94, Google) Риск сердечного приступа по кровяному давлению
  3. Теорема Цыбенко — искусственная нейронная сеть прямой связи с одним скрытым слоем может аппроксимировать любую непрерывную функцию многих переменных с любой точностью.
  4. Posts https://habr.com/ru/users/iphysic/posts/
  5. (c) 2019, Dmitry Petukhov. CC BY-SA 4.0 license.