SlideShare una empresa de Scribd logo
1 de 52
Descargar para leer sin conexión
ソフトウェアエンジニア
shitian-ni
無限ボルツマンマシンをトレーニングする手法
自己紹介 - 倪石天
● 2回目
● GTCでもポスター発表
● 東工大4年生
● Kaggle Expert
● メルカリインターン
○ 量子コンピューティング
D-wave, 量子アニーリング
メルチャリ、機械学習関連
1/20
Image from D-wave
なんでボルツマンマシンの話?
2/20
量子コンピュータ
3/20
量子コンピュータ
3/20
Image from D-wave
Image from D-wave
QPU
CPU/GPU:
ノードがビット
QPU:  
ノードのビット(Q bit)以外に、ビットの重み、ビット間のエッジに重みがある
4/20
Image from D-wave
Solve a problem
Sampling
量子アニーリング特有のプログラミング
5/20
Problem types
6/20
決まっている
Problem types
6/20
Sample code from D-wave cloud
Problem types
6/20
Sample code from D-wave cloud
Problem types
6/20
Sample code from D-wave cloud
QUBOは省略
Boltzmann Machine
7/20
Boltzmann Machine
visible nodes
inputs, outputs
hidden nodes
neurons
原始的なニューラルネットワーク
色々な応用がある
7/20
Image from D-wave cloud
Ising modelとの関係
8/20
Image from D-wave cloud
from Wikipedia
Ising modelとの関係
量子コンピュータが解ける
量子時代の役割に期待
8/20
Image from D-wave cloud
from Wikipedia
Applications
● image and audio classification
○ A. Mohamed and G. E. Hinton. Phone recognition using restricted Boltzmann machines
○ G. E. Hinton, R. R. Salakhutdinov. Reducing the Dimensionality of Data with Neural Networks
● generation
○ Mohamed A, Dahl G E, Hinton G. Acoustic modeling using deep belief networks
● collaborative filtering
○ R. Salakhutdinov, A. Mnih, and G. E. Hinton. Restricted Boltzmann machines for collaborative filtering
○ Truyen Tran, Dinh Phung, Svetha Venkatesh. Mixed-Variate Restricted Boltzmann Machines
● motion modeling
○ G. W. Taylor, G. E. Hinton, and S. T. Roweis. Modeling human motion using binary latent variables
Restricted Boltzmann Machineの応用例が多い
D-waveの応用例も多くなる
9/20
Applications
● image and audio classification
○ A. Mohamed and G. E. Hinton. Phone recognition using restricted Boltzmann machines
○ G. E. Hinton, R. R. Salakhutdinov. Reducing the Dimensionality of Data with Neural Networks
● generation
○ Mohamed A, Dahl G E, Hinton G. Acoustic modeling using deep belief networks
● collaborative filtering
○ R. Salakhutdinov, A. Mnih, and G. E. Hinton. Restricted Boltzmann machines for collaborative filtering
○ Truyen Tran, Dinh Phung, Svetha Venkatesh. Mixed-Variate Restricted Boltzmann Machines
● motion modeling
○ G. W. Taylor, G. E. Hinton, and S. T. Roweis. Modeling human motion using binary latent variables
RBM VS
CNN, GAN
RNN, VAE,...
Restricted Boltzmann Machineの応用例が多い
D-waveの応用例も多くなる
9/20
Applications
Infinite RBM VS
CNN, GAN
RNN, VAE,...
● image and audio classification
○ A. Mohamed and G. E. Hinton. Phone recognition using restricted Boltzmann machines
○ G. E. Hinton, R. R. Salakhutdinov. Reducing the Dimensionality of Data with Neural Networks
● generation
○ Mohamed A, Dahl G E, Hinton G. Acoustic modeling using deep belief networks
● collaborative filtering
○ R. Salakhutdinov, A. Mnih, and G. E. Hinton. Restricted Boltzmann machines for collaborative filtering
○ Truyen Tran, Dinh Phung, Svetha Venkatesh. Mixed-Variate Restricted Boltzmann Machines
● motion modeling
○ G. W. Taylor, G. E. Hinton, and S. T. Roweis. Modeling human motion using binary latent variables
9/20
Restricted Boltzmann Machineの応用例が多い
D-waveの応用例も多くなる
Motivation
どれが良さそう?
10/20
Motivation
ほとんどの場合
hidden nodeが多かった方が
モデルの表現力が増す
hidden nodeの間に強い相関があると
過学習の恐れがある
10/20
infinite RBM
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
11/20
infinite RBM
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
11/20
infinite RBM
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
11/20
i番目hidden nodeを学習する
12/20
12/20
z: エネルギー関数に入れる hidden nodeの数
i番目hidden nodeを学習する
12/20
the newly added hidden
unit is always influenced
by all the previous
added hidden units
sum up all hidden unit states
i番目のhidden nodeを学習することを考える
z: エネルギー関数に入れるhidden nodeの数
i番目hidden nodeを学習する
12/20
the newly added hidden
unit is always influenced
by all the previous
added hidden units
sum up all hidden unit states
i番目のhidden nodeを学習することを考える
z: エネルギー関数に入れるhidden nodeの数
i番目hidden nodeを学習する
どうすればいいか
12/20
if → 1
then the first M hidden units are
independent with each other
i番目のhidden nodeを学習することを考える
z: エネルギー関数に入れるhidden nodeの数
i番目hidden nodeを学習する
12/20
iより多くのノードの一斉のシャッフルはエネルギーに影響を与える
この時、全ての順序を列挙してエネルギーに入れた場合、
順序バイアスを解消できる
i番目hidden nodeを学習する
Order effect
11/20
交換したらモデル結果変わらないはず
p(Mt>z) → 0
p(z<=Mt) → 0
交換したらモデル結果変わるはず
p(Mt>z) → 1
p(z<=Mt) → 1
改善策
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
13/20
13/20
i番目のhidden nodeを学習することを考える
if
then → 1
then the first M hidden units are
independent with each other
Mt: このステップにシャッフルする
hidden nodeの数
 :[1,2,...,Mt] の並べ替え
z: エネルギー関数に入れるhidden nodeの数
改善策
Mt>z
iより後ろのhidden nodeを
シャッフルして前に入れる
13/20
i番目のhidden nodeを学習することを考える
if
then → 1
then the first M hidden units are
independent with each other
改善策
Mt>z
iより後ろのhidden nodeを
シャッフルして前に入れる
Mt: このステップにシャッフルする
hidden nodeの数
 :[1,2,...,Mt] の並べ替え
z: エネルギー関数に入れるhidden nodeの数
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
14/20
hidden node入れ替え
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
- 依存するノードが変わる(依存しなくなる)
14/20
hidden node入れ替え
14/20
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
- 依存するノードが変わる(依存しなくなる)
- 新しいノードを入れる度に
- hidden nodeの順序が変わる
- hidden nodeの数も変わる
- つまり新しいモデルをトレーニングすることになる
- 結局は無限複数のモデルの平均を取ることになる (boosting)
- そういう場合は大体結果が良くなる
- Kaggleも :)
hidden node入れ替え
Dropoutのようなもの
14/20
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
- 依存するノードが変わる(依存しなくなる)
- 新しいノードを入れる度に
- hidden nodeの順序が変わる
- hidden nodeの数も変わる
- つまり新しいモデルをトレーニングすることになる
- 結局は無限複数のモデルの平均を取ることになる (boosting)
- そういう場合は大体結果が良くなる
- Kaggleも :)
hidden node入れ替え
Dropoutのようなもの out→permutation(out & in)
14/20
学習時にhidden nodeが自由に増減できる
データに適応してモデルが変化できる
- 生涯学習
Con:
- 収束しづらい、遅い
理由:
- 新しく入ったhidden nodeは
前から学習していたノードに依存する
hidden node同士に繋がりがないから互いに独立
改善:
- 勾配法更新する度に hidden nodeを入れ替える
- 依存するノードが変わる(依存しなくなる)
- 新しいノードを入れる度に
- hidden nodeの順序が変わる
- hidden nodeの数も変わる
- つまり新しいモデルをトレーニングすることになる
- 結局は無限複数のモデルの平均を取ることになる (boosting)
- そういう場合は大体結果が良くなる
- Kaggleも :)
hidden node入れ替え
生成モデル
D dimensional visible vector
infinite-dimensional hidden vector
total number of hidden units selected
visible unit bias vector
i-th hidden unit bias
Weight matrix connecting visible and hidden units
i-th row of W
penalty for selected hidden unit
15/20
Images from Xuan Peng et al
total number of hidden units selected
サンプリングしてvを得る
生成モデルなど
生成モデル
15/20
D dimensional visible vector
infinite-dimensional hidden vector
visible unit bias vector
i-th hidden unit bias
Weight matrix connecting visible and hidden units
i-th row of W
penalty for selected hidden unit
識別モデル
16/20
Images from Xuan Peng et al
識別モデル training objective
17/20
データを貰って予測結果 yになる確率
生成データがvになる確率確率
Training
18/20 Images from Xuan Peng et al
Mt: このステップにシャッフルする
hidden nodeの数
 :[1,2,...,Mt] の並べ替え
Results
Generative model
Discriminative model
RP: Random Permutation
19/20 Data and Images from Xuan Peng et al
結論
20/20
● 量子コンピューターのニューラルネットワーク利用例
○ RBM
● RBMは無限にネットワーク増大できる
○ 生涯学習
● 学習する時hidden nodeの順番を入れ替える
○ 訓練スピード向上と精度向上ができる
Questions? Comments?
shitian.ni@mercari.com

Más contenido relacionado

Destacado

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...DevGAMM Conference
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationErica Santiago
 

Destacado (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

無限ボルツマンマシンの学習