SlideShare una empresa de Scribd logo
1 de 7
Descargar para leer sin conexión
AI半導体の概況
2022年2月28日月曜日
信州大学 社会基盤研究所
特任教授 林 憲一
AI半導体の概況
現在機械学習やディープラーニングなどの「AI演算」を行う半導体としては汎用のCPUやGPUが主に使われています。一
方AI市場の拡大に呼応して、世界各地のスタートアップ企業などが汎用プロセッサより高性能や高効率を謳ったAI演算専
用の「AI半導体」を発表しています。この背景にはAI演算に特徴的なSparsityとDataflowがあると考えます。
コンピューターの歴史を振り返ると、演算器の著しい性能向上に対して、メモリーの性能が上がらず、乖離が年々広がると
いう大きな課題があります。これに対してはメモリーの階層構造を採ることでデータの遅延を隠蔽し、演算器の性能を維持
することが出来ました。しかし、この方式はキャッシュのヒット率が高いことが条件となります。HPCやグラフィックスの処理では
DENSEなGEMM、つまり密行列の掛け算が主な計算であり、これらの演算ではキャッシュのヒット率が高く、プロセッサの理
論ピークに近い性能を出すことが出来ます。しかし、AI演算では疎行列が多く現れ、キャッシュのヒット率を高く保つことはで
きず、プロセッサの演算性能が活かせません。
また現代コンピューターは演算そのものよりもデータの移動に電力を消費します。汎用演算器では演算毎にデータをメモリ
から読み書きする必要があるため、大きなメモリバンド幅が必要になり、また電力消費も大きくなります。一方ニューラルネッ
トワークは本質的にDataflowであり、演算カーネルからカーネルへデータが流れればメモリへのデータの読み書きは不要です。
AIが一過性のブームではなく、今後もずっと続くものである、との確信が広がるにつれ、計算機アーキテクチャを根本から見
直す必要に迫られています。これが現在多くのAI半導体が提案されている理由であり、各社が様々なアプローチで
SparsityとDataflowに立ち向かっています。
現代コンピューター最大の課題: メモリー
• 演算性能とメモリー性能の乖離
– メモリーの階層構造によりデータの遅延を隠蔽
– キャッシュヒット率に依存
– DENSEなGEMMには最適な構造
現代コンピューター最大の課題: メモリー
• 現代半導体においては、演算に必要な電力消
費より、データの移動に必要な電力消費の方が
遥かに大きい
右図の例では
– 64-bitの倍精度の演算に必要なエネルギーは20pJ
– この半導体の中をデータが1mm移動するのに必要な
エネルギーは26pJ、10mm移動すると256pJ
– 外部DRAMへのアクセスは16nJ
• いかにデータを近くに配置し、データの移動距離
を短くして演算出来るかが重要
Figure: Computation cost is significantly lower than
communication cost in 28nm NVIDIA chips
(Source: Bill Dally)
スパース性とグラフニューラルネットワーク
Cerebras Systemsの講演資料より
全部繋がっていれば非零の重みがあるので密行列
繋がりが減ると疎行列
GRAPHCOREは”Compute in Memory”アーキテクチャで
キャッシュを使わない実メモリ方式にすることでキャッシュヒット
率の問題を回避
CerebrasとSambaNovaはデータフロー方式で疎行列のゼ
ロの演算を回避
データフロー計算機
• 非ノイマン型計算機
– 記憶装置との間でデータを一つずつやりとりしながら,命令を順々に実行
していくノイマン型コンピューターとは違って,データがそろうごとに演算が行
われる仕組みのコンピューター。
• データフロー計算機の歴史は古いが、商用的に成功したことは
ない
– データフローのアプリがなかった
⇔ ニューラルネットワークは全てデータフロー
– データフローのロジックを半導体に実装出来なかった
⇔ Cerebras WSE、再構成可能な半導体
データフロー計算機がAI半導体として初めて成功するか!?
AI半導体の概況

Más contenido relacionado

Más de 日本ディープラーニング協会(JDLA)

Más de 日本ディープラーニング協会(JDLA) (7)

顔認識の世界的な流れに触れつつ、顔認識の人種バイアスや偽造検知、なりすまし検知に関する論文
顔認識の世界的な流れに触れつつ、顔認識の人種バイアスや偽造検知、なりすまし検知に関する論文顔認識の世界的な流れに触れつつ、顔認識の人種バイアスや偽造検知、なりすまし検知に関する論文
顔認識の世界的な流れに触れつつ、顔認識の人種バイアスや偽造検知、なりすまし検知に関する論文
 
ビジネス応用例と絡めて
ビジネス応用例と絡めてビジネス応用例と絡めて
ビジネス応用例と絡めて
 
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
機械学習をビジネスに利活用する人たちに対してモデル開発後の実運用フェーズにおける課題とその対策方法
 
CVPR 2020報告
CVPR 2020報告CVPR 2020報告
CVPR 2020報告
 
オンライン説明会「G検定の疑問・質問全部答えます!」
オンライン説明会「G検定の疑問・質問全部答えます!」オンライン説明会「G検定の疑問・質問全部答えます!」
オンライン説明会「G検定の疑問・質問全部答えます!」
 
ABEJAの デジタルトランスフォーメーション 〜AIが実現するプロセス⾰命〜
ABEJAの デジタルトランスフォーメーション 〜AIが実現するプロセス⾰命〜ABEJAの デジタルトランスフォーメーション 〜AIが実現するプロセス⾰命〜
ABEJAの デジタルトランスフォーメーション 〜AIが実現するプロセス⾰命〜
 
CDLEおすすめ書籍
CDLEおすすめ書籍CDLEおすすめ書籍
CDLEおすすめ書籍
 

Último

Último (10)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 

AI半導体の概況