Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.
Today is special in mylife,
and Kernel/VM ....
2014年7月12日 Kernel/VM北陸 1
@sushi514
Kernel/VM探検隊@北陸 12014年7月12日 Kernel/VM北陸 2
小話:そしてGPUベイカーへと…
RADEON HD6850との出会い
加熱処理を用いた故障GPUの再生実験
67台の故障GPUでの定量的評価
ベイクドGPU
デモ
ベイカーの未来
ネットワーク焼く?メモリ焼く?
2014年7月...
事案発生
2012年7月3日
RADEON HD6850ちゃんが100℃超えて死ぬ
ベンチが通らない
ゲームもできない(´・ω・`)
焼いてみた
ヒートガンでやる?オーブントースターでやる?
電子レンジのオーブン機能:210℃ 3...
2014年7月12日 Kernel/VM北陸 5
衝撃の展開
参考文献2
オーブンの効能
•焼く前
• 温度:100℃超
• 音 :騒音
• ベンチマーク:
保護回路働いて死
•ベイクド
• 温度:70℃
• 音 :静音
• ベンチマーク
FF XIV 3315
2014年7月12日 Kernel/VM北陸 6
2014年7月12日 Kernel/VM北陸 7
( ˘⊖˘) 。o(でもなんで
2014年7月12日 Kernel/VM北陸 8
( ˘⊖˘) 。o(でもなんで新しいGPUが
壊れるんだ… )
2014年7月12日 Kernel/VM北陸 9
( ˘⊖˘) 。o(でもなんで新しいGPUが
壊れるんだ… )
AF6850-1024D5S1の発売時期
2011年3月頃
(購入は2012年頭)
参考文献3
2014年7月12日 Kernel/VM北陸 10
|| ┗(☋` )┓三 ちょっと調べてみよう
自らの修理歴を振り返る
2014年7月12日 Kernel/VM北陸 11
故障の考察
2014年7月12日 Kernel/VM北陸 12
尋常じゃないGPUたち
短期間で故障
負荷をかけると異常発熱して強制終了
ドライバがあたらない
故障原因の検討
冷却不足(対策するも効果なし)
各部品の故障なのか
2014年7月12日 Kernel/VM北陸 13
発売・購入から1...
そしてGPUベイカーへと…
加熱処理が有効な修理方法なら
修理のノウハウがまたひとつ増える!✌('ω'
転売で一攫千金も夢じゃない!✌('ω'✌ )三✌('ω')✌三( ✌'ω')✌
GPU焼くのは楽しい
よくわからないワクワク感と物...
加熱処理を用いた
故障したGPUの再生実験
理論編だったり実践編だったり。
2014年7月12日 Kernel/VM北陸 15
GPU
モダンなお小遣い稼ぎアクセラレータ
すごい
集積度の向上
• 年1.7倍
電力効率
• スパコン利用
コア数
• K40 コア2880個(トランジスタ数71億)
すごいすごい… 2014年7月12日 Kernel/VM北陸 ...
GPUの駆動時の温度
アイドル
40℃
高負荷時
80℃や90℃に
2014年7月12日 Kernel/VM北陸 17
0
40
50
60
70
80
90
100
105
保護機能で強制停止
高負荷時
アイドル
温度は寿命に直結します
2014年7月12日 Kernel/VM北陸 18
GPU上にある各パーツ
受動素子
抵抗,コイル,コンデンサ, VRM
能動素子
LSI,制御用IC
コンデンサ
よく死ぬ
2014年7月12日 Kernel/VM北陸 19
参考文献8
パーツの寿命
•寿命イメージ
• コンデンサ
• コイル
• 抵抗
• VRM
• DRAM
• 制御用IC
•コンデンサ
• アルミニウム
電解コンデンサ
(液体コンデンサ)
• アルミ
固体電解コンデンサ
(固体コンデンサ)
2014年7月...
アルミニウム電解コンデンサ
2014年7月12日 Kernel/VM北陸 21
アルミ固体電解コンデンサ
2014年7月12日 Kernel/VM北陸 22
コンデンサ比較
•設計寿命
• 85℃/2000時間
(85℃品)
•設計寿命
• 105℃/2000時間
(105℃品)
2014年7月12日 Kernel/VM北陸 23
実使用時間の設計
アレニウス則
使用温度が10℃下がるごとに寿命が2倍
例:85℃品のコンデンサ
85℃ 2000時間 ≒ 83日
75℃ 4000時間 ≒ 166日
65℃ 8000時間 ≒ 333日
105℃品で75℃でも160...
はんだ面に着目
LSIのはんだ
BGA実装
• 昨今では狭ピッチでのFBGA等
Pbフリーはんだの登場
• 融点が高い、一定でないといった性質
2014年7月12日 Kernel/VM北陸 25
BGAの不具合事例
加熱不足
はんだボール未融合
BGAパッケージ/プリント配線基板の反り
はんだボール表面の酸化膜
 フラックスの活性力低下
はんだ接合部剥離(ボール落ち)
2014年7月12日 Kernel/VM北陸 26
参考...
Pbフリーはんだの弱点
熱疲労に弱い
GPUの熱サイクルももちろんダメージとなる
機械的に弱い
鉛はんだに比べて硬いので
境界面でクラックが生じやすい性質
融点が一定でない
金属化合物を生成し、小さな歪みで破断する
2014年7月1...
熱サイクル試験
はんだの切断評価と解析
2014年7月12日 Kernel/VM北陸 28
参考文献10
Pbフリーのはんだの再溶融
リフローとは
BGAの実装で利用
• ①はんだ印刷
• ②部品実装
• ③加熱
• ④冷却
両面実装時には
フローも行う
再溶融問題
2014年7月12日 Kernel/VM北陸 29
参考文献11、12、13
多くの問題が
あるようです
2014年7月12日 Kernel/VM北陸 30
∧_∧
∧_∧ (´<_` ) ちょっとそのまとめ方雑じゃないか
( ´_ゝ`) / ⌒i
/ \ | |
/ / ̄ ̄ ̄ ̄/ |
__(__ニつ/ / .| .|_...
さて
2014年7月12日 Kernel/VM北陸 31
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 32
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 33
皆さんは知っていますね?
高温で動作するLSIの乗った不具合機
2014年7月12日 Kernel/VM北陸 34
YLoD
Yellow Light Of Death
電源ランプが点滅して動かなくなる
2006年にPS3が登場してまもなく颯爽☆登場
ユーザの対処
ヒートガンで炙る(そこそこ直る)
2014年7月12日 Kernel/VM北陸 35...
SONYの涙の対応
2014年7月12日 Kernel/VM北陸 36
参考文献16
2014年7月12日 Kernel/VM北陸 37
RROD
Red Ring of Death
ハードウェアのランプが赤く3つ点灯して起動せず
2005年に発売して多くの報告
(3台に1台は死んでる
海外での異例の保証延長
キチガイ療法
 towel trick
2014年7月12...
Towel Trick
熱暴走を誘発
こ れ は キ チ ガ イ
2014年7月12日 Kernel/VM北陸 39
このLSIの再生プロセスを仮定
関連事例共通の仮説
発熱の大きいLSIのはんだクラックの可能性
加熱処理により再溶融させはんだを再溶融し結合
2014年7月12日 Kernel/VM北陸 40
GPUも同じ症状で起きていると仮定
故障した...
2014年7月12日 Kernel/VM北陸 41
GPUの加熱実験
•実験の目的
故障したGPUを加熱することで
修理が可能なのか
•
対象となるGPU
– はんだクラックが起きていると思われるGPU
2014年7月12日 Kernel/VM北陸 42
加熱器具と加熱条件
●ヒートガン
●ドライヤー
●オーブン
●210℃
●3分
●30分
2014年7月12日 Kernel/VM北陸 43
加熱器具
●オーブンレンジ
– 同条件で加熱することが容易
– 均一にLSIを温められる
2014年7月12日 Kernel/VM北陸 44
加熱のさじ加減
●リフローのピーク温度
– 230℃以上
●Pbフリーはんだ融点
– 216℃〜220℃
この加熱実験では全てのはんだを
溶かしきりたいわけではない
2014年7月12日 Kernel/VM北陸 45
210℃ 3分
●これまでのレシピ
– はんだクラックだけを溶かすこと狙ってい
る
●ヒートスプレッダ付きGPU
– LSIの加熱の障害
– 210℃ 4分に設定
2014年7月12日 Kernel/VM北陸 46
負荷テスト
● 再生したGPU
– 本当に計算能力があるかわからない
– 負荷をかけると強制終了するかもしれない
● 負荷テストを実施
– ベンチマークソフトSandraや3DMarkを利用
...
2014年7月12日 Kernel/VM北陸 47
使用機材・加熱環境
●オーブン機能付き
電子レンジ
– National NE-N25
– 製造年1996年
– 1.40KW(電熱時)
2014年7月12日 Kernel/VM北陸 48
使用機材・加熱環境
● 温度計
– SEKISUI 室温
(-30℃ - 50℃)
自然冷却時計測
– EMPEX 室温
(-20℃ - 50℃)
ベンチマーク時計測
– GPU-Z GPU温...
2014年7月12日 Kernel/VM北陸 49
使用機材・負荷環境
● 使用したPC
CPU Core i7 2.8GHz
RAM 4GB
Storage 32GB SSD
• OS Windows7 64bit
● ディスプレイ
Disp...
2014年7月12日 Kernel/VM北陸 50
使用機材・ベンチマーク
● Sandra
– ライト版 2013.10.19.66
– グラフィックレンダリング テストを実施
● 3D Mark06
– BasicEdition 1.2.0...
2014年7月12日 Kernel/VM北陸 51
実験手順1
•実験対象となるGPUの
ヒートシンクやファンを取り外し
グリスを拭き取る
2014年7月12日 Kernel/VM北陸 52
実験手順2
•オーブン内を210℃まで余熱する
2014年7月12日 Kernel/VM北陸 53
実験手順3
•オーブンの天板にGPUを載せ
210℃で3分加熱する
2014年7月12日 Kernel/VM北陸 54
実験手順3
•オーブンの天板にGPUを載せ
210℃で3分加熱する
2014年7月12日 Kernel/VM北陸 55
実験手順4
•オーブンから取り出し自然冷却を行い
GPUを組み立て,PCに取り付ける
2014年7月12日 Kernel/VM北陸 56
実験手順5
•GPUの動作テストを行う
2014年7月12日 Kernel/VM北陸 57
実験手順6
•正常な画面描画が可能なGPUに対して
メーカのドライバをインストールし
ベンチマークで負荷をかける
2014年7月12日 Kernel/VM北陸 58
予備実験
●加熱実験のテスト
– 画面の映らなくなったRadeon 6850HD
●負荷テストのテスト
– 正常に動作するGeForce 9800GT
2014年7月12日 Kernel/VM北陸 59
加熱実験のテスト
• Radeon 6800HD
– 画面が出ないことを確認
210℃で3分加熱処理
2014年7月12日 Kernel/VM北陸 60
テストの結果
●画面の描画が再び行われた
– 正常に動作した
●再起動を行った後,症状が再現
– 画面は出力されなくなった
このGPUは再生しなかった
2014年7月12日 Kernel/VM北陸 61
負荷テストの結果
• GeForce 9800GT
● Sandra
– 浮動小数点スコア
225.63 (MPixel/s)
– ダブルシェーダDXスコア
33.12 (MPixel/s)
...
さて
2014年7月12日 Kernel/VM北陸 62
2014年7月12日 Kernel/VM北陸 63
実験素材の準備
●67台の故障したGPUを収集した
2014年7月12日 Kernel/VM北陸 64
加熱対象の選定
●67台のGPUで負荷テスト
– 加熱処理において修理可能なGPUを選別
●加熱処理の必要がないものを除去
– コンデンサや抵抗がは存しているGPU
– 正常にベンチマークを通...
2014年7月12日 Kernel/VM北陸 65
故障の症状で分別
2014年7月12日 Kernel/VM北陸 66
メーカ・機種別で分別
加熱実験を行う
2014年7月12日 Kernel/VM北陸 67
加熱実験しました
2014年7月12日 Kernel/VM北陸 68
症状別での実験結果
2014年7月12日 Kernel/VM北陸 69
メーカ・世代ごとでの結果
●NVIDIA
2014年7月12日 Kernel/VM北陸 70
メーカ・世代ごとでの結果
●AMD
2014年7月12日 Kernel/VM北陸 71
結果の考察
•41台のGPUをオーブンで加熱処理した
–変化があったものが16台
–このうち再生したものは8台
•再生可能性が高いGPU
–画面が描画があるものは可能性が高い
–世代が新しいG...
2014年7月12日 Kernel/VM北陸 72
まとめ
実験の目的
故障したGPUを加熱することで
修理が可能なのか
加熱処理による再生は有効だった
デモ
動画を何点か
つくもさんの完璧動作した(´・ω・`)
焼いた→ddddddddddddddd
焼いた→直った
2014年7月12日 Kernel/VM北陸 73
ベイカーの未来
ネットワーク?
• 今進化が熱い
メモリ?
• ホットストレージ、あるいみホット
ベイクドメモリーでいきます
2014年7月12日 Kernel/VM北陸 74
小話:そしてGPUベイカーへと…
RADEON HD6850との出会い
加熱処理を用いた故障GPUの再生実験
67台の故障GPUでの定量的評価
ベイクドGPU
デモで動画を何本か
ベイカーの未来
メモリ焼く!
2014年7月12...
1.オーブントースターのリフロー装置 --個人サイト
http://www.ne.jp/asahi/jh1htq/machida/kousaku/reflow/reflow.html
2.Twilog 2012年07月03日(火)
http:/...
2014年7月12日 Kernel/VM北陸 77
8.信頼性試験(コンデンサの劣化評価・寿命予測)Panasonic解析センター
http://www2.panasonic.co.jp/aec/reliability/electronic.h...
2014年7月12日 Kernel/VM北陸 78
15.Youtube検索 [PS3 YLoD fix ] 34,900件
https://www.youtube.com/results?search_query=PS3+YLoD++fix
...
Próxima SlideShare
Cargando en…5
×

ベイクドGPU Kernel/VM北陸1

13.116 visualizaciones

Publicado el

プレゼン冒頭のアニメーションより
「前回は@naota334 の声掛け事案により、
15分のLTに挑戦した、すし。
BeepなDTMを終え、一時の安息を享受していた

なんとなしにうpしたスライドをきっかけに、
@syuu1228の粋な計らいによって、
今回、この金沢で話すことになった。

45分枠。用意された「ベイクドGPU」というタイトル。
この(無茶な)期待にこたえるべく、
全ての知識とベイカーの未来を今語る…」

  • Inicia sesión para ver los comentarios

ベイクドGPU Kernel/VM北陸1

  1. 1. Today is special in mylife, and Kernel/VM .... 2014年7月12日 Kernel/VM北陸 1
  2. 2. @sushi514 Kernel/VM探検隊@北陸 12014年7月12日 Kernel/VM北陸 2
  3. 3. 小話:そしてGPUベイカーへと… RADEON HD6850との出会い 加熱処理を用いた故障GPUの再生実験 67台の故障GPUでの定量的評価 ベイクドGPU デモ ベイカーの未来 ネットワーク焼く?メモリ焼く? 2014年7月12日 Kernel/VM北陸 3
  4. 4. 事案発生 2012年7月3日 RADEON HD6850ちゃんが100℃超えて死ぬ ベンチが通らない ゲームもできない(´・ω・`) 焼いてみた ヒートガンでやる?オーブントースターでやる? 電子レンジのオーブン機能:210℃ 3分 2014年7月12日 Kernel/VM北陸 4 参考文献1
  5. 5. 2014年7月12日 Kernel/VM北陸 5 衝撃の展開 参考文献2
  6. 6. オーブンの効能 •焼く前 • 温度:100℃超 • 音 :騒音 • ベンチマーク: 保護回路働いて死 •ベイクド • 温度:70℃ • 音 :静音 • ベンチマーク FF XIV 3315 2014年7月12日 Kernel/VM北陸 6
  7. 7. 2014年7月12日 Kernel/VM北陸 7 ( ˘⊖˘) 。o(でもなんで
  8. 8. 2014年7月12日 Kernel/VM北陸 8 ( ˘⊖˘) 。o(でもなんで新しいGPUが 壊れるんだ… )
  9. 9. 2014年7月12日 Kernel/VM北陸 9 ( ˘⊖˘) 。o(でもなんで新しいGPUが 壊れるんだ… ) AF6850-1024D5S1の発売時期 2011年3月頃 (購入は2012年頭) 参考文献3
  10. 10. 2014年7月12日 Kernel/VM北陸 10 || ┗(☋` )┓三 ちょっと調べてみよう
  11. 11. 自らの修理歴を振り返る 2014年7月12日 Kernel/VM北陸 11
  12. 12. 故障の考察 2014年7月12日 Kernel/VM北陸 12
  13. 13. 尋常じゃないGPUたち 短期間で故障 負荷をかけると異常発熱して強制終了 ドライバがあたらない 故障原因の検討 冷却不足(対策するも効果なし) 各部品の故障なのか 2014年7月12日 Kernel/VM北陸 13 発売・購入から1年たっておらず 各部品に寿命がきたとは考えにくい
  14. 14. そしてGPUベイカーへと… 加熱処理が有効な修理方法なら 修理のノウハウがまたひとつ増える!✌('ω' 転売で一攫千金も夢じゃない!✌('ω'✌ )三✌('ω')✌三( ✌'ω')✌ GPU焼くのは楽しい よくわからないワクワク感と物理修理ガチャ感 2014年7月12日 Kernel/VM北陸 14
  15. 15. 加熱処理を用いた 故障したGPUの再生実験 理論編だったり実践編だったり。 2014年7月12日 Kernel/VM北陸 15
  16. 16. GPU モダンなお小遣い稼ぎアクセラレータ すごい 集積度の向上 • 年1.7倍 電力効率 • スパコン利用 コア数 • K40 コア2880個(トランジスタ数71億) すごいすごい… 2014年7月12日 Kernel/VM北陸 16 ( ´∀ `)<モナー 参考文献4,5,6,7
  17. 17. GPUの駆動時の温度 アイドル 40℃ 高負荷時 80℃や90℃に 2014年7月12日 Kernel/VM北陸 17 0 40 50 60 70 80 90 100 105 保護機能で強制停止 高負荷時 アイドル
  18. 18. 温度は寿命に直結します 2014年7月12日 Kernel/VM北陸 18
  19. 19. GPU上にある各パーツ 受動素子 抵抗,コイル,コンデンサ, VRM 能動素子 LSI,制御用IC コンデンサ よく死ぬ 2014年7月12日 Kernel/VM北陸 19 参考文献8
  20. 20. パーツの寿命 •寿命イメージ • コンデンサ • コイル • 抵抗 • VRM • DRAM • 制御用IC •コンデンサ • アルミニウム 電解コンデンサ (液体コンデンサ) • アルミ 固体電解コンデンサ (固体コンデンサ) 2014年7月12日 Kernel/VM北陸 20
  21. 21. アルミニウム電解コンデンサ 2014年7月12日 Kernel/VM北陸 21
  22. 22. アルミ固体電解コンデンサ 2014年7月12日 Kernel/VM北陸 22
  23. 23. コンデンサ比較 •設計寿命 • 85℃/2000時間 (85℃品) •設計寿命 • 105℃/2000時間 (105℃品) 2014年7月12日 Kernel/VM北陸 23
  24. 24. 実使用時間の設計 アレニウス則 使用温度が10℃下がるごとに寿命が2倍 例:85℃品のコンデンサ 85℃ 2000時間 ≒ 83日 75℃ 4000時間 ≒ 166日 65℃ 8000時間 ≒ 333日 105℃品で75℃でも16000時間、666日以上 • 1年以上の動作可能な設計 2014年7月12日 Kernel/VM北陸 24
  25. 25. はんだ面に着目 LSIのはんだ BGA実装 • 昨今では狭ピッチでのFBGA等 Pbフリーはんだの登場 • 融点が高い、一定でないといった性質 2014年7月12日 Kernel/VM北陸 25
  26. 26. BGAの不具合事例 加熱不足 はんだボール未融合 BGAパッケージ/プリント配線基板の反り はんだボール表面の酸化膜  フラックスの活性力低下 はんだ接合部剥離(ボール落ち) 2014年7月12日 Kernel/VM北陸 26 参考文献8
  27. 27. Pbフリーはんだの弱点 熱疲労に弱い GPUの熱サイクルももちろんダメージとなる 機械的に弱い 鉛はんだに比べて硬いので 境界面でクラックが生じやすい性質 融点が一定でない 金属化合物を生成し、小さな歪みで破断する 2014年7月12日 Kernel/VM北陸 27 参考文献9
  28. 28. 熱サイクル試験 はんだの切断評価と解析 2014年7月12日 Kernel/VM北陸 28 参考文献10
  29. 29. Pbフリーのはんだの再溶融 リフローとは BGAの実装で利用 • ①はんだ印刷 • ②部品実装 • ③加熱 • ④冷却 両面実装時には フローも行う 再溶融問題 2014年7月12日 Kernel/VM北陸 29 参考文献11、12、13
  30. 30. 多くの問題が あるようです 2014年7月12日 Kernel/VM北陸 30 ∧_∧ ∧_∧ (´<_` ) ちょっとそのまとめ方雑じゃないか ( ´_ゝ`) / ⌒i / \ | | / / ̄ ̄ ̄ ̄/ | __(__ニつ/ / .| .|____ \/____/ (u ⊃
  31. 31. さて 2014年7月12日 Kernel/VM北陸 31
  32. 32. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 32
  33. 33. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 33
  34. 34. 皆さんは知っていますね? 高温で動作するLSIの乗った不具合機 2014年7月12日 Kernel/VM北陸 34
  35. 35. YLoD Yellow Light Of Death 電源ランプが点滅して動かなくなる 2006年にPS3が登場してまもなく颯爽☆登場 ユーザの対処 ヒートガンで炙る(そこそこ直る) 2014年7月12日 Kernel/VM北陸 35 参考文献15
  36. 36. SONYの涙の対応 2014年7月12日 Kernel/VM北陸 36 参考文献16
  37. 37. 2014年7月12日 Kernel/VM北陸 37
  38. 38. RROD Red Ring of Death ハードウェアのランプが赤く3つ点灯して起動せず 2005年に発売して多くの報告 (3台に1台は死んでる 海外での異例の保証延長 キチガイ療法  towel trick 2014年7月12日 Kernel/VM北陸 38 参考文献17,18
  39. 39. Towel Trick 熱暴走を誘発 こ れ は キ チ ガ イ 2014年7月12日 Kernel/VM北陸 39
  40. 40. このLSIの再生プロセスを仮定 関連事例共通の仮説 発熱の大きいLSIのはんだクラックの可能性 加熱処理により再溶融させはんだを再溶融し結合 2014年7月12日 Kernel/VM北陸 40 GPUも同じ症状で起きていると仮定 故障したGPUは加熱処理により修理可能
  41. 41. 2014年7月12日 Kernel/VM北陸 41 GPUの加熱実験 •実験の目的 故障したGPUを加熱することで 修理が可能なのか • 対象となるGPU – はんだクラックが起きていると思われるGPU
  42. 42. 2014年7月12日 Kernel/VM北陸 42 加熱器具と加熱条件 ●ヒートガン ●ドライヤー ●オーブン ●210℃ ●3分 ●30分
  43. 43. 2014年7月12日 Kernel/VM北陸 43 加熱器具 ●オーブンレンジ – 同条件で加熱することが容易 – 均一にLSIを温められる
  44. 44. 2014年7月12日 Kernel/VM北陸 44 加熱のさじ加減 ●リフローのピーク温度 – 230℃以上 ●Pbフリーはんだ融点 – 216℃〜220℃ この加熱実験では全てのはんだを 溶かしきりたいわけではない
  45. 45. 2014年7月12日 Kernel/VM北陸 45 210℃ 3分 ●これまでのレシピ – はんだクラックだけを溶かすこと狙ってい る ●ヒートスプレッダ付きGPU – LSIの加熱の障害 – 210℃ 4分に設定
  46. 46. 2014年7月12日 Kernel/VM北陸 46 負荷テスト ● 再生したGPU – 本当に計算能力があるかわからない – 負荷をかけると強制終了するかもしれない ● 負荷テストを実施 – ベンチマークソフトSandraや3DMarkを利用 負荷テストをクリアして再生とみなす
  47. 47. 2014年7月12日 Kernel/VM北陸 47 使用機材・加熱環境 ●オーブン機能付き 電子レンジ – National NE-N25 – 製造年1996年 – 1.40KW(電熱時)
  48. 48. 2014年7月12日 Kernel/VM北陸 48 使用機材・加熱環境 ● 温度計 – SEKISUI 室温 (-30℃ - 50℃) 自然冷却時計測 – EMPEX 室温 (-20℃ - 50℃) ベンチマーク時計測 – GPU-Z GPU温度 ソフトウェア負荷テスト用
  49. 49. 2014年7月12日 Kernel/VM北陸 49 使用機材・負荷環境 ● 使用したPC CPU Core i7 2.8GHz RAM 4GB Storage 32GB SSD • OS Windows7 64bit ● ディスプレイ Display 1 (VGA) & IO-DATA 17inch SXGA(1280x1024) ● Display 2 (DVI) & IO-DATA 19inch WXGA+(1440x900)
  50. 50. 2014年7月12日 Kernel/VM北陸 50 使用機材・ベンチマーク ● Sandra – ライト版 2013.10.19.66 – グラフィックレンダリング テストを実施 ● 3D Mark06 – BasicEdition 1.2.0 – フルテストを実施(20分程度の計測) ● ディスプレイ Display 1 (VGA) & IO-DATA 17inch SXGA(1280x1024) Display 2 (DVI) & IO-DATA 19inch WXGA+(1440x900)
  51. 51. 2014年7月12日 Kernel/VM北陸 51 実験手順1 •実験対象となるGPUの ヒートシンクやファンを取り外し グリスを拭き取る
  52. 52. 2014年7月12日 Kernel/VM北陸 52 実験手順2 •オーブン内を210℃まで余熱する
  53. 53. 2014年7月12日 Kernel/VM北陸 53 実験手順3 •オーブンの天板にGPUを載せ 210℃で3分加熱する
  54. 54. 2014年7月12日 Kernel/VM北陸 54 実験手順3 •オーブンの天板にGPUを載せ 210℃で3分加熱する
  55. 55. 2014年7月12日 Kernel/VM北陸 55 実験手順4 •オーブンから取り出し自然冷却を行い GPUを組み立て,PCに取り付ける
  56. 56. 2014年7月12日 Kernel/VM北陸 56 実験手順5 •GPUの動作テストを行う
  57. 57. 2014年7月12日 Kernel/VM北陸 57 実験手順6 •正常な画面描画が可能なGPUに対して メーカのドライバをインストールし ベンチマークで負荷をかける
  58. 58. 2014年7月12日 Kernel/VM北陸 58 予備実験 ●加熱実験のテスト – 画面の映らなくなったRadeon 6850HD ●負荷テストのテスト – 正常に動作するGeForce 9800GT
  59. 59. 2014年7月12日 Kernel/VM北陸 59 加熱実験のテスト • Radeon 6800HD – 画面が出ないことを確認 210℃で3分加熱処理
  60. 60. 2014年7月12日 Kernel/VM北陸 60 テストの結果 ●画面の描画が再び行われた – 正常に動作した ●再起動を行った後,症状が再現 – 画面は出力されなくなった このGPUは再生しなかった
  61. 61. 2014年7月12日 Kernel/VM北陸 61 負荷テストの結果 • GeForce 9800GT ● Sandra – 浮動小数点スコア 225.63 (MPixel/s) – ダブルシェーダDXスコア 33.12 (MPixel/s) ● 3DMarkスコア – 10826
  62. 62. さて 2014年7月12日 Kernel/VM北陸 62
  63. 63. 2014年7月12日 Kernel/VM北陸 63 実験素材の準備 ●67台の故障したGPUを収集した
  64. 64. 2014年7月12日 Kernel/VM北陸 64 加熱対象の選定 ●67台のGPUで負荷テスト – 加熱処理において修理可能なGPUを選別 ●加熱処理の必要がないものを除去 – コンデンサや抵抗がは存しているGPU – 正常にベンチマークを通過したGPU 41台の修理可能なGPUを選別 28台が該当
  65. 65. 2014年7月12日 Kernel/VM北陸 65 故障の症状で分別
  66. 66. 2014年7月12日 Kernel/VM北陸 66 メーカ・機種別で分別 加熱実験を行う
  67. 67. 2014年7月12日 Kernel/VM北陸 67 加熱実験しました
  68. 68. 2014年7月12日 Kernel/VM北陸 68 症状別での実験結果
  69. 69. 2014年7月12日 Kernel/VM北陸 69 メーカ・世代ごとでの結果 ●NVIDIA
  70. 70. 2014年7月12日 Kernel/VM北陸 70 メーカ・世代ごとでの結果 ●AMD
  71. 71. 2014年7月12日 Kernel/VM北陸 71 結果の考察 •41台のGPUをオーブンで加熱処理した –変化があったものが16台 –このうち再生したものは8台 •再生可能性が高いGPU –画面が描画があるものは可能性が高い –世代が新しいGPUほど効果が高い 加熱処理による再生は有効だった
  72. 72. 2014年7月12日 Kernel/VM北陸 72 まとめ 実験の目的 故障したGPUを加熱することで 修理が可能なのか 加熱処理による再生は有効だった
  73. 73. デモ 動画を何点か つくもさんの完璧動作した(´・ω・`) 焼いた→ddddddddddddddd 焼いた→直った 2014年7月12日 Kernel/VM北陸 73
  74. 74. ベイカーの未来 ネットワーク? • 今進化が熱い メモリ? • ホットストレージ、あるいみホット ベイクドメモリーでいきます 2014年7月12日 Kernel/VM北陸 74
  75. 75. 小話:そしてGPUベイカーへと… RADEON HD6850との出会い 加熱処理を用いた故障GPUの再生実験 67台の故障GPUでの定量的評価 ベイクドGPU デモで動画を何本か ベイカーの未来 メモリ焼く! 2014年7月12日 Kernel/VM北陸 75
  76. 76. 1.オーブントースターのリフロー装置 --個人サイト http://www.ne.jp/asahi/jh1htq/machida/kousaku/reflow/reflow.html 2.Twilog 2012年07月03日(火) http://twilog.org/sushi514/date-120703 3.AFOX「AF6850-1024D5S1」補助電源コネクタなしの 1スロ版「Radeon HD 6850」が発売 – @asciijpeditors http://ascii.jp/elem/000/000/595/595317/ 4.Monacoin http://monacoin.org/ja/ 5.GPU technology trends and future requirements J.Y. Chen “GPU Technology Trends and Future Requirements,” Proc. International Electron Devices Meeting, Dec. 2009. 6.The Green500 List - June 2014 http://www.green500.org/lists/green201406 7.■後藤弘茂のWeekly海外ニュース■NVIDIAが世界最多トランジスタ数のチップ 「GK110」を公開 http://pc.watch.impress.co.jp/docs/column/kaigai/20120517_533500.html 2014年7月12日 Kernel/VM北陸 76
  77. 77. 2014年7月12日 Kernel/VM北陸 77 8.信頼性試験(コンデンサの劣化評価・寿命予測)Panasonic解析センター http://www2.panasonic.co.jp/aec/reliability/electronic.html 9.西村一弘, 茂木正徳, 酒井秀久, 川瀬佳子, 作山誠樹, 今村和之, 森宗克文. 鉛フリーはんだbga 寿命解析(5. 材料設計)(<特集> エレクトロニクス実装のためのシミュレーション技術). エレクトロニクス実装学会誌, Vol. 4, No. 5, pp. 416-420, aug 2001. 10.荘司郁夫, 森史成, 藤内伸一, 山下勝. 熱サイクル負荷を受けるSn-ag 系pb フリーはんだ接合部の破断寿命評価. エレクトロニクス実装学会誌, Vol. 4, No. 4, pp. 289-292, jul 2001. 11.3.3.1 温度プロファイルの考え方 ルネサス http://japan.renesas.com/products/package/manual/3/3_3/3_3_1/index.jsp 12.信頼性評価試験 尼崎事業所 日鉄住金テクノロジー株式会社 http://www.nsst.nssmc.com/research_support/shinrai_handa.html 13.高橋浩之, 廣畑賢治, 久野勝美, 川上崇, 小澤直行, 笹原邦彦. リフロー・フロー混載実装における鉛フリーはんだ接合部のはく離強度評価. エレクトロニクス実装学会誌, Vol. 8, No. 4, pp.301-307, jul 2005.
  78. 78. 2014年7月12日 Kernel/VM北陸 78 15.Youtube検索 [PS3 YLoD fix ] 34,900件 https://www.youtube.com/results?search_query=PS3+YLoD++fix 16.PlayStation®製品をご愛用のお客様へご使用上の注意のお知らせ http://www.jp.playstation.com/info/support/nr_20121222_ps.html 17.2007年7月5日 Microsoft 公式ティザ XBOX360について http://www.microsoft.com/en-us/news/press/2007/jul07/07-05warrantyextentionpr.aspx 18.Youtube検索 [xbox360 towel trick] 16,200件 https://www.youtube.com/results?search_query=xbox360+towel+trick 19.加熱処理を用いた故障したGPUの再生実験

×