Hadoop Troubleshooting 101 - Japanese Version

Hadoop Troubleshooting 101(日本語版)
嶋内翔, Cloudera

Hadoop クラスタを壊す

7つの設定ミス

Agenda
• チケット分析
• 設定ミスとは?
• メモリの管理ミス
• TT OOME
• JT OOME
• Native Threads
• スレッドの管理ミス
• Fetch Failures
• Replicas
• ディスクの管理ミス
• No File
• Too Many Files
• Cloudera Manager

チケット分析

• 設定ミスそれ自体が原因のチケットは2%以下
– 一般的なソフトウェアではこうした単純なミスが大半を占める

• 最初に報告される症状 ≠ 根本原因

• 設定が間違ってるかどうかはログを少し調べただけではわ
からない

チケットをコンポーネント別に分類

設定ミスとは?

• Hadoop あるいは OS の設定ファイルの変更を必要とする
あらゆるチケットのこと

• 35% のチケットが該当

• リソース割り当て: メモリ, ファイルディスクリプタ, ディ
スク領域

チケットを原因別に分類

なぜ設定ミスを気にする
必要があるのか？

リソースを過剰要求する
MR/HBase クラスタの一生は
卑劣で、残酷で、短いものになる。
(トマス・ホッブズ先生すいません)

訳参考: http://cruel.org/econthought/profiles/hobbes.html

MR ヒープの過剰要求はswapを引き起こす。

swap により RegionServer はタイムアウトし、そして死ぬ。

RegionServer が死んだことで MR タスクが失敗し、
その結果 MR ジョブが死ぬ

犯人は誰?

HBase 死亡の原因は
MR の設定ミスだった

オリジナルスライドの発表者

• Kate Ting
o Customer Operations Engineer, Cloudera
o 9 ヶ月で100以上のHadoopクラスタのトラブルシュー
ティングに携わってきた
o kate@cloudera.com

• Ariel Rabkin
o Customer Operations Tools Team, Cloudera(インター
ン)
o UC Berkeley CS PhD 候補生
o 設定バグの診断に関する論文
o asrabkin@eecs.berkeley.edu

自己紹介

• Sho Shimauchi(嶋内翔)
o Cloudera カスタマーオペレーションズエンジニア
o 主に日本のユーザを中心にサポートを提供している
o sho@cloudera.com
o twitter: @shiumachi

1. Task Out Of Memory Error

FATAL org.apache.hadoop.mapred.TaskTracker:
Error running child : java.lang.OutOfMemoryError: Java heap space
at
org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask
.java:781)
at
org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:350
)
at org.apache.hadoop.mapred.MapTask.run(MapTask.java:307)
at org.apache.hadoop.mapred.Child.main(Child.java:170)

1. Task Out Of Memory Error
• どういう意味?
o タスクのコード内でメモリリークが発生している
• 何が原因?
o MR タスクのヒープサイズが合わない
• どうすれば解決できる?
o io.sort.mb < mapred.child.java.opts となるように設定
o 例 io.sort.mb を 512M にしたら mapred.child.java.opts は 1G にする
 io.sort.mb = map バッファのサイズ
 バッファが小さくなる => ディスクへの書き出しが多くな
る
o mapper と reducer を減らす
 mapper = ノード上のコア数
 HBase を使っていない場合
 ディスク数とコア数が同じ場合
 mapper:reducer 比は 4:3

(Mappers + Reducers)*
Child Task Heap
+
DN heap
+
Total RAM TT heap
+
3GB
+
RS heap
+
Other Services' heap

RS: Region Server

2. JobTracker Out of Memory Error
ERROR org.apache.hadoop.mapred.JobTracker: Job initialization failed:
java.lang.OutOfMemoryError: Java heap space
at org.apache.hadoop.mapred.TaskInProgress.<init>(TaskInProgress.java:122)
at org.apache.hadoop.mapred.JobInProgress.initTasks(JobInProgress.java:653)
at org.apache.hadoop.mapred.JobTracker.initJob(JobTracker.java:3965)
at
org.apache.hadoop.mapred.EagerTaskInitializationListener$InitJob.run(EagerTaskIniti
alizationListener.java:79)
at
java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:8
86)
at
java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:908)
at java.lang.Thread.run(Thread.java:662)


o JT のメモリ使用量の合計 > 割り当て RAM

• 何が原因?
o タスクが小さすぎ
o job ヒストリが多すぎ


o サマリーの出力によって確認可能
o sudo -u mapred jmap -J-d64 -histo:live <PID of JT>
o JT のヒープ領域を増やす
o JT と NN のノードを分ける
o mapred.jobtracker.completeuserjobs.maximum を 5 に
減らす
 JT はメモリをより頻繁にクリンナップするようにな
り、必要な RAM が減る

3. Unable to Create New Native Thread

ERROR mapred.JvmManager: Caught Throwable in JVMRunner. Aborting
TaskTracker.
java.lang.OutOfMemoryError: unable to create new native thread
at java.lang.Thread.start0(Native Method)
at java.lang.Thread.start(Thread.java:640)
at org.apache.hadoop.util.Shell.runCommand(Shell.java:234)
at org.apache.hadoop.util.Shell.run(Shell.java:182)
at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:375)
at
org.apache.hadoop.mapred.DefaultTaskController.launchTask(DefaultTaskController.j
ava:127)
at
org.apache.hadoop.mapred.JvmManager$JvmManagerForType$JvmRunner.runChild
(JvmManager.java:472)
at
org.apache.hadoop.mapred.JvmManager$JvmManagerForType$JvmRunner.run(Jvm
Manager.java:446)

3. Unable to Create New Native Thread
o プロセスが起動中にもかかわらず DN が障害ノードと
して表示されている
• 何が原因?
o nproc のデフォルト値は低すぎ
o /etc/security/limits.conf を修正する
 hbase soft/hard nproc 50000
 hdfs soft/hard nproc 50000
 mapred soft/hard nproc 50000
o その後 DN,TT,JT,NN を再起動

4. Too Many Fetch-Failures

INFO org.apache.hadoop.mapred.JobInProgress: Too many
fetch-failures for output of task:


o Reducer の fetch 操作が mapper 出力の取得に失敗して
いる
o Too many fetch failures は特定の TT( = ブラックリスト
入りの TT) で発生する

• 何が原因?
o DNS の問題
o mapper 側に十分な reducer 用 http スレッドがない
o JVM のバグ

o mapred.reduce.slowstart.completed.maps = 0.80
 大きいジョブがたくさんの reducer を wait 状態にし続けない
ようにする
o tasktracker.http.threads = 80
 map 出力を reducer に供給するために TT に使用されるス
レッド数を大きくする
o mapred.reduce.parallel.copies = SQRT(ノード数) して一の位を
切り下げ(例: 500ノード→20, 1000ノード→30)
 map 出力を取得するために reducer に使用される並列コピー
の数を指定する
o Jetty 6.1.26 は fetch failure を起こしやすいので使わない
o CDH3u2 に上げましょう (MAPREDUCE-2980)
o CDH3u3 では jetty バグの自動検知も可能に(MAPREDUCE-3184)

5. Not Able to Place Enough Replicas

WARN org.apache.hadoop.hdfs.server.namenode.FSNamesystem: Not
able to place enough replicas


o NN が一部の DN を選択できない

• 何が原因?
o dfs のレプリケーション数 > 利用可能な DN の数
o ディスク領域不足による利用可能 DN 数の不足
o mapred.submit.replication のデフォルト値は 10 と高すぎ
o NN がブロック設置ポリシーを満たすことができない
o もしラック数が2より多い場合、ブロックは少なくとも2つの
ラック上に存在していなければならない
o DN がデコミッション中
o DN に高い負荷がかかっている
o ブロックサイズが不必要に大きい
o 十分な xciever スレッドがない
 DN が扱えるスレッド数はデフォルト 256 でとても低い
 パラメータのスペルミスに注意

o dfs.datanode.max.xcievers = 4096 として、DN を再起
動する
o ダウンしてるノードやラックを探す
o ディスク領域を確認する
o log ディレクトリが容量を食っているか、暴走した
タスクがディスクの空きを埋めてるかもしれない
o リバランスしましょう

6. No Such File or Directory

ERROR org.apache.hadoop.mapred.TaskTracker: Can not start task tracker because
ENOENT: No such file or directory
at org.apache.hadoop.io.nativeio.NativeIO.chmod(Native Method)
at
org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:
496)
at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:319)
at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:189)
at org.apache.hadoop.mapred.TaskTracker.initializeDirectories(TaskTracker.java:666)
at org.apache.hadoop.mapred.TaskTracker.initialize(TaskTracker.java:734)
at org.apache.hadoop.mapred.TaskTracker.<init>(TaskTracker.java:1431)
at org.apache.hadoop.mapred.TaskTracker.main(TaskTracker.java:3521)

ストレージ総計

DFS 領域
MR 領域

6. No Such File or Directory
o TT を開始できなかったかジョブが失敗している
• 何が原因?
o TTのディスク領域が埋まっている
o TT が書き込むディレクトリのパーミッション
 dfs.datanode.du.reserved をディスク総量の10%にする
 ジョブがロギングするディレクトリの容量の確保
 userlogs と mapred.local.dirは、パーミッションを
755、オーナーを mapred に設定すること

7. Too Many Open Files

ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: DatanodeRegistration(<ip
address>:50010, storageID=<storage id>, infoPort=50075, ipcPort=50020):DataXceiver
java.io.IOException: Too many open files
at sun.nio.ch.IOUtil.initPipe(Native Method)
at sun.nio.ch.EPollSelectorImpl.<init>(EPollSelectorImpl.java:49)
at sun.nio.ch.EPollSelectorProvider.openSelector(EPollSelectorProvider.java:18)
at org.apache.hadoop.net.SocketIOWithTimeout$SelectorPool.get(SocketIOWithTimeout.java:407)
at org.apache.hadoop.net.SocketIOWithTimeout$SelectorPool.select(SocketIOWithTimeout.java:322)
at org.apache.hadoop.net.SocketIOWithTimeout.doIO(SocketIOWithTimeout.java:157)
at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:155)
at org.apache.hadoop.net.SocketInputStream.read(SocketInputStream.java:128)
at java.io.BufferedInputStream.fill(BufferedInputStream.java:218)
at java.io.BufferedInputStream.read(BufferedInputStream.java:237)
at java.io.DataInputStream.readShort(DataInputStream.java:295)
at org.apache.hadoop.hdfs.server.datanode.DataXceiver.run(DataXceiver.java:97)

7. Too Many Open Files
o Hadoop を実行しているユーザアカウントが、開いて
いるファイルディスクリプタ数の制限にひっかかって
いる
• 何が原因?
o nofile のデフォルト値は 1024 ファイルで低すぎ
o /etc/security/limits.conf を修正する
 hdfs - nofile 32768
 mapred - nofile 32768
 hbase - nofile 32768
o その後 DN, TT, JT, NN を再起動

さらに詳しい情報はこちら
• Avoiding Common Hadoop Administration Issues:
http://www.cloudera.com/blog/2010/08/avoiding-common-hadoop-
administration-issues/

• Tips for Improving MapReduce Performance:
http://www.cloudera.com/blog/2009/12/7-tips-for-improving-
mapreduce-performance/

• Basic Hardware Recommendations:
http://www.cloudera.com/blog/2010/03/clouderas-support-team-
shares-some-basic-hardware-recommendations/

• Cloudera Knowledge Base: (注: Cloudera のお客様のみ閲覧可能)
http://ccp.cloudera.com/display/KB/Knowledge+Base

謝辞

Adam Warrington
Amr Awadallah
Angus Klein
Brock Noland
Clint Heath
Eric Sammer
Esteban Gutierrez
Jeff Bean
Joey Echeverria
Laura Gonzalez
Linden Hillenbrand
Omer Trajman
Patrick Angeles
Kate Ting
Ariel Rabkin
日本語版
Harsh Chouraria
Taka Tazawa
Tatsuo Kawasaki

今日の教訓

• 設定はあなたの責任、バグはコミュニ
ティの責任

• 設定ミスは診断を困難にします

• 最初は Cloudera Manager を使って正し
く理解しましょう

Hadoop Troubleshooting 101 - Japanese Version

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Destacado

Destacado (6)

Similar a Hadoop Troubleshooting 101 - Japanese Version

Similar a Hadoop Troubleshooting 101 - Japanese Version (20)

Más de Cloudera, Inc.

Más de Cloudera, Inc. (20)

Último

Último (8)

Hadoop Troubleshooting 101 - Japanese Version

Notas del editor