SlideShare una empresa de Scribd logo
1 de 34
Descargar para leer sin conexión
NamenodeHA導入背景と運用状況
株式会社サイバーエージェント
アメーバ事業部 インフラシステムグループ
上原 誠
2
株式会社サイバーエージェント
自己紹介
・ ~2012年2月 某SIerでインフラ周りに従事
・ 2012年3月 サイバーエージェント入社
- Amebaスマフォプラットフォームの構築
- 統合ログ解析基盤やオンラインデータベースの
インフラミドルウェア部分を担当
- Hadoop、HBase、Flume
・ 上原 誠 (@pioho07)
【名前】
【経歴】
Facebook申請歓迎
xxxxxxxx
3
株式会社サイバーエージェント
4
株式会社サイバーエージェント
5
株式会社サイバーエージェント株式会社サイバーエージェント
スマートフォンサービス
6
株式会社サイバーエージェント株式会社サイバーエージェント
・ NamenodeHA運用状況 について
本日の内容
・ NamenodeHA導入背景 について
7
株式会社サイバーエージェント株式会社サイバーエージェント株式会社サイバーエージェント
・ NamenodeHA運用状況 について
・ NamenodeHA導入背景 について
8
AmebaではHadoopを
どう使ってきたか
9
Hadoop in Ameba
・ 2007年~ アメブロアクセス解析
- Hadoop0.13.1
- MapReduce,HDFS
・ 2009年~ Ameba Pigg
- ログ集約サーバ(HDFS)
・ 2010年~ Patriot(ログ解析基盤システム名)
- Amebaサービス全体のログ集約解析基盤
- CDH3系
- Hive
・ 2012年~ Hornet
- オンライン用途でのグラフデータ構造を扱うデータストア
- CDH3系
- HBase
・ 2013年~ ミニグラフHbase,レコメンドHBase
-オンライン用途でコミュニティアプリのデータを扱うDB
-CDH4系
-HBase
HadoopConferenceJapanキッカケ
10
NamenodeHAの必要性
11
Hadoop in Ameba
・ 2007年~ アメブロアクセス解析
- Hadoop0.13.1
- MapReduce,HDFS
・ 2009年~ Ameba Pigg
- ログ集約サーバ(HDFS)
・ 2010年~ Patriot(ログ解析基盤システム名)
- Amebaサービス全体のログ集約解析基盤
- CDH3系
- Hive
・ 2012年~ Hornet
- オンライン用途でのグラフデータ構造を扱うデータストア
- CDH3系
- HBase
・ 2013年~ ミニグラフHbase,レコメンドHBase
-オンライン用途でコミュニティアプリのデータを扱うDB
-CDH4系
-HBase
この時期までは、NameNodeに障害があっても起動し直せば
まぁいっかと割り切っていた。サービス的にも影響少なかった
12
Hadoop in Ameba
・ 2007年~ アメブロアクセス解析
- Hadoop0.13.1
- MapReduce,HDFS
・ 2009年~ Ameba Pigg
- ログ集約サーバ(HDFS)
・ 2010年~ Patriot(ログ解析基盤システム名)
- Amebaサービス全体のログ集約解析基盤
- CDH3系
- Hive
・ 2012年~ Hornet
- オンライン用途でのグラフデータ構造を扱うデータストア
- CDH3系
- HBase
・ 2013年~ミニグラフHbase,レコメンドHBase
-オンライン用途でコミュニティアプリのデータを扱うDB
-CDH4系
-HBase
この時期からはオンライン用途になり、
落ちたらダメよと言われた
13
株式会社サイバーエージェント
長い間、NamenodeはSPOF(SinglePointOfFailure)
だった。
※図はHadoopのよくある構成
Slave01
DataNode
HReagionServer
TaskTracker
Master01 Master03Master02
Secondary
Namenode
Zookeeper
HMaster
JobTracker
HMaster
マスター達 スレーブ達
Hadoopシステム
ZookeeperZookeeper
NameNode
こいつ
14
株式会社サイバーエージェント
HDFS
NameNodeに障害があるとどうなるの・・??
Hadoopシステム
OS
物理
Other
MapReduce HBase Zookeeper Other
ミドルウェア
NameNode
15
株式会社サイバーエージェント
HDFS
みんな死ぬ(((゚Д゚)))ガクブル ※(エコシステム達が)
HDFSが機能しなくなり、その上に乗っている各エコシス
テムのMapReduceとかHBaseとか機能しなくなる
Hadoopシステム
OS
物理
Other
MapReduce HBase Zookeeper Other
ミドルウェア
NameNode
16
どうにかしなくては
NamenodeのHA機能があれば・・(HAなかった時)
17
冗長性の検討しました
・OSS(Heartbeat,Pacemaker,ORDBやkemari)を駆使する。
・ハードウェアFT(Fault Tolerance)サーバを使う
18
冗長性の検討しました。
・OSS(Heartbeat,Pacemaker,ORDBやkemari)を駆使する。
・StratusのハードウェアFT(FaultTrerance)サーバを使う
19
OSS(Heartbeat,Pacemaker,ORDBやkemari)を駆使する
メリット
-これが一般的に多い事例だった。
-OSS自体は実績十分
デメリット
-複雑になりがちで、よほどちゃんと設計試験をしないといざという時にスプリット
ブレインで死ねる。。
-入社当時一人で全部やらなければいけない上にリリース時間も限られていたの
で断念。。
20
冗長性の検討しました。
・OSS(Heartbeat,Pacemaker,ORDBやkemari)を駆使する。
・ハードウェアFT(FaultTrerance)サーバを使う
21
FTサーバを使う
メリット
-ハードウェアのレベルでの冗長性なので安心。
-メモリ情報もロストしない。当初メタデータが数十ギガの想定だったので起動しな
おしだとメモリに乗せるだけで時間かかる
デメリット
-高い
-メンテが打てない
-高い(2回目)
22
NamenodeHA出た!ので検証・導入しました
・CDH4.0.0を検証。待望のHA機能だった。
-CDH4.0.0はHA構成にするためにNFSが必須だった
-導入は見送った
・CDH4.1.0を検証・導入
-CDH4.1.0以降はNFS不要
NFSの代わりにQuorumJournalManagerを使う
-CDH4.1.0リリース後1ヶ月以内に「えいやー」で導入した
※個人的には4.1.0からがHA対応したCDHと思ってる
23
NamenodeHA出た!ので検証・導入しました
仕組みや考え方は一般的なクラスタソフトと同様
設定パラメータはそんなに多くない
スプリットブレイン試験は入念に
24
検証結果は?
25
株式会社サイバーエージェント株式会社サイバーエージェント
障害試験 概ね良好
Master01
NN
Master02
ZK ZK
HM
ZKFC ZKFC
JN JN
NN
・NN01 プロセスダウン時
ZKFCが障害を検知しNN02をアクティブへ移行
HDFS、HBaseへの書き込み続けたがともに問題なし
active
・はまったとこ
フェンシングの方法は2種類ありsshfenceのみの設定だと
リトライを繰り返して切り替わらない。Gracefulfencing
のタイムアウトがconf上にはなく20sでハードコーディン
グされてるなど
この辺↓
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence
shell(true)</value>
</property>
26
株式会社サイバーエージェント
運用オペレーション
・フェイルオーバ
hdfs haadmin -failover <serviceID>
・状態確認
hdfs haadmin -getServiceState <serviceId>
activeとかstandbyとか返ってくるだけ
シンプル
27
構成どうなったの?
28
株式会社サイバーエージェント
HA導入前
Slave01
DataNode
HReagionServer
TaskTracker
Master01 Master03Master02
Secondary
Namenode
ZookeeperK
HMaster
JobTracker
HMaster
マスター達 スレーブ達
Hadoopシステム
ZookeeperKZookeeperK
NameNode
29
株式会社サイバーエージェント
HA導入後
Slave01
DataNode
HReagionServer
TaskTracker
Master01 Master03Master02
Standby
Namenode
Zookeeper
HMaster
JobTracker
HMaster
マスター達 スレーブ達
Hadoopシステム
ZookeeperZookeeper
NameNode
JournalNode JournalNode JournalNode
ZKFC ZKFC
30
株式会社サイバーエージェント株式会社サイバーエージェント株式会社サイバーエージェント
・ NamenodeHA運用状況 について
・ NamenodeHA導入背景 について
31
運用しててどうか?
特にHA構成にしたことによるトラブルは発生していない
JournalNode,ZKFC固有の問題も今のところない
32
障害は起きたか?
・Namenode自体の通信量が多くなることはないが、ネットワークなので他の通
信の影響を受けてしまい、ZKFCとZookeeperの通信が20s途絶えてタイムアウ
トしてしまい、Namenodeのフェイルオーバが発生した。
ただこれはHAとしては正常に機能した事例となる。
部分的なNWトラフィックの高騰により、
Namenodeがフェイルオーバした。
33
結局HAどうなの??
株式会社サイバーエージェント
Cloudera嶋内さんの資料にもある通り、HAなしでもNamenode自体の障害発生率
は低いようです。
ただ、検証した結果や計画メンテ(これ大きい)できる点含めると、導入メリットは大
きいです。というか今後はマストと思ってます。
既存システムについても、随時バージョンアップのタイミングでHA構成へ移行してい
ます。
34
株式会社サイバーエージェント
ご清聴ありがとうございました!

Más contenido relacionado

La actualidad más candente

検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
Yahoo!デベロッパーネットワーク
 

La actualidad más candente (20)

Yahoo! JAPAN の Ambari 活用事例 #yjdsnight
Yahoo! JAPAN の Ambari 活用事例 #yjdsnightYahoo! JAPAN の Ambari 活用事例 #yjdsnight
Yahoo! JAPAN の Ambari 活用事例 #yjdsnight
 
ヤフー発のメッセージキュー「Pulsar」のご紹介
ヤフー発のメッセージキュー「Pulsar」のご紹介ヤフー発のメッセージキュー「Pulsar」のご紹介
ヤフー発のメッセージキュー「Pulsar」のご紹介
 
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016Yahoo! JAPANのデータ基盤とHadoop #dbts2016
Yahoo! JAPANのデータ基盤とHadoop #dbts2016
 
Yahoo! JAPAN の Ambari 活用事例 #ambarimeetup
Yahoo! JAPAN の Ambari 活用事例 #ambarimeetupYahoo! JAPAN の Ambari 活用事例 #ambarimeetup
Yahoo! JAPAN の Ambari 活用事例 #ambarimeetup
 
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjpYahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
Yahoo! JAPANにおけるオンライン機械学習実例 #streamctjp
 
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
検索クエリの時間差を可視化することでわかる人の行動パターン #yjdsnight
 
Lunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL ServicesLunch & Learn, AWS NoSQL Services
Lunch & Learn, AWS NoSQL Services
 
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
実はDatabase cloudだけで実現できる巷で噂の機械学習とは?
 
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~データ活用をもっともっと円滑に!~データ処理・分析基盤編を少しだけ~
データ活用をもっともっと円滑に! ~データ処理・分析基盤編を少しだけ~
 
State of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreadingState of the art Stream Processing #hadoopreading
State of the art Stream Processing #hadoopreading
 
Apache NiFi の紹介 #streamctjp
Apache NiFi の紹介  #streamctjpApache NiFi の紹介  #streamctjp
Apache NiFi の紹介 #streamctjp
 
db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也db tech showcase2019 オープニングセッション @ 石川 雅也
db tech showcase2019 オープニングセッション @ 石川 雅也
 
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
データドリブン企業におけるHadoop基盤とETL -niconicoでの実践例-
 
マルチビッグデータの活用を支える DWHの作り方
マルチビッグデータの活用を支える DWHの作り方マルチビッグデータの活用を支える DWHの作り方
マルチビッグデータの活用を支える DWHの作り方
 
Jjug ccc
Jjug cccJjug ccc
Jjug ccc
 
dbtech showcase 2016 Delphix講演資料
dbtech showcase 2016 Delphix講演資料dbtech showcase 2016 Delphix講演資料
dbtech showcase 2016 Delphix講演資料
 
db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉 db tech showcase2019オープニングセッション @ 森田 俊哉
db tech showcase2019オープニングセッション @ 森田 俊哉
 
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイントApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
ApacheSparkを中心としたOSSビッグデータ活用と導入時の検討ポイント
 
「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4「Data Infrastructure at Scale 」#yjdsw4
「Data Infrastructure at Scale 」#yjdsw4
 
BigDataUnivercity 2017年改めてApache Sparkとデータサイエンスの関係についてのまとめ
BigDataUnivercity 2017年改めてApache Sparkとデータサイエンスの関係についてのまとめBigDataUnivercity 2017年改めてApache Sparkとデータサイエンスの関係についてのまとめ
BigDataUnivercity 2017年改めてApache Sparkとデータサイエンスの関係についてのまとめ
 

Destacado

Destacado (11)

HDFSネームノードのHAについて #hcj13w
HDFSネームノードのHAについて #hcj13wHDFSネームノードのHAについて #hcj13w
HDFSネームノードのHAについて #hcj13w
 
ベンチマーク勉強会#01
ベンチマーク勉強会#01ベンチマーク勉強会#01
ベンチマーク勉強会#01
 
HDFS HA セミナー #hadoop
HDFS HA セミナー #hadoopHDFS HA セミナー #hadoop
HDFS HA セミナー #hadoop
 
Hadoop Operations #cwt2013
Hadoop Operations #cwt2013Hadoop Operations #cwt2013
Hadoop Operations #cwt2013
 
Aws st 20130617-auto_scaling
Aws st 20130617-auto_scalingAws st 20130617-auto_scaling
Aws st 20130617-auto_scaling
 
YAPC::Asia2014 - O2O/IoT/Wearable時代におけるWeb以外のネットワーク技術入門
YAPC::Asia2014 - O2O/IoT/Wearable時代におけるWeb以外のネットワーク技術入門YAPC::Asia2014 - O2O/IoT/Wearable時代におけるWeb以外のネットワーク技術入門
YAPC::Asia2014 - O2O/IoT/Wearable時代におけるWeb以外のネットワーク技術入門
 
Aerospike Rapid Rebalance
Aerospike Rapid Rebalance Aerospike Rapid Rebalance
Aerospike Rapid Rebalance
 
(SDD415) NEW LAUNCH: Amazon Aurora: Amazon’s New Relational Database Engine |...
(SDD415) NEW LAUNCH: Amazon Aurora: Amazon’s New Relational Database Engine |...(SDD415) NEW LAUNCH: Amazon Aurora: Amazon’s New Relational Database Engine |...
(SDD415) NEW LAUNCH: Amazon Aurora: Amazon’s New Relational Database Engine |...
 
AWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMRAWS Black Belt Online Seminar 2016 Amazon EMR
AWS Black Belt Online Seminar 2016 Amazon EMR
 
AWS Black Belt Online Seminar Amazon Aurora
AWS Black Belt Online Seminar Amazon AuroraAWS Black Belt Online Seminar Amazon Aurora
AWS Black Belt Online Seminar Amazon Aurora
 
サーバーレスの今とこれから
サーバーレスの今とこれからサーバーレスの今とこれから
サーバーレスの今とこれから
 

Similar a NamenodeHA導入背景と運用状況

[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
Insight Technology, Inc.
 

Similar a NamenodeHA導入背景と運用状況 (20)

とあるKVSをAutoscalingしてみる
とあるKVSをAutoscalingしてみるとあるKVSをAutoscalingしてみる
とあるKVSをAutoscalingしてみる
 
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
[db tech showcase Tokyo 2016] B15: サイバーエージェント アドテクスタジオの次世代データ分析基盤紹介 by 株式会社サイ...
 
Hadoopエコシステムを駆使したこれからのWebアクセス解析サービス
Hadoopエコシステムを駆使したこれからのWebアクセス解析サービスHadoopエコシステムを駆使したこれからのWebアクセス解析サービス
Hadoopエコシステムを駆使したこれからのWebアクセス解析サービス
 
Webdb2011 hadoop
Webdb2011 hadoopWebdb2011 hadoop
Webdb2011 hadoop
 
StreamPaaSのご紹介
StreamPaaSのご紹介StreamPaaSのご紹介
StreamPaaSのご紹介
 
マーケティングテクノロジー勉強会
マーケティングテクノロジー勉強会マーケティングテクノロジー勉強会
マーケティングテクノロジー勉強会
 
シラサギ紹介osc京都
シラサギ紹介osc京都シラサギ紹介osc京都
シラサギ紹介osc京都
 
シラサギ紹介20170525
シラサギ紹介20170525シラサギ紹介20170525
シラサギ紹介20170525
 
シラサギ紹介20170915
シラサギ紹介20170915シラサギ紹介20170915
シラサギ紹介20170915
 
OSC長岡
OSC長岡OSC長岡
OSC長岡
 
Osc広島2017
Osc広島2017Osc広島2017
Osc広島2017
 
OSCnagoya2019(Shirasagi20190709)
OSCnagoya2019(Shirasagi20190709)OSCnagoya2019(Shirasagi20190709)
OSCnagoya2019(Shirasagi20190709)
 
シラサギ紹介(OSC東京)
シラサギ紹介(OSC東京)シラサギ紹介(OSC東京)
シラサギ紹介(OSC東京)
 
Shirasagi20190222(OSC TOKYO)
Shirasagi20190222(OSC TOKYO)Shirasagi20190222(OSC TOKYO)
Shirasagi20190222(OSC TOKYO)
 
ついに登場SAP Data Warehouse Cloud
ついに登場SAP Data Warehouse Cloudついに登場SAP Data Warehouse Cloud
ついに登場SAP Data Warehouse Cloud
 
OSC KYOTO 2018
OSC KYOTO 2018OSC KYOTO 2018
OSC KYOTO 2018
 
niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例niconicoにおける継続的なデータ活用のためのHadoop運用事例
niconicoにおける継続的なデータ活用のためのHadoop運用事例
 
シラサギ紹介OSC京都2017
シラサギ紹介OSC京都2017シラサギ紹介OSC京都2017
シラサギ紹介OSC京都2017
 
ヤフー発のメッセージキュー 「Pulsar」のご紹介@jjug ccc 20171118
ヤフー発のメッセージキュー 「Pulsar」のご紹介@jjug ccc 20171118ヤフー発のメッセージキュー 「Pulsar」のご紹介@jjug ccc 20171118
ヤフー発のメッセージキュー 「Pulsar」のご紹介@jjug ccc 20171118
 
Shirasagi20191010
Shirasagi20191010Shirasagi20191010
Shirasagi20191010
 

Más de Makoto Uehara (9)

AutoScaling & SpotInstance Handson
AutoScaling & SpotInstance HandsonAutoScaling & SpotInstance Handson
AutoScaling & SpotInstance Handson
 
aerospike on aws
aerospike on awsaerospike on aws
aerospike on aws
 
20170803 bigdataevent
20170803 bigdataevent20170803 bigdataevent
20170803 bigdataevent
 
Ecs words
Ecs wordsEcs words
Ecs words
 
Aerospike xdr (Cross Datacenter Replication)
Aerospike xdr (Cross Datacenter Replication)Aerospike xdr (Cross Datacenter Replication)
Aerospike xdr (Cross Datacenter Replication)
 
Streaming tuning test
Streaming tuning testStreaming tuning test
Streaming tuning test
 
ansible 社内お勉強会資料
ansible 社内お勉強会資料ansible 社内お勉強会資料
ansible 社内お勉強会資料
 
Aerospike 02 監視
Aerospike 02 監視Aerospike 02 監視
Aerospike 02 監視
 
Aerospike v3 install
Aerospike v3 installAerospike v3 install
Aerospike v3 install
 

NamenodeHA導入背景と運用状況