SlideShare una empresa de Scribd logo
1 de 56
Descargar para leer sin conexión
Hadoopを40分で理解する
Cloudera株式会社 エデュケーションサービス	
  
川崎 達夫	
  <kawasaki@cloudera.com>	
  
2013年11月7日	
  

1
About	
  Me	
  
• 

川崎  達夫(かわさき  たつお)	
  

• 

シニアインストラクター&研修全般業務を担当	
  
email:	
  kawasaki@cloudera.com	
  
twi>er:	
  @kernel023	
  

• 
• 

2
Hadoop オペレーションの日本語訳が発売予定です	
  
• 
• 
• 
• 
• 
• 

11月下旬発売
通称「パカ」本  (?)
Cloudera  の Eric  Sammer  著
翻訳は安心の玉川竜司さん
レビューを手伝ってました
日本語版のみの付録も執筆!
Cloudera Impala の⽇日本語フリーブック
• 
• 
• 

オライリーの「インパラ本」、日本語PDF版が無償公開される予定です!
Cloudera  の John  Russell  著
Hadoop、HBase、Hadoopオペレーション、
プログラミングHiveなどを翻訳された
玉川竜司さんが翻訳!

「これまでClouderaの皆さ
んにご尽力いただいた翻訳
レビューへの感謝の気持ち
として、Cloudera World
Tokyo開催のお祝いに翻訳寄
贈します!」
本⽇日のアジェンダ	
  
• 
• 
• 
• 

5

ビッグデータ	
  
ビッグデータを扱う上での課題	
  
Hadoop	
  
よくある質問	
  
ビッグデータ
Hadoopが存在している根拠

8
ビッグデータの間違った理理解	
  

STRUCTURED	
  DATA	
  –	
  20%	
  

BIGDATA != SIZE	
9
データ爆発	
  
1兆ギガバイトのデータが	
  
2011年に生成された…	
90%以上が非構造データ	
約50京(500x1000兆)のファイル	
2年毎に倍増	

STRUCTURED	
  DATA	
  –	
  20%	
  

10
ビッグデータの定義	
  

量
•  種類(多様性)
•  生成される速度
• 

11
量

—	
  Cisco	
  Systems	
  2013/5	
  

12
種類

13
速度

14
ビッグデータは必要か?	
  
• 
• 

現在、データは⾮非常に速いペースで増えている	
  
そのうちの90%は⾮非構造データ	
  
• 

15

従来の仕組みでこのようなデータを扱うことは難しい	
  
ビッグデータのチャレンジ	
  
• 
• 
• 

16

データの「量」「種類」「速さ」をコスト効率率率よく
管理理	
  
構造データと構造化データから価値を導く	
  
コンテキストの変換への対応と新しいデータソース
と種類を統合
Q.	
  統計学があればビッグデータは不不要か?	
  
• 

「世界がもし100⼈人の村だったら」	
  

	
  

17

h>p://www.jackhagley.com/filter/personal/896192	
  
If	
  the	
  Twi>er	
  community	
  was	
  100	
  people...	
  
h>p://www.flickr.com/photos/25541021@N00/3706760751/
A.必ずしもそうではありません	
  
• 

18

「ウォーリーを探せ」
A.	
  全てのデータがあれば、、	
  
• 

19

サンプリングや粒粒度度を切切り替えるためには、元にな
る全データが必要です	
  

Photo:	
  Kris	
  Krug	
  
h>p://www.flickr.com/photos/kk/9240320949/
ビッグデータを扱う上での課題
既存システムの制約

20
ビッグデータ	
  
• 
• 

21

どうやって保存するか	
  
どうやって処理理するか	
  
⼤大量量なデータの保存	
  
課題	
  
•  1)データは増え続け
る	
  
•  2)読み書きの速度度	
  
•  3)コスト	
  
•  4)耐障害性	
  

22	
  
⼤大量量なデータの処理理	
  
• 

伝統的に、計算処理理は	
  
CPUに依存する	
  

初期のソリューション	
  
    -­‐>	
  巨⼤大なコンピュータ	
  
          ⾼高速なCPU	
  
          ⼤大量量のメモリ	
  
• 

23
⼤大量量なデータの処理理	
  
• 

より良良いソリューション	
  
-­‐>	
  ⼀一つのジョブを複数の	
  
    コンピュータで計算する	
  

        分散システム

24
分散システム	
  
• 

25

データを共有ディスクに保存し分散処理理を⾏行行う	
  
分散システムの課題	
  
• 
• 
• 

ディスクアクセスがボトルネック	
  
障害発⽣生時の処理理が複雑	
  
スケーラビリティ	
  

ボトル
ネック	

障害	

26
Hadoop	
  
Googleの技術に由来	
  

27
(再)分散システムの課題	
  
• 
• 
• 

ディスクアクセスがボトルネック	
  
障害発⽣生時の処理理が複雑	
  
スケーラビリティ	
  

ボトル
ネック	

障害	

28
Googleでのアプローチ	
  
• 

29

データは分散して保存しておき、処理理を⾏行行う	
  
Apache	
  Hadoop™	
  
• 

Googleが公開した論論⽂文を参考に開発された	
  
オープンソースソフトウェア	
  

Doug	
  Cu^ng	
  
Chief	
  Architect	
  @Cloudera	
  
30
Apache	
  Hadoop™	
  
• 

32

データストレージと処理理のための	
  
オープンソースプラットフォーム
ü スケーラブル	
  
ü 耐障害性	
  
ü 分散される	
  
Apache	
  Hadoop™	
  
• 

HDFS	
  –	
  ストレージ	
  
• 

⼤大量量のデータが保存できる	
  
• 

• 
• 

Yahoo!では合計350PB、FaceBookも100PB超	
  

耐障害性	
  
スケーラブル	
  
1台〜~数千台	
  

• 

MapReduce	
  -­‐	
  ⼤大量量なデータを分散処理理できる	
  
• 
• 
• 

33

数多くのサーバで分散して処理理(数千台も可能)	
  
耐障害性	
  
汎⽤用的なプログラム⾔言語で記述できる	
  
Hadoopのアーキテクチャ	
  
• 

マスター/スレーブ	
  
マスター

(高可用性可能)

34

スレーブ群(1∼数千台)
⼤大量量なデータの保存	
  
データはあるサイズに	
  
    分割/分散して保存	
  
•  データは複製して配置	
  

マスター

スレーブ群

• 

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/finance	
  	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /item/sports/2605	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/electron	
  
168.90.228.205	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "POST	
  /search/?c=Music	
  
28.42.27.49	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/electronic	
  
192.120.64.138	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/books?f	
  
156.189.222.57	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/network	
  
164.219.215.208	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/books	
  	
  
84.42.208.90	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/somware/3186	
  
164.39.210.117	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/garden/4484	
  
196.144.35.85	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/	
  
80.78.35.71	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/35	
  
80.174.161.70	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/garden	
  H	
  
192.186.87.52	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/games	
  HT	
  
132.186.183.184	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/somware/3	
  
212.27.25.133	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/	
  
32.21.118.159	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/electron	
  
56.99.155.75	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/books	
  HTT	
  
196.63.29.59	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:11	
  +0900]	
  "GET	
  /category/games	
  HTT	
  
24.87.189.150	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:11	
  +0900]	
  "GET	
  /category/somware	
  

38

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

A	

168.90.228.205	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.42.27.49	
  -­‐	
  -­‐	
  [04/Nov/201	
  
192.120.64.138	
  -­‐	
  -­‐	
  [04/Nov/	

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

A	

156.189.222.57	
  -­‐	
  -­‐	
  [04/Nov/2	
  
164.219.215.208	
  -­‐	
  -­‐	
  [04/Nov/	
  
84.42.208.90	
  -­‐	
  -­‐	
  [04/Nov/20	
72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	
164.39.210.117	
  -­‐	
  -­‐	
  [04/Nov/	
  
196.144.35.85	
  -­‐	
  -­‐	
  [04/Nov/2	
  
80.78.35.71	
  -­‐	
  -­‐	
  [04/Nov/201	

A
⼤大量量なデータの保存	
  
• 
• 

容易易に容量量を増やせる	
  
構造/⾮非構造データ	
  

マスター

スレーブ群
72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

168.90.228.205	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.42.27.49	
  -­‐	
  -­‐	
  [04/Nov/201	
  
192.120.64.138	
  -­‐	
  -­‐	
  [04/Nov/	

156.189.222.57	
  -­‐	
  -­‐	
  [04/Nov/2	
  
164.219.215.208	
  -­‐	
  -­‐	
  [04/Nov/	
  
84.42.208.90	
  -­‐	
  -­‐	
  [04/Nov/20	

164.39.210.117	
  -­‐	
  -­‐	
  [04/Nov/	
  
196.144.35.85	
  -­‐	
  -­‐	
  [04/Nov/2	
  
80.78.35.71	
  -­‐	
  -­‐	
  [04/Nov/201	

39
⼤大量量なデータの保存	
  –	
  障害時	
  
• 
• 

データは複数箇所に	
  
あるのでロストしない
⾃自動で複製される	
  

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/finance	
  	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /item/sports/2605	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/electron	
  
168.90.228.205	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "POST	
  /search/?c=Music	
  
28.42.27.49	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/electronic	
  
192.120.64.138	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/books?f	
  
156.189.222.57	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/network	
  
164.219.215.208	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:09	
  +0900]	
  "GET	
  /category/books	
  	
  
84.42.208.90	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/somware/3186	
  
164.39.210.117	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/garden/4484	
  
196.144.35.85	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/	
  
80.78.35.71	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/35	
  
80.174.161.70	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/garden	
  H	
  
192.186.87.52	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/games	
  HT	
  
132.186.183.184	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/somware/3	
  
212.27.25.133	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /item/electronics/	
  
32.21.118.159	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/electron	
  
56.99.155.75	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:10	
  +0900]	
  "GET	
  /category/books	
  HTT	
  
196.63.29.59	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:11	
  +0900]	
  "GET	
  /category/games	
  HTT	
  
24.87.189.150	
  -­‐	
  -­‐	
  [04/Nov/2013:21:57:11	
  +0900]	
  "GET	
  /category/somware	
  

40

マスター

スレーブ群
①障害

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

A	

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

②複製指示

③複製
72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

A	

A
⼤大量量なデータの処理理	
  -­‐	
  MapReduce	
  
• 

分散されたデータを	
  
それぞれのサーバで	
  
処理理する(Map)	
  

JOB	

マスター

スレーブ群

Task	
72.165.33.132	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.114.157.122	
  -­‐	
  -­‐	
  [04/No	
  
52.93.117.198	
  -­‐	
  -­‐	
  [04/Nov/	

Task	
168.90.228.205	
  -­‐	
  -­‐	
  [04/Nov/	
  
28.42.27.49	
  -­‐	
  -­‐	
  [04/Nov/201	
  
192.120.64.138	
  -­‐	
  -­‐	
  [04/Nov/	

Task	
156.189.222.57	
  -­‐	
  -­‐	
  [04/Nov/2	
  
164.219.215.208	
  -­‐	
  -­‐	
  [04/Nov/	
  
84.42.208.90	
  -­‐	
  -­‐	
  [04/Nov/20	

Task	
164.39.210.117	
  -­‐	
  -­‐	
  [04/Nov/	
  
196.144.35.85	
  -­‐	
  -­‐	
  [04/Nov/2	
  
80.78.35.71	
  -­‐	
  -­‐	
  [04/Nov/201	

45
⼤大量量なデータの処理理	
  -­‐	
  MapReduce	
  
• 

分散処理理した結果を	
  
集約する(Reduce)	
  

マスター

スレーブ群

Task	

72.165.33.132,	
  1	
  
72.165.33.132,	
  1	
  
72.165.33.132,	
  1	
  
72.165.33.145,	
  1	

168.90.228.205,1	
  
168.90.228.205,1	
  
192.120.64.138,1	

156.189.222.57,1	
  
156.189.222.57,1	
  
164.219.215.208,1	
  

164.39.210.117,1	
  
164.39.210.117,1	
  
164.39.210.118.1	
  

46
⼤大量量なデータの処理理	
  -­‐	
  MapReduce	
  
• 

障害もうまく扱って	
  
くれる	
  

(開発者は考慮しなくてOK)	
  

マスター

TaskB	
スレーブ群

TaskA	

72.165.33.132,	
  1	
  
72.165.33.132,	
  1	
  
72.165.33.132,	
  1	
  
72.165.33.145,	
  1	

TaskB	
168.90.228.205,1	
  
168.90.228.205,1	
  
192.120.64.138,1	

TaskC	
156.189.222.57,1	
  
156.189.222.57,1	
  
164.219.215.208,1	
  

TaskD	
164.39.210.117,1	
  
164.39.210.117,1	
  
164.39.210.118.1	
  

47
よくある質問

48
Q.	
  Hadoopはどんな⽬目的にも使えるの?	
  
• 

A.	
  いいえ、そのようなことはありません	
  
• 
• 

• 

49

⼤大量量データ全てを処理理するようなユースケースには向いて
います	
  
⼀一⽅方、リアルタイム性は期待できません。また、HDFSの設
計上データの更更新はできず、MapReduceもトランザクショ
ン処理理は備えていないため、データベースの置き換え⽬目的
などには向いていません	
  
とはいえ、低遅延なアクセスを⾏行行ったり、SQLライクなア
クセスができるなどのエコシステムが増えています	
  
Q.	
  Hadoopはどんな⽬目的にも使えるの?	
  
• 

各種事例例はCloudera	
  World	
  2013の各セッションも参
考に(多くの資料料が公開されます)	
  
• 

h>p://h>p://www.cloudera.co.jp/jpevents/cwt2013/	
  

• 

Clouderaにも英語のホワイトペーパーもあります	
  

h>p://www.cloudera.com/content/cloudera/en/resources/library.html?
category=cloudera-­‐resources%3Awhy-­‐cloudera%2Fwhite-­‐papers&q=	
  
	
  

Strata+Hadoop	
  Worldでも多くの事例例が紹介されています	
  
h>p://strataconf.com/stratany2013/	
  
• 

	
  
50
Q.	
  Hadoopって難しい?  ⼈人材不不⾜足	
  
• 

⽇日経コンピュータ  2011年年9⽉月15⽇日号
• 

• 

⽇日本経済新聞	
  
• 

51

ビッグデータ⾰革命:最⼤大の課題は⼈人材不不⾜足

ビッグデータ分析に⼈人材の壁、25万⼈人不不⾜足⾒見見通し	
  
(2013/7/17)
A.	
  トレーニングと認定資格	
  
http://cloudera.co.jp/university	

• 

※詳細は配布資料料をご覧下さい	
  

• 

トレーニング	
  
• 
• 
• 
• 

• 

Hadoop開発者向け              ・  HBase	
  
Hadoop管理理者向け              ・  Hadoopエッセンシャル	
  
データアナリスト向け	
  
データサイエンティスト⼊入⾨門	
  

認定資格	
  
• 
• 
• 
• 

Hadoop開発者認定	
  
Hadoop管理理者認定	
  
HBaseスペシャリスト認定	
  
Cloudera認定スペシャリスト:データサイエンス	
  
h>p://enterprisezine.jp/arxcle/corner/220/	

52
Q.	
  Hadoopは使いにくい?  	
  

53
A.	
  いいえ、エコシステムも充実しています	
  

例:SQLライクにHadoopを使う
 - Hive
 - Cloudera Impala

54
A.	
  さらに、最近はGUIも充実	
  

Hadoop用のGUI
Cloudera  Hue
(ファイルマネージャ)

運用管理ツール
Cloudera  Manager

55
A.	
  さらに、最近はGUIも充実(続き)	
  

Hadoop用のGUI
Cloudera  Hue
Cloudera  Search  アプリ
56
Cloudera	
  Enterprise	
  5	
  (Coming	
  Soon)	
  
	
  	
  

57
Cloudera	
  Enterprise	
  
• 

Hadoopをエンタープライズで利利⽤用するためのベスト
ソリューション	
  
• 

CDH	
  (Cloudera’s	
  Distribuxon	
  includes	
  Apache	
  Hadoop)	
  
• 
• 
• 

• 

最も利利⽤用されているディストリビューション	
  
オープンソースソフトウェア	
  
多くのエコシステム(Cloudera	
  Impala,Hue,Hive,….)	
  

Cloudera Manager
• 
• 

CDHを管理理する統合管理理ツール	
  
機能限定の無償版(スタンダード)と、サブスクリプションを購
⼊入していただくと利利⽤用できる版(エンタープライズ)	
  

CDH/Cloudera  Managerを簡単に試すことができる仮想マシンイメージ
Cloudera  QuickStart  VM:         http://bit.ly/1966hRW
58
Hadoopへの貢献をリードするCloudera	
  
Team	
  

メーリングリスト投稿数	

プロジェクトごとのクローズチケット率
2011年8月 – 2012年8月
100%	
  
90%	
  
80%	
  
70%	
  

全クローズイシュー数

60%	
  

23	
  

50%	
  

2	
  

70	
  

1072	
  

40%	
  
30%	
  
20%	
  
10%	
  

2927	
  

0%	
  

Source:	
  Apache財団(Apache	
  Somware	
  Foundaxon)	
  

59

Cloudera	
  
MapR	
  
IBM	
  

HortonWorks	
  
EMC	
  
Cloudera	
  Manager	
  5	
  (ベータ版)	
  

60
Cloudera	
  Manager	
  5	
  (ベータ版)	
  

61
まとめ	
  

63
まとめ	
  
• 

Hadoopとは、	
  
⼤大量量なデータを「分散」して保存し、分散して保存
されているデータを「分散」して処理理するオープン
ソースの実⾏行行基盤です	
  

Hadoopを利用するならCloudera Enterpriseを選びましょう!

65
We	
  are	
  Hiring!	
  
• 

Clouderaは貴⽅方を求めています!!	
  
• 

ソリューションアーキテクト	
  
• 

• 

カスタマーオペレーションエンジニア	
  
(サポート)	
  
• 

• 
• 

世界中のお客様のHadoopを守る!	
  

インストラクター	
  
システムエンジニア	
  
• 

• 

Hadoopを使ったコンサルティングやモデリング	
  

技術営業⽀支援	
  

セールス	
  

	
  
興味のある⽅方は下記までご連絡下さい!	
  
	
  info-­‐jp@cloudera.com	
  
66
We	
  are	
  Hiring!	
  

67
Thank	
  you!	
  

	
  Tatsuo	
  Kawasaki,	
  Manager/Senior	
  Instructor,	
  Cloudera	
  K.K

	
  

	
  

	
  

	
  

	
  @kernel023	
  

Más contenido relacionado

Más de Cloudera Japan

Más de Cloudera Japan (20)

Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018Apache Impalaパフォーマンスチューニング #dbts2018
Apache Impalaパフォーマンスチューニング #dbts2018
 
Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理Apache Hadoop YARNとマルチテナントにおけるリソース管理
Apache Hadoop YARNとマルチテナントにおけるリソース管理
 
HBase Across the World #LINE_DM
HBase Across the World #LINE_DMHBase Across the World #LINE_DM
HBase Across the World #LINE_DM
 
Cloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennightCloudera のサポートエンジニアリング #supennight
Cloudera のサポートエンジニアリング #supennight
 
Train, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning modelTrain, predict, serve: How to go into production your machine learning model
Train, predict, serve: How to go into production your machine learning model
 
Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側Apache Kuduを使った分析システムの裏側
Apache Kuduを使った分析システムの裏側
 
Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017Cloudera in the Cloud #CWT2017
Cloudera in the Cloud #CWT2017
 
先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方先行事例から学ぶ IoT / ビッグデータの始め方
先行事例から学ぶ IoT / ビッグデータの始め方
 
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
Clouderaが提供するエンタープライズ向け運用、データ管理ツールの使い方 #CW2017
 
How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017How to go into production your machine learning models? #CWT2017
How to go into production your machine learning models? #CWT2017
 
Apache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentechApache Kudu - Updatable Analytical Storage #rakutentech
Apache Kudu - Updatable Analytical Storage #rakutentech
 
Hue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejpHue 4.0 / Hue Meetup Tokyo #huejp
Hue 4.0 / Hue Meetup Tokyo #huejp
 
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
 
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadedaCloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
Cloudera Data Science WorkbenchとPySparkで 好きなPythonライブラリを 分散で使う #cadeda
 
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
Cloudera + MicrosoftでHadoopするのがイイらしい。 #CWT2016
 
Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016Cloud Native Hadoop #cwt2016
Cloud Native Hadoop #cwt2016
 
大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016大規模データに対するデータサイエンスの進め方 #CWT2016
大規模データに対するデータサイエンスの進め方 #CWT2016
 
#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計#cwt2016 Apache Kudu 構成とテーブル設計
#cwt2016 Apache Kudu 構成とテーブル設計
 
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング #cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
#cwt2016 Cloudera Managerを用いた Hadoop のトラブルシューティング
 
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDSIbis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS
 

Último

Último (12)

論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 

Hadoopを40分で理解する #cwt2013