33. 加工例:
SequenceFile(BLOCK)
+
gzip
テーブル作成
CREATE TABLE seq_table (id INT, name STRING, … )
STORED AS SEQUENCEFILE;
set mapred.output.compression.type = BLOCK;
set hive.exec.compress.output = true;
set mapred.output.compression.codec =
org.apache.hadoop.io.compress.GzipCodec;
INSERT INTO seq_table SELECT * FROM raw_table;
34
34. 加工例:
SequenceFile(BLOCK)
+
gzip
テーブル作成
外部テーブル
+
S (id INT, name STRING, … )
CREATE TABLE seq_table erDe
を組み合わせて、生
STORED AS データに対するスキーマを作る
SEQUENCEFILE;
set mapred.output.compression.type = BLOCK;
SequenceFile形式の
テーブルに変換する
set hive.exec.compress.output = true;
set mapred.output.compression.codec =
org.apache.hadoop.io.compress.GzipCodec;
INSERT INTO seq_table SELECT * FROM raw_table;
35