10. PowerBIとの接続 がマイクロソフト認定 – 高速に、セキュアに。
This is a rolling (up to 3 year) roadmap and is subject to change without notice
• 課題: MS PowerBIユーザーは、対象データを一度ローカルに
ダウンロードし、分析する必要がありました。大容量デー
タのハンドリングやパフォーマンスに課題がありました。
• 解決策: PowerBIは、新しいDirectConnectを使用してVerticaに
接続することができるようになりました。 Microsoft社と技
術協力し、PowerBIのコードをVerticaに最適な変更をしてい
ます。
• 利点: 高速に、セキュアに、スケーラブルな分析を実現しま
す。
17. ユースケース:直近3ヶ月は日単位、それ以前は月単位とする
設定変更例②:一般的な関数を使用して指定する場合
1. 変更前のテーブルの設定を確認する。
2. パーティションの設定を変更する。
=> select export_objects(‘’,’sales_fact’);
------------------------------------------------
CREATE TABLE public.sales_fact
(
sales_date date NOT NULL,
area varchar(10),
sales int
)
PARTITION BY (concat((date_part('year', sales_fact.sales_date))::varchar, (date_part('month',
sales_fact.sales_date))::varchar));
・・・
=> ALTER TABLE sales_fact PARTITION BY sales_date
GROUP BY (
CASE
WHEN DATEDIFF('month', sales_date, CURRENT_TIMESTAMP::DATE) >= 3
THEN DATE_TRUNC('month', sales_date)::DATE
ELSE sales_date
END
);
直近3ヶ月以内は、sales_date
(日単位)でパーティショ
ンし、それ以前は、月単位
でパーティションする
18. ユースケース:直近3ヶ月は日単位、それ以前は月単位とする
設定変更例②:一般的な関数を使用して指定する場合
3. 変更内容を適用するために、再編成を実施する。
4. パーティションされている状況を確認する。
=> ALTER TABLE public.sales_fact REORGANIZE;
=> SELECT DUMP_TABLE_PARTITION_KEYS('sales_fact');
---------------------------------------------------------
Partition keys on node v_vmart_node0001
Projection 'sales_fact_b0'
Storage [ROS container]
No of partition keys: 1
Partition keys: 2017-11-07
Storage [ROS container]
No of partition keys: 1
Partition keys: 2017-11-03
・・・
Storage [ROS container]
No of partition keys: 13
Partition keys: 2017-07-03 2017-07-05 2017-07-06 2017-07-09 2017-07-12 2017-07-13 2017-07-
14 2017-07-16 2017-07-17 2017-07-18 2017-07-24 2017-07-25 2017-07-26
・・・
直近3ヶ月以内は、日ご
とにコンテナが作成さ
れていることがわかる 3ヶ月より前は、月ごと
にコンテナが作成され
ていることがわかる
19. データ型Universally Unique Identifier (UUID) をサポート
• 課題: UUID形式のデータをテキスト形式で管理するより、ストレージ
の観点で効率的なデータ形式を使用したいという要求がありました。
• 解決策: Python, ODBC, JDBC ,ADO.NET, 及び、 vsqlクライアントで
新しいデータストレージスペースの効率化形式をサポートします。
• 利点: ストレージ容量の削減、及び、パフォーマンス向上します。
• 例: テキスト形式で管理すると6bbf0744-74b4-46b9-bb05-
53905d4538e7 は、36バイト VARCHAR(36)必要であったが、新し
いUUID形式で管理すると 16 バイトで管理することができます。
CREATE TABLE document (id UUID, title VARCHAR(100));
INSERT INTO document (‘6bbf0744-74b4-46b9-bb05-53905d4538e7’, ‘Vertica in the Valley’);
INSERT INTO document SELECT uuid_generate(), ‘Vertica in Europe’);
COPY document FROM STDIN
88888888-4444-4444-4444-121212121212 | Vertica Boston
.
SELECT * FROM document;
id | title
-------------------------------------|---------------------------------------------------
6bbf0744-74b4-46b9-bb05-53905d4538e7 | Vertica in the Valley
56g3f62d-bde4-75ef-a6f2-61e5dab39149 | Vertica in Europe
88888888-4444-4444-4444-121212121212 | Vertica Boston
Cross-validation works for the following algorithms in Vertica.
Linear regression
Logistic regression
KMeans
SVM
Random Forests does not require cross-validation because it’s already uses ensembling