SlideShare una empresa de Scribd logo
1 de 29
見栄えだけのグラフを駆逐せよ!
意味あるデータの捉え方
2019/01/22
自己紹介
● ID:MasayasuKurashina
● 仕事:社内SE (システム企画・設計・S/W開発・運用保守
・インフラ/サーバー構築・ヘルプデスク)
● 言語:SQL / VB.NET / VBA [ Excel/MS-Access] / Java + jsp
● インフラ:Windows Server / VMware ESXi / Linux(RHEL系)
Cisco機器 [LAN側]
● DB:MSSQL (ようやくpostgresqlを少々)
● 趣味:写真
2
アジェンダ
1. なぜ今このテーマ?
2. 残念なデータ解析(サンプルデータを用いて)
3. データを見る前に行った方が良いこと
4. まとめ
3
この資料の内容は個人的意見が含まれていますので
その点ご了承ください。
なぜ今このテーマ?
4
データ解析?データ集計?
● こんな話をよく聞きませんか?
○ これからはデータの時代。
月次売上データを3年分取得してトレンド分析をした!
○ 当社はB to Bビジネス。
得意先を属性で分類してBランク顧客を
Aランク顧客にするための施策を検討するぞ!
5
データ解析?データ集計?
● 分析ではなくて「集計」で終ってないですか?
● 検討するデータってそれで正しいですか?
6
何のために面倒な「データ解析」なぞをするの?
● データ解析の目的はそれぞれ。
でも、突き詰めて考えれば
「見えていないもの見る」
「思い込みから理解を解き放つ」
の2点に尽きると思います。
7
見えていないものを見るためのツール
● グラフは「見えていないもの」を
可視化するためのツールです。
● 表現する内容が
思い込みによるものを前提にしていた場合
「見えていないもの」は見えません。
「思い込み」のままです。
8
見えていないものを見るためのツール
● 見えていないものを浮かび上がらせる為には
「現実」の正しい理解が必要ですね。
● 正しい「現実」を理解するためには
『思考のツール』が必要です。
9
残念なデータ解析
10
11
コーヒー好きですか?_
コーヒー価格の上昇は中国の消費が伸びているから?
コーヒー価格の上昇要因分析の
考え方は正しいでしょうか?
12
では、データ解析!
13Source :
International Coffee Organization
では、データ解析!
14
Source :
International Coffee Organization
では、データ解析!
15
困った!
16
データを見る前に行った方が良いこと
17
データ同士の関係、きちんと見えていますか?
● 「リアル」な世界で、比較するデータ同士は
どのような関係がありますか?
● 小売価格はどのように決まるのでしょうか。
18
ではまたコーヒーの事例
19
生産量
国内在庫量
消費量
輸入量
輸出量
@ 生産者価格
@小売価格
@輸入価格
@輸出価格
投機的要因
ではまたコーヒーの事例
20
生産量
国内在庫量
消費量
輸入量
輸出量
@生産者価格
@小売価格
@輸入価格
@輸出価格
何か変ですね。
投機的要因
ではまたコーヒーの事例
21
生産量
国内在庫量
消費量
輸入量
輸出量
@生産者価格
@小売価格
@輸入価格
@輸出価格
本来はこの変数では
ないでしょうか。投機的要因
コーヒーの事例をシステム思考モデリングで表現
22
世界在庫量
≒ 消費倍率
(消費量/生産量)
(+)
(-)
@生産者価格
≒0
世界生産量
世界輸入量
世界輸出量
世界消費量
@小売価格
投機的要因
(+)
(+)
ではまたコーヒーの事例
23
Source :
Food and Agriculture Organization
ではまたコーヒーの事例
24
この事例からの教訓
● データがあるからといって、
そのデータ同士の関係を無視していきなり
Excelだ、pythonだ、Rだなんて
言っている人いませんか?
(ご参加者の皆様にはいないとは思っています。)
● 意外とデータ解析を数回経験した人が
陥りがちな罠なのではないでしょうか。 25
まとめ
26
まとめ
● データ分析の前にデータ同士の関連を
モデル化することをお勧めします。
● モデル化することによって思考の破綻を
防ぐことができます。
● モデル化のツールとして「システム思考」によ
る表記で整理することをお勧めします。 27
Bibliography
1. 学習する組織――システム思考で未来
を創造する
[ ピーターMセンゲ / 英治出版 ]
2. 世界はシステムで動く ―― いま起き
ていることの本質をつかむ考え方
[ ドネラ・H・メドウズ / 英治出版 ]
28
Thank you!

Más contenido relacionado

La actualidad más candente

Miyazaki流sql
Miyazaki流sqlMiyazaki流sql
Miyazaki流sqlhafuu
 
Apache cassandra 最前線
Apache cassandra 最前線Apache cassandra 最前線
Apache cassandra 最前線Kazutaka Tomita
 
Sql serverと他dbの違いを押さえよう!
Sql serverと他dbの違いを押さえよう!Sql serverと他dbの違いを押さえよう!
Sql serverと他dbの違いを押さえよう!Oda Shinsuke
 
RDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるRDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるMikiya Okuno
 
開発者の方向けの Sql server(db) t sql 振り返り
開発者の方向けの Sql server(db) t sql 振り返り開発者の方向けの Sql server(db) t sql 振り返り
開発者の方向けの Sql server(db) t sql 振り返りOda Shinsuke
 
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門福岡DB勉強会2016春・MySQLの{最新情報と概要}入門
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門sakaik
 
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料Takashi Aoe
 
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜Mikiya Okuno
 
MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座Mikiya Okuno
 
リレーショナルデータベースとの上手な付き合い方
リレーショナルデータベースとの上手な付き合い方リレーショナルデータベースとの上手な付き合い方
リレーショナルデータベースとの上手な付き合い方Mikiya Okuno
 
A5 SQL Mk-2の便利な機能をお教えします
A5 SQL Mk-2の便利な機能をお教えしますA5 SQL Mk-2の便利な機能をお教えします
A5 SQL Mk-2の便利な機能をお教えしますester41
 
2016年を振り返って
2016年を振り返って2016年を振り返って
2016年を振り返ってOda Shinsuke
 
訳が欲しい奴ぁ俺んとこ来い!
訳が欲しい奴ぁ俺んとこ来い!訳が欲しい奴ぁ俺んとこ来い!
訳が欲しい奴ぁ俺んとこ来い!Ryuji Tamagawa
 
便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips豊明 尾古
 

La actualidad más candente (18)

Microsoft Access講習
Microsoft Access講習Microsoft Access講習
Microsoft Access講習
 
Miyazaki流sql
Miyazaki流sqlMiyazaki流sql
Miyazaki流sql
 
Apache cassandra 最前線
Apache cassandra 最前線Apache cassandra 最前線
Apache cassandra 最前線
 
Sql serverと他dbの違いを押さえよう!
Sql serverと他dbの違いを押さえよう!Sql serverと他dbの違いを押さえよう!
Sql serverと他dbの違いを押さえよう!
 
RDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考えるRDBにおけるバリデーションをリレーショナルモデルから考える
RDBにおけるバリデーションをリレーショナルモデルから考える
 
開発者の方向けの Sql server(db) t sql 振り返り
開発者の方向けの Sql server(db) t sql 振り返り開発者の方向けの Sql server(db) t sql 振り返り
開発者の方向けの Sql server(db) t sql 振り返り
 
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門福岡DB勉強会2016春・MySQLの{最新情報と概要}入門
福岡DB勉強会2016春・MySQLの{最新情報と概要}入門
 
鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料鹿駆動勉強会 青江発表資料
鹿駆動勉強会 青江発表資料
 
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜
データモデルについて知っておくべき7つのこと 〜NoSQLに手を出す前に〜
 
Sql world とは
Sql world とはSql world とは
Sql world とは
 
Database smells
Database smellsDatabase smells
Database smells
 
MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座MySQLアーキテクチャ図解講座
MySQLアーキテクチャ図解講座
 
リレーショナルデータベースとの上手な付き合い方
リレーショナルデータベースとの上手な付き合い方リレーショナルデータベースとの上手な付き合い方
リレーショナルデータベースとの上手な付き合い方
 
A5 SQL Mk-2の便利な機能をお教えします
A5 SQL Mk-2の便利な機能をお教えしますA5 SQL Mk-2の便利な機能をお教えします
A5 SQL Mk-2の便利な機能をお教えします
 
Sql world とは
Sql world とはSql world とは
Sql world とは
 
2016年を振り返って
2016年を振り返って2016年を振り返って
2016年を振り返って
 
訳が欲しい奴ぁ俺んとこ来い!
訳が欲しい奴ぁ俺んとこ来い!訳が欲しい奴ぁ俺んとこ来い!
訳が欲しい奴ぁ俺んとこ来い!
 
便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips便利なHerokuと active recordの 速度改善tips
便利なHerokuと active recordの 速度改善tips
 

Similar a 見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方

Osc spring 20220311
Osc spring 20220311Osc spring 20220311
Osc spring 20220311Yasuaki Sera
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようDaisuke Masubuchi
 
Glueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるGlueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるcloudfish
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020Daisuke Masubuchi
 
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
SparkとJupyterNotebookを使った分析処理 [Html5 conference]SparkとJupyterNotebookを使った分析処理 [Html5 conference]
SparkとJupyterNotebookを使った分析処理 [Html5 conference]Tanaka Yuichi
 
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)Yosuke Katsuki
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみたtatsuya 264
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案Toshiyuki Shimono
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo FallYusukeKuramata
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...Insight Technology, Inc.
 
簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪Yohei Azekatsu
 
20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料Takahiro Iwase
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようtakeshi suto
 
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...Insight Technology, Inc.
 
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章Insight Technology, Inc.
 
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」(株)TAM
 
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ20221117_クラウドネイティブ向けYugabyteDB活用シナリオ
20221117_クラウドネイティブ向けYugabyteDB活用シナリオMasaki Yamakawa
 
Visual studio online and Agile
Visual studio online and AgileVisual studio online and Agile
Visual studio online and AgileKazushi Kamegawa
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...Insight Technology, Inc.
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeSatoru Ishikawa
 

Similar a 見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方 (20)

Osc spring 20220311
Osc spring 20220311Osc spring 20220311
Osc spring 20220311
 
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみようPPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
PPT Full version: 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう
 
Glueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみるGlueの開発環境(zeppelin)をrancherで作ってみる
Glueの開発環境(zeppelin)をrancherで作ってみる
 
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
PDF版 世界中のゲーム分析をしてきたPlayFabが大進化!一緒に裏側の最新データ探索の仕組みを覗いてみよう Db tech showcase2020
 
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
SparkとJupyterNotebookを使った分析処理 [Html5 conference]SparkとJupyterNotebookを使った分析処理 [Html5 conference]
SparkとJupyterNotebookを使った分析処理 [Html5 conference]
 
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
実案件で見る データ分析用AWS基盤の構築方法 - Developers.IO 2017 (20170701)
 
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみたAWS朝会2022/1	セッション① 数年間、レイクハウスを設計運用してみた
AWS朝会2022/1 セッション① 数年間、レイクハウスを設計運用してみた
 
企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案企業等に蓄積されたデータを分析するための処理機能の提案
企業等に蓄積されたデータを分析するための処理機能の提案
 
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fallビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
ビッグデータ活用を加速する!分散SQLエンジン Spark SQL のご紹介 20161105 OSC Tokyo Fall
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪簡単!AWRをEXCELピボットグラフで分析しよう♪
簡単!AWRをEXCELピボットグラフで分析しよう♪
 
20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料20131113_mysql_on_分散fsセミナー資料
20131113_mysql_on_分散fsセミナー資料
 
Glue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみようGlue DataBrewでデータをクリーニング、加工してみよう
Glue DataBrewでデータをクリーニング、加工してみよう
 
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...
[db tech showcase Sapporo 2015] A26:SQL Server Data Page Structure Deep Dive ...
 
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章
20170714_MySQLドキュメントストア JSONデータ型&JSON関数 by 日本オラクル株式会社 MySQL GBU 山﨑由章
 
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
TAM 新人ディレクター システムスキルアップ プログラム 第6回 「データベース」
 
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ20221117_クラウドネイティブ向けYugabyteDB活用シナリオ
20221117_クラウドネイティブ向けYugabyteDB活用シナリオ
 
Visual studio online and Agile
Visual studio online and AgileVisual studio online and Agile
Visual studio online and Agile
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
Developers.IO 2019 Effective Datalake
Developers.IO 2019 Effective DatalakeDevelopers.IO 2019 Effective Datalake
Developers.IO 2019 Effective Datalake
 

見栄えだけのグラフを駆逐せよ! 意味あるデータの捉え方

Notas del editor

  1. 分析ではなくて「集計」で終ってないですか? 月次売上データを3年分取得するのは良いですが、得意先の購買額に影響を与える要素が検討されていないのでただ単なる集計で終わっていません? 検討するデータってそれで正しいですか? 得意先の属性「従業員数」は年間売上高と何か関係があるの?(関係ないのでは?)
  2. 私の大好きなコーヒーの価格が上昇してきています。 某投資会社の2011年10月のレポートでは、 コーヒー豆の国債価格の推移は 中国のコーヒー豆の輸入量推移と相関があるという 文書がありました。 確かに商品市況は需要が多ければ価格は上がりますが、本当でしょうか。
  3. 国際コーヒー機関(Intenational Coffee Organization [ICO])のデータより1991年から2017年の加盟国各国の小売価格の対前年比の平均と加盟国・非加盟国の輸入量を時系列比較しました。 (※輸入量は対数表示) 中国の輸入量(棒グラフ:エンジ色)の変化に応じて 小売価格の対前年比が変動していることが多いことから 中国の輸入量増に従って小売価格の世界平均が増えるように 見えます。
  4. もう少し深堀りするために、 先ほどのデータを元に輸入量の対前年比と小売価格の対前年比を時系列比較してみました。 輸入量の対前年比は左の軸です。 このグラフではICO参加国の小売価格の対前年比平均と中国の輸入量対前年比の挙動を比較すると同じ動きをしているようには思えません。
  5. では、中国の輸入量の前年比と小売価格の前年比が 同じ挙動をするのか 相関係数を使って確認してみましょう。 なんと、中国の輸入量の対前年と小売価格の対前年比の 相関は無いと考えられます。
  6. このレポートは何らかのに誤りがあると考えられます。 このレポートを書いた方と関係がある方がいらっしゃったらごめんなさい。
  7. コーヒー価格の事例に戻りますが、コーヒー価格と関係する要素はこの通りかと考えます。 コーヒーの小売価格は消費量との需給バランスに加え、 投機的要因も含まれます。 また、生産量に基づいて生産者価格が決まり、その小売価格は生産者価格の影響を受けます。 輸出入も関連します。
  8. レポートでは、輸入量と小売価格の関係を見ていましたが、 関連性があまりない者同士を比較していることとなり、 何か変な感じがします。
  9. 生産量・消費量の需給バランスと価格、 投機的要因を含まない生産者価格を比較するのが 現実の正しい理解ではないでしょうか。
  10. 現実の正しい理解をモデル化するため、 今回の主題である「システム思考モデリング」を使用して 考えてみました。 システム思考では物事を『フロー』と 『ストック』に分けて識別します。 このモデルでは「世界在庫量」をストックとして、 その他をフローとして識別します。 ストックは囲み、フローは矢印で表現します。 フローは、ストックを増加させる影響がある場合にはプラス記号、減少させる影響がある場合には-記号を付けて表現します。 輸出入はWorldWideで考えると≒0であるため、 価格に影響を与えないものとします。 従って、生産量と消費量の需給バランスが 価格に影響を与えるものとします。 需給バランスは 生産量に対して消費量がどのくらいかけ離れているかを考えるため、消費量が生産量の何倍あるかをこのモデルでは使用します。 価格には生産者価格と小売価格があり、小売価格は投機的要因が反映されます。 需給バランスのみで考えると生産者価格と比較するのが比較対象として単純なモデルになります。
  11. では、システム思考モデリングにより整理した「消費倍率」・「生産者価格の変化率」を比較してみましょう。 このグラフは国際連合食料農業機関(Food and Agricultur Organizagion [FAO])のデータより取得した1991年から2013年の消費量と生産量、生産者価格を元に消費倍率と生産者価格の変化率を時系列で比較したものです。 FAOから取得できるデータは2013年までであったためその点ご了承ください。 消費倍率と生産者価格の変化率1994年を特異点と考えるとは似たような傾向です。
  12. では、相関係数を確認してみましょう。 相関があるとは言い切れませんが、似た傾向を持っていると考えられます。 少なくとも投資会社のレポートよりは説明がつきそうです。