Más contenido relacionado La actualidad más candente (20) Más de takehikoihayashi (10) 因果推論の奥へ: "What works" meets "why it works"18. 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
相関と因果がズレるとき|
なし あり
肥料X
糖
度
Y
「肥料X→リンゴの糖度Y」の散布図(1品種ver)
+2.1
各処理グループ
平均の差(+2.1)
「真の因果効果(+2)」
≒
散布図上での差を
因果効果として
そのまま解釈可能
=バイアスなし
ここでのバイアスの定義=
「真の因果効果」と「観測された処理
グループ平均の差」の系統的なズレ
20. 3
8
−1 0 1 2 3
3
8
12
16
20
−1 0 1 2 3
相関と因果がズレるとき|
なし あり
肥料X
糖
度
Y
「肥料X→リンゴの糖度Y」の散布図(2品種ver)
+4.4 各処理グループ
平均の差(+4.4)
「真の因果効果(+2)」
≠
(他の設定は同⼀でも)
2種類の品種が
混在するだけで
バイアスが⽣じる
異質性がバイアスを⽣む
21. 相関と因果がズレるとき|
品種が混在するときは必ずバイアスが⽣じる?
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
16
20
16
20
16
20
+4.4+2.0-0.8
なし あり
肥料X
糖
度
Y
なし あり
肥料X
なし あり
肥料X
40/10 10/40 25/25 25/25 40/1010/40
「品種の⽐率」が処理グループ間で同じとき
にはバイアスが⽣じない
ぺこ/すまいる比(総数ではぺこ50個/すまいる50個)
22. 8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
8
12
16
20
−1 0 1 2 3
相関と因果がズレるとき|
品種が混在するときは必ずバイアスが⽣じる?
+3.3+2.2+0.8
なし あり
肥料X
糖
度
Y
なし あり
肥料X
なし あり
肥料X
ぺこ/すまいる比
8/42 2/48 5/45 5/45 8/422/48
「品種の⽐率」が処理グループ間で同じとき
にはバイアスが⽣じない
(総数ではぺこ10個/すまいる90個)
ここ⼤事
66. +補⾜| 下流の変数の追加は”partly”に機能する
X Y
Z Z’
Z’の固定により
部分的に
バックドアパスが
閉じる
Surrogate variableしか測定されていないときも
追加しておいたほうがベターな場合も多い
「部分的」の程度はZとZ’の関連の強さに応じて決まる
X Y
Z Z’
Z’の固定により
部分的に
双⽅向パスが開く
X
Y
Z
Z’の固定により
部分的に
因果効果が
ブロックされる
Z’
Zが分岐点 Zが合流点 Zが中間点
69. ステップ6 | "まとめ"としてのバックドア基準
「バックドア基準」のカジュアル⾔い換え版
林・⿊⽊(2016)『相関と因果と丸と⽮印の話』 p44より引⽤
■
「相関関係」と「因果関係」は違います。これはよく知られています。ある要
因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ
らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関
を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと
ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て
「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。
このとき,「この場合はこれこれこうだからこの相関関係は因果関係として解釈
できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは,
それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中
でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか
なか難しいものです。
私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して
いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な
ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん
出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構
造が「あ
・
る
・
特
・
定
・
の
・
条
・
件
・
群
・
」を満たしているかどうかを相手と共同で検討していき
ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると
解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど
のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ
端的な議論ができるようになります。
相関と因果と丸と矢印のはなし
はじめてのバックドア基準
林岳彦(国立環境研究所)・黒木学(統計数理研究所)
[特集]因果推論 現実の課題に答える統計学
93. 補⾜|Morgan and Winship (2015)での因果推論⼿法の説明
[第III章]
観測された変数で条件付けして
バックドアパスをブロックでき
るときの因果効果の推定法
[第IV章]
バックドアパスの条件付けが
ineffectiveなときの因果効果の
推定法
マッチング
回帰による推定
重み付け回帰による推定
バックドアパスを条件付けするとは
どういうことか(バックドア基準)
バックドアパスの条件付けが
ineffectiveとはどういうことか
操作変数法
メカニズムと因果的説明
繰り返し観測
観測済変数でバックドアパスを閉められるか否かで
介⼊効果推定における⼿法選択の⼤⽅針が決まる
III.1
III.2
III.3
III.4
IV.1
IV.2
IV.3
IV.4
傾向スコア
Doubly-Robust
フロントドア基準
回帰分断デザイン
IV
101. 林岳彦・⿊⽊学(2016)
「相関関係」と「因果関係」は違います。これはよく知られています。ある要
因 X ともうひとつの要因 Y のあいだに高い相関が見られたからといって,それ
らのあいだに因果的な関係があるとは限りません。一方で,そのような高い相関
を「因果関係」として解釈できる場合もたしかにあります。この辺りが難しいと
ころです。もしあなたの同僚やクライアントが,あなたが作成した散布図を見て
「相関関係」と「因果関係」を明らかに混同した発言をしはじめたとしましょう。
このとき,「この場合はこれこれこうだからこの相関関係は因果関係として解釈
できるんですよ/できないんですよ」と相手に向かって理路整然と説明するのは,
それほど簡単なことではありません。こと因果関係の話になると,自分の頭の中
でその内容を整理するのも,その内容を相手に伝わるように説明するのも,なか
なか難しいものです。
私たちの経験上,そんなときにとても役に立つのは,データの背後に想定して
いる「因果構造(データ生成のメカニズム)」についての(分かる範囲での)簡単な
ポンチ絵を丸と矢印で描いてみせることです[本稿ではそんなポンチ絵の例がたくさん
出てきます]。そして,そのようなポンチ絵を描いたあとに,その描かれた因果構
造が「あ
・
る
・
特
・
定
・
の
・
条
・
件
・
群
・
」を満たしているかどうかを相手と共同で検討していき
ます。多くの場合,その検討を通して「この相関関係は因果関係を示していると
解釈してよいのか?」や「相関関係を因果関係として解釈するためには本来はど
のようなデータが必要なのか?」といった本質的な問いについて,より明確かつ
端的な議論ができるようになります。
相関と因果と丸と矢印のはなし
はじめてのバックドア基準
林岳彦(国立環境研究所)・黒木学(統計数理研究所)
[特集]因果推論 現実の課題に答える統計学
参考⽂献 | バックドア基準の解説原稿 (本⽇の元ネタ)
2016年6⽉発売「岩波データサイエンスvol. 3」因果推論特集号
117. 潜在反応モデルと関数的因果モデル|
潜在反応モデルを関数的因果モデルで構成する
𝑌<(ぴかそ) = 𝑓(𝑋, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
「ぴかそ」の特性を表す全変数
𝑌E(ぴかそ) = 𝑓(𝑋 = 0, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
𝑌@(ぴかそ) = 𝑓(𝑋 = 1, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
処理X
潜在反応の”中⾝”を関数𝑓と
変数𝑍で表現している
ぴかそ
118. 潜在反応モデルと関数的因果モデル|
例えば全特性が近似的に等しい個体がいれば…
𝑌4(たつや) = 𝑓(𝑋 = 𝑥, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
𝑌4(かずや) = 𝑓(𝑋 = 𝑥, 𝑍1, 𝑍2, 𝑍3, . . , 𝑍𝑛)
もし「たつや」「かずや」という双⼦がいて
もし関数𝑓および変数𝑍が近似的に等しければ
𝑌@ たつや − 𝑌E たつや ≒ 𝑌@ たつや − 𝑌E かずや
これは観測可能!
「関数と特性」で潜在反応の”中⾝”を語りうる
観測不可能な因果効果
潜在反応の脱ブラックボックス化
119. 潜在反応モデルと関数的因果モデル|
ねこ集団Aへの平均因果効果を考える
𝐸[𝑌<(ねこ集団𝐴)] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . . , 𝑍𝑛]
集団因果効果=𝑌@ ねこ集団𝐴 − 𝑌E ねこ集団𝐴
= 𝐸[𝑌@ ねこ集団𝐴|𝑋 = 1 ] − 𝐸[𝑌E ねこ集団𝐴|𝑋 = 0 ]
𝐸[𝑌@ ねこ集団𝐴|𝑋 = 1 ] = 𝐸[𝑓 𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛 𝑋 = 1 ]
𝐸[𝑌E ねこ集団𝐴|𝑋 = 0 ] = 𝐸[𝑓(𝑋, 𝑍1, 𝑍2, . . , 𝑍𝑛|𝑋 = 0)]
もしバックドア基準を満たす変数セットZ
においてこれらの分布が揃っている場合
潜在反応と因果構造の話はあっさり繋がっている
観測値から因果効果を推定可能!
131. 因果推論と「質的な研究」|
メカニズム/媒介の重要性(壊⾎病の例)
Pearl and Mackenzie (2018)の記述に基づく
シトラス→”酸味”→壊⾎病(の防⽌)
しかしmediatorの取り違えにより悲劇が・・・
シトラス→レモン→ライム→加熱濃縮ライムジュース
へと代替されていった(代替のたびにビタミンが減っていく・・)
状況が多様な“復路”の現場において”処理”の同⼀
性の担保は必ずしも簡単な話ではない
e.g., RCTのパイロットスタディが⾏われた”意識の⾼い”
学校と同⼀の”処理”を普通の学校で実現できるのか?
異なる対象/⽂脈における“処理”の同⼀性の担保
は質的な理解度(”why it works”)に依存する
132. 因果推論と「質的な研究」|
メカニズム/媒介の重要性(”Algebra for all”の例)
Pearl and Mackenzie (2018)の記述に基づく
Algebra for all Learning
Environment
1997年からシカゴで教育改⾰として”Algebra for
all”というプログラムが導⼊された
因果効果の計算からは効果が⾒られなかったが・・
質的な省察に基づきmediatorを考慮すると
直接効果と間接効果が打ち消し合っていた
カリキュラム⾃体の効果はあり、クラス編成の改
善で効果が上がる(”Why it works”の考慮による改善策の発⾒)
クラス編成の変化により成績下位者の意欲低下
+2.7pt
-2.3pt
134. 因果推論と「質的な研究」|
メカニズム/媒介の重要性(マシュマロ実験の再試験)
Shoda et al. (1990) マシュマロ実験
Watts et al. (2018)マシュマロ実験の再試験
「マシュマロを⾷べるのを我慢できた⼦/できな
かった⼦」の⻑期追跡により、⼦供の”delay of
gratification”の能⼒が、その後の学業や社会⾏動に
おける成功において重要であることを⽰唆した
より⼤きくかつ多様なsample of childrenを調査
より洗練された統計モデルを使⽤
”delay of gratification”と後のachievementの関係は
⼦供の背景要因と認知能⼒で調整すると⼤幅に減
少し、統計的に有意な関係もほぼ消えた
138. 因果推論と「質的な研究」|
個人
集団A 集団A’ 集団Σ
集団因果効果の
推定量
“往路”
“復路”
𝛼, 𝛽, 𝛾 …
エビデンス
の⽣産
個人個人
エビデンス
の利⽤
𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 …
トークンto
タイプ
EBPMにおける「RCT最強論」の半可通性
元ネタのEBMedicineは⼀定の
⽣物学的⻫⼀性を想定しうる
点で、EBPMと⼤きく異なる
「往路最強」かもだが、その強みのモデルフリー性
⾃体が”復路”での⼤きな脆弱性を⽣む(過信は禁物)
* Cf., Deaton and Cartwright 2017
⼀般にRCTの内部には異なる状況
間の”距離”に対する情報が皆無
? ? ? ?
?
141. 因果推論と「質的な研究」|
個人
集団A 集団A’ 集団Σ
集団因果効果の
推定量
“往路” “復路”
𝛼, 𝛽, 𝛾 …
エビデンス
の⽣産
個人個人
エビデンス
の利⽤
𝑎, 𝑏, 𝑐 … 𝑠, 𝑡, 𝑢 …
トークンto
タイプ
タイプto
トークン
質的な”⼿触り”の重要性:介⼊の⽂脈的な意味
例えばリスク・コミュニケーションの
現場では「数値」のナラティブ内での
位置づけまでの考慮が必要となる
往路で”誤差”として⽚付けた「断⽚的なもの」に
”復路”でふたたび向き合うべきときがある
こういう感覚が分からない⼈をコミュニケーター役にすると⼤抵ろくなことにならない
143. 因果推論と「質的な研究」|
III.のまとめ:“What works” meets “why it works”
概念と媒介(因果構造)を質的に吟味することは
因果推論のためにも重要(あたりまえだけど)
因果推論(what works)の解析プロトコルを適⽤
すると因果効果の推定量を算出できる(ありがたい)
解釈可能性の話が後景化して解析プロトコルの話
だけが独り歩きするのは本当によくない(実害がでる)
その推定量の内的and/or外挿的な解釈可能性は
”why it works”に本質的に依存する(ここも⼤事)
“往路”でトークンの”感触”が重要となる場合あり