SlideShare una empresa de Scribd logo
1 de 28
Descargar para leer sin conexión
因果推論の基礎 
――ミクロ計量経済学の最近の潮流から―― 
森田果y 
hatsuru@law.tohoku.ac.jp 
y 東北大学大学院法学研究科 
法社会学会関東研究支部定例研究会(早稲田大学) 
2014 年12 月13 日 
森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
Introduction 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
Introduction 
伝統的な法学における実証分析の利用 
記述的推論 
データを要約統計量(summary statistics)・記述統計量(descritive 
statistics) の形にまとめる 
mean, median, maximum/minimum, variance など 
これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 
ある 
相関関係(correlation, association) の計算 
基本的にはOLS(最小二乗法による線形回帰)やクロス集計 
差の検定 
e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 
森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
Introduction 
最近の法学研究における実証分析の利用 
より政策的な方向へ 
consequentialism | 法ルールがその目的を達成できているかどうか? 
program evaluation と呼ばれる分野との接合 
単なる記述的推論ではなく,因果推論(causal inference)の重視 
相関関係ではなく,因果関係の評価 
経済学や政治学でのトレンドを反映 
医療でのEBM なども因果推論の世界(統計学の世界では裏でつな 
がっている) 
因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) 
よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 
仕組む)ことの方が重要 
森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
因果推論の根本問題 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
因果推論の根本問題 
基本概念 
a la RCM (Rubin Causal Model) 
unit: 対象 
treatment: 介入がなかった場合(=control)と比較して,それが 
あった場合の効果を測定したいと考えている(政策)介入 
potential outcomes: ユニットにtreatment があった場合となかった 
場合について,ユニットが取り得る(=まだ観察されていないもの 
である点に注意!)値 
counterfactual: 実現しなかった方のpotential outcome 
causal effect: 1 つ1 つのユニットについて,treatment があった場合 
のpotential outcome とtreatment がなかった場合のpotential 
outcome との間の差 
`The Fundamental Problem of Causal Inference': 私たちは,複数の 
potential outcome のうち,最大で1 個しか観察することはできない 
から,causal effect を直接観察することはできない 
森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
因果推論の根本問題 
具体例:単純な差分をとる場合 
ユニット=ある時点の「私」。頭痛がある。 
treatment =頭痛薬アスピリンの投与。 
Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ 
り得る。 
Unit 当初の頭痛potential outcomes Y へのcausal effect 
X Y (Asp) Y (Not) Y (Asp)  Y (Not) 
「私」80 25 75 -50 
森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
因果推論の前提条件 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
因果推論の前提条件 
基本概念:因果推論のための前提条件 
replication: 少なくとも1 つのユニットはtreatment を受け,少なく 
とも1 つのユニットはtreatment を受けない(control)。複数の対象 
の間のvariation でもいいし,単一の対象が異なる時点でvariation が 
あってもよい。 
SUTVA (stable unit-treatment-value assumption):2 つの内容がある 
a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, 
control も1 種類しかない 
b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し 
ない) 
assignment mechanism: どのユニットがtreatment を受け,どのユ 
ニットがcontrol になるかを決定するメカニズム 
森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
因果推論の前提条件 
Nユニット・処置2 つで,SUTVA が満たされるケース 
Unit X Y (1) Y (0) ユニットレベルの因果効果 
1 X1 Y1(1) Y1(0) Y1(1)  Y1(0) 
2 X2 Y2(1) Y2(0) Y2(1)  Y2(0) 
... 
... 
... 
... 
... 
i Xi Yi(1) Yi(0) Yi(1)  Yi(0) 
... 
... 
... 
... 
... 
N XN YN(1) YN(0) YN(1)  YN(0) 
森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
因果推論の前提条件 
population level の因果効果 
Yi(1) とYi(0) を比較するのが基本 
ただし,このようなユニットレベル因果効果を直接観察することは不 
可能なので,代わりに... 
1 と0 との間の平均因果効果average causal effect 
Ave[Yi(1)  Yi(0)] = 1 
N 
ΣN 
i=1(Yi(1)  Yi(0)) 
1 と0 との間のメディアン因果効果 
Median[Yi(1)  Yi(0)] 
などなど... を推定していくことになる 
森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
割当メカニズムの重要性 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
割当メカニズムの重要性 
割当メカニズム 
具体例=完璧な医者 
Potential Outcomes 
Unit Control Y (0) Treatment Y (1) 
1 13 14 
2 6 0 
3 4 1 
4 5 2 
5 6 3 
6 6 1 
7 8 10 
8 8 9 
`true' average 7 5 
average causal effect = -2 
森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
割当メカニズムの重要性 
割当メカニズム 
完璧な医者が,一人一人について最適な治療方法を適用すると: 
W は,treatment のあり(1) なし(0) を示す 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 ? 14 
2 0 6 ? 
3 0 4 ? 
4 0 5 ? 
5 0 6 ? 
6 0 6 ? 
7 1 ? 10 
8 1 ? 9 
`observed' average 5.4 11 
森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
割当メカニズムの重要性 
補完imputation による因果推論 
完璧な医者が最善を尽くしているとなると,欠損データの補完がで 
きる: 
Potential Outcomes 
Unit W Control Y (0) Treatment Y (1) 
1 1 14 14 
2 0 6 6 
3 0 4 4 
4 0 5 5 
5 0 6 6 
6 0 6 6 
7 1 10 10 
8 1 9 9 
`observed' average 7.5 7.5 
森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
割当メカニズムの重要性 
さまざまな割当メカニズム 
assignment mechanism: 観察される潜在的結果と欠損する潜在的結 
果を振り分けるもの: 
Pr(WjX; Y (0); Y (1)) 
混同的でないunconfounded 割当メカニズム:Pr(WjX) 
確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 
個別的なindividualistic 割当メカニズム: 
AM / ΠN 
i=1 Pr(WijXi; Yi(0); Yi(1)) 
古典的なランダム化実験: 
AM / 
ΠN 
i=1 Pr(WijXi) 
ちなみに,プロペンシティスコア(傾向スコアpropensity score): 
Pr(Wi = 1jXi) 
森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
ランダム化:特殊な割当メカニズム 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
ランダム化:特殊な割当メカニズム 
ランダム化=因果推論のもう一つの手法 
randomization =割当メカニズムを無作為なものとする(ただしX 
に依存させてもよい)ことで,treatment とcontrol とが「だいたい 
同じ」(もうちょっと言うと,共変量covariate がbalance している) 
状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 
む方法。基本的には,平均やメディアンなどを見る。 
最近のネット企業(典型例はfacebook: 
https://research.facebook.com/)は,ランダム化実験を実施し 
ている 
契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて 
いる 
開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 
うようになってきている 
けれども,社会科学においては,倫理的・法的な理由で,ランダム 
化実験を実施することができない場合がまだまだ多い 
森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
ランダム化:特殊な割当メカニズム 
観察データの分析をランダム化実験と同じようにデザイ 
ンするには 
1 デザイン段階が完了するまで,結果データは見ないようにする 
2 意思決定者(割当メカニズムを実行している者)がどのように考え 
て割当を行っているのかについて分析し,割当に際して鍵となって 
いる共変量を取り出す 
3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 
恐らくそのデータセットを使うのはあきらめて,別のデータセット 
を探した方が吉 
4 treatment/control グループが,バランスしている(=観察された共 
変量がほぼ同じような分布をしている)ようなサブグループを見つ 
け出す 
バランスしているかどうかには,分布を描いて目視してみることが 
有益 
必ずしも常に,十分なバランスが実現できるとは限らない 
この場合の推論は,当該サブグループの範囲内であることに注意 
森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
さまざまな因果推論の手法 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
さまざまな因果推論の手法 
マッチング 
ランダム化実験の基本アイデア 
treatment/control の間で,共変量にバランスがとれた状態を実現する 
それならば,treatment に属する各ユニットについて,共変量が「同 
じ」ユニットをcontrol から選び出してきて比較すれば良い: 
matching 
共変量が全く同じものをマッチング 
共変量ができるだけ近いものをマッチング 
propensity score でマッチング 
最近のビッグデータでは,かなり正確なマッチングが実現できるよ 
うになってきている 
cf. ビッグデータ関連では,EL も発展してきている(まだまだ 
applied の世界での実例はあまり見ないが...) 
森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
さまざまな因果推論の手法 
DD/DiD 
differences-in-differences: (Y1T (1)  Y0C(1))  (Y0T (0)  Y0C(0)) 
時点Treatment Control 
時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 
時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) 
Red texts are counterfactuals. 
私たちが知りたいもの:Y1T (1)  Y0T (1) 
一見,それらしそうな選択し: 
ビフォーアフター:Y1T (1)  Y0T (0) 
処置群vs コントロール群:Y1T (1)  Y0C(1) 
森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
さまざまな因果推論の手法 
DD/DiD 
森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
さまざまな因果推論の手法 
FE 
森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
さまざまな因果推論の手法 
IV/LATE 
confounded な割当メカニズムについても利用可能 
natural experiment を探す:instrumental variable 
具体例(Angrist のベトナム戦争徴兵制のくじ) 
従軍経験が賃金に与える影響の測定 
ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 
くじに「当選する」かどうかはランダムだが,くじに当選することに 
よって従軍確率が増加し,それによって賃金は左右される 
wrong IV とweak IV に注意 
wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ 
てだけ」というexclusion restriction [only through condition] が充足さ 
れない 
weak IV:IV と内生的な説明変数との相関関係が弱い 
また,IV はLATE (local average treatment effect on compliers) に過 
ぎない〔されどLATE〕 
complier = IV によって影響を受けるユニット 
森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
さまざまな因果推論の手法 
RD 
恣意的な規制・介入が存在している場合 
その規制の近傍では,ランダム化が実現しているはず 
それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 
できるはず 
具体例 
負債額に基づく規制の変化 
世帯収入に基づく社会保障給付の変化 
森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
因果推論と構造推定 
Outline 
1 Introduction 
2 因果推論の根本問題 
3 因果推論の前提条件 
4 割当メカニズムの重要性 
5 ランダム化:特殊な割当メカニズム 
6 さまざまな因果推論の手法 
7 因果推論と構造推定 
森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
因果推論と構造推定 
因果推論vs 構造推定 
因果推論:最小限の前提に依拠して,因果関係を推定 
伝統的な計量経済学における構造推定:世界が(経済学)モデルに 
したがって動いていると仮定した上で,モデルのパラメタを推定 
いわゆる構造方程式(SEM/structural equation model)とは違う 
両者の対立点 
internal validity vs external validity 
前提条件の明示 
経済学教育への影響 
分野の違い 
森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28

Más contenido relacionado

La actualidad más candente

グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
Koichiro Gibo
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
Shintaro Fukushima
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
takehikoihayashi
 

La actualidad más candente (20)

GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論GEE(一般化推定方程式)の理論
GEE(一般化推定方程式)の理論
 
グラフィカルモデル入門
グラフィカルモデル入門グラフィカルモデル入門
グラフィカルモデル入門
 
強化学習その3
強化学習その3強化学習その3
強化学習その3
 
多重代入法の書き方 公開用
多重代入法の書き方 公開用 多重代入法の書き方 公開用
多重代入法の書き方 公開用
 
星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章星野「調査観察データの統計科学」第1&2章
星野「調査観察データの統計科学」第1&2章
 
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
勾配ブースティングの基礎と最新の動向 (MIRU2020 Tutorial)
 
潜在クラス分析
潜在クラス分析潜在クラス分析
潜在クラス分析
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 
『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会『バックドア基準の入門』@統数研研究集会
『バックドア基準の入門』@統数研研究集会
 
Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門Rによるベイジアンネットワーク入門
Rによるベイジアンネットワーク入門
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 
社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森社会心理学者のための時系列分析入門_小森
社会心理学者のための時系列分析入門_小森
 
2 4.devianceと尤度比検定
2 4.devianceと尤度比検定2 4.devianceと尤度比検定
2 4.devianceと尤度比検定
 
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
Rによるやさしい統計学第20章「検定力分析によるサンプルサイズの決定」
 
DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)DARM勉強会第3回 (missing data analysis)
DARM勉強会第3回 (missing data analysis)
 
生存時間分析の書き方
生存時間分析の書き方生存時間分析の書き方
生存時間分析の書き方
 
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
 
構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性構造方程式モデルによる因果探索と非ガウス性
構造方程式モデルによる因果探索と非ガウス性
 
操作変数法の書き方_田淵貴大
操作変数法の書き方_田淵貴大操作変数法の書き方_田淵貴大
操作変数法の書き方_田淵貴大
 
探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット探索と活用の戦略 ベイズ最適化と多腕バンディット
探索と活用の戦略 ベイズ最適化と多腕バンディット
 

Similar a 因果推論の基礎

Fumitot ver.2.3
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3
FumitoT
 
「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門
yokomitsuken5
 
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
Yasuyuki Okumura
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
Issei Kurahashi
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
Yasuyuki Okumura
 

Similar a 因果推論の基礎 (20)

Gasshuku98
Gasshuku98Gasshuku98
Gasshuku98
 
明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス明日から読めるメタ・アナリシス
明日から読めるメタ・アナリシス
 
Fumitot ver.2.3
Fumitot ver.2.3Fumitot ver.2.3
Fumitot ver.2.3
 
「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門「診断精度研究のメタ分析」の入門
「診断精度研究のメタ分析」の入門
 
ソフトウェアテストの再検討
ソフトウェアテストの再検討 ソフトウェアテストの再検討
ソフトウェアテストの再検討
 
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
患者報告式アウトカム尺度における臨床的意味のある変化の定め方患者報告式アウトカム尺度における臨床的意味のある変化の定め方
患者報告式アウトカム尺度における 臨床的意味のある変化の定め方
 
ベイズ入門
ベイズ入門ベイズ入門
ベイズ入門
 
NL20161222invited
NL20161222invitedNL20161222invited
NL20161222invited
 
Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333Analysis of clinical trials using sas 勉強用 isseing333
Analysis of clinical trials using sas 勉強用 isseing333
 
GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定GRADEの基礎:概要と問題設定
GRADEの基礎:概要と問題設定
 
事前登録のやり方
事前登録のやり方事前登録のやり方
事前登録のやり方
 
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
2014年5月21日「パーティクルフィルタの癖から知るロボットへの確率的手法の正しい適用方法」---第58回システム制御情報学会研究発表講演会チュートリアル講演
 
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学明日から読める無作為化比較試験: 行動療法研究に求められる統計学
明日から読める無作為化比較試験: 行動療法研究に求められる統計学
 
Jcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライドJcors_2021年アドベントカレンダー企画スライド
Jcors_2021年アドベントカレンダー企画スライド
 
効果測定入門 Rによる傾向スコア解析
効果測定入門  Rによる傾向スコア解析効果測定入門  Rによる傾向スコア解析
効果測定入門 Rによる傾向スコア解析
 
データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散データサイエンス概論第一=1-3 平均と分散
データサイエンス概論第一=1-3 平均と分散
 
理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門理科教育学研究のための統計分析入門
理科教育学研究のための統計分析入門
 
20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処20170202 srws第七回統合、層別・感度分析、欠測への対処
20170202 srws第七回統合、層別・感度分析、欠測への対処
 
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
20160727 srws第七回@滋賀医大統合、層別・感度分析、欠測への対処
 
統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践統計学における相関分析と仮説検定の基本的な考え方とその実践
統計学における相関分析と仮説検定の基本的な考え方とその実践
 

因果推論の基礎

  • 1. 因果推論の基礎 ――ミクロ計量経済学の最近の潮流から―― 森田果y hatsuru@law.tohoku.ac.jp y 東北大学大学院法学研究科 法社会学会関東研究支部定例研究会(早稲田大学) 2014 年12 月13 日 森田(東北大) 実証分析入門演習Dec 13, 2014 1 / 28
  • 2. Introduction Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 2 / 28
  • 3. Introduction 伝統的な法学における実証分析の利用 記述的推論 データを要約統計量(summary statistics)・記述統計量(descritive statistics) の形にまとめる mean, median, maximum/minimum, variance など これだけでも,〔上手に行えば――King et al 1994〕分かることは結構 ある 相関関係(correlation, association) の計算 基本的にはOLS(最小二乗法による線形回帰)やクロス集計 差の検定 e.g., 男女(の平均賃金etc)の間に有意な差があるかどうかの検定 森田(東北大) 実証分析入門演習Dec 13, 2014 3 / 28
  • 4. Introduction 最近の法学研究における実証分析の利用 より政策的な方向へ consequentialism | 法ルールがその目的を達成できているかどうか? program evaluation と呼ばれる分野との接合 単なる記述的推論ではなく,因果推論(causal inference)の重視 相関関係ではなく,因果関係の評価 経済学や政治学でのトレンドを反映 医療でのEBM なども因果推論の世界(統計学の世界では裏でつな がっている) 因果推論では,推定手法(統計ソフトウェアが計算してくれる部分) よりも,リサーチデザイン(どこに因果関係を見いだすか,うまく 仕組む)ことの方が重要 森田(東北大) 実証分析入門演習Dec 13, 2014 4 / 28
  • 5. 因果推論の根本問題 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 5 / 28
  • 6. 因果推論の根本問題 基本概念 a la RCM (Rubin Causal Model) unit: 対象 treatment: 介入がなかった場合(=control)と比較して,それが あった場合の効果を測定したいと考えている(政策)介入 potential outcomes: ユニットにtreatment があった場合となかった 場合について,ユニットが取り得る(=まだ観察されていないもの である点に注意!)値 counterfactual: 実現しなかった方のpotential outcome causal effect: 1 つ1 つのユニットについて,treatment があった場合 のpotential outcome とtreatment がなかった場合のpotential outcome との間の差 `The Fundamental Problem of Causal Inference': 私たちは,複数の potential outcome のうち,最大で1 個しか観察することはできない から,causal effect を直接観察することはできない 森田(東北大) 実証分析入門演習Dec 13, 2014 6 / 28
  • 7. 因果推論の根本問題 具体例:単純な差分をとる場合 ユニット=ある時点の「私」。頭痛がある。 treatment =頭痛薬アスピリンの投与。 Y = 2 時間後の「私」の頭痛の評価。treatment の有無で,2 通りあ り得る。 Unit 当初の頭痛potential outcomes Y へのcausal effect X Y (Asp) Y (Not) Y (Asp) Y (Not) 「私」80 25 75 -50 森田(東北大) 実証分析入門演習Dec 13, 2014 7 / 28
  • 8. 因果推論の前提条件 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 8 / 28
  • 9. 因果推論の前提条件 基本概念:因果推論のための前提条件 replication: 少なくとも1 つのユニットはtreatment を受け,少なく とも1 つのユニットはtreatment を受けない(control)。複数の対象 の間のvariation でもいいし,単一の対象が異なる時点でvariation が あってもよい。 SUTVA (stable unit-treatment-value assumption):2 つの内容がある a) 1 つ1 つのユニットについて,同時で1 つのtreatment しか働かず, control も1 種類しかない b) ユニット間に干渉がない(spill over effect や一般均衡効果は存在し ない) assignment mechanism: どのユニットがtreatment を受け,どのユ ニットがcontrol になるかを決定するメカニズム 森田(東北大) 実証分析入門演習Dec 13, 2014 9 / 28
  • 10. 因果推論の前提条件 Nユニット・処置2 つで,SUTVA が満たされるケース Unit X Y (1) Y (0) ユニットレベルの因果効果 1 X1 Y1(1) Y1(0) Y1(1) Y1(0) 2 X2 Y2(1) Y2(0) Y2(1) Y2(0) ... ... ... ... ... i Xi Yi(1) Yi(0) Yi(1) Yi(0) ... ... ... ... ... N XN YN(1) YN(0) YN(1) YN(0) 森田(東北大) 実証分析入門演習Dec 13, 2014 10 / 28
  • 11. 因果推論の前提条件 population level の因果効果 Yi(1) とYi(0) を比較するのが基本 ただし,このようなユニットレベル因果効果を直接観察することは不 可能なので,代わりに... 1 と0 との間の平均因果効果average causal effect Ave[Yi(1) Yi(0)] = 1 N ΣN i=1(Yi(1) Yi(0)) 1 と0 との間のメディアン因果効果 Median[Yi(1) Yi(0)] などなど... を推定していくことになる 森田(東北大) 実証分析入門演習Dec 13, 2014 11 / 28
  • 12. 割当メカニズムの重要性 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 12 / 28
  • 13. 割当メカニズムの重要性 割当メカニズム 具体例=完璧な医者 Potential Outcomes Unit Control Y (0) Treatment Y (1) 1 13 14 2 6 0 3 4 1 4 5 2 5 6 3 6 6 1 7 8 10 8 8 9 `true' average 7 5 average causal effect = -2 森田(東北大) 実証分析入門演習Dec 13, 2014 13 / 28
  • 14. 割当メカニズムの重要性 割当メカニズム 完璧な医者が,一人一人について最適な治療方法を適用すると: W は,treatment のあり(1) なし(0) を示す Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 ? 14 2 0 6 ? 3 0 4 ? 4 0 5 ? 5 0 6 ? 6 0 6 ? 7 1 ? 10 8 1 ? 9 `observed' average 5.4 11 森田(東北大) 実証分析入門演習Dec 13, 2014 14 / 28
  • 15. 割当メカニズムの重要性 補完imputation による因果推論 完璧な医者が最善を尽くしているとなると,欠損データの補完がで きる: Potential Outcomes Unit W Control Y (0) Treatment Y (1) 1 1 14 14 2 0 6 6 3 0 4 4 4 0 5 5 5 0 6 6 6 0 6 6 7 1 10 10 8 1 9 9 `observed' average 7.5 7.5 森田(東北大) 実証分析入門演習Dec 13, 2014 15 / 28
  • 16. 割当メカニズムの重要性 さまざまな割当メカニズム assignment mechanism: 観察される潜在的結果と欠損する潜在的結 果を振り分けるもの: Pr(WjX; Y (0); Y (1)) 混同的でないunconfounded 割当メカニズム:Pr(WjX) 確率的なprobabilistic 割当メカニズム:Pr(Wi = 1jX; Y (0); Y (1)) 個別的なindividualistic 割当メカニズム: AM / ΠN i=1 Pr(WijXi; Yi(0); Yi(1)) 古典的なランダム化実験: AM / ΠN i=1 Pr(WijXi) ちなみに,プロペンシティスコア(傾向スコアpropensity score): Pr(Wi = 1jXi) 森田(東北大) 実証分析入門演習Dec 13, 2014 16 / 28
  • 17. ランダム化:特殊な割当メカニズム Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 17 / 28
  • 18. ランダム化:特殊な割当メカニズム ランダム化=因果推論のもう一つの手法 randomization =割当メカニズムを無作為なものとする(ただしX に依存させてもよい)ことで,treatment とcontrol とが「だいたい 同じ」(もうちょっと言うと,共変量covariate がbalance している) 状況に持ち込み,Yobs(1)Yobs(0) = Y (1) Y (0) となるように仕組 む方法。基本的には,平均やメディアンなどを見る。 最近のネット企業(典型例はfacebook: https://research.facebook.com/)は,ランダム化実験を実施し ている 契約法・消費者法などでも,ランダム化実験の活用はどんどん増えて いる 開発経済学などでも,ランダム化実験(フィールド実験)をかなり行 うようになってきている けれども,社会科学においては,倫理的・法的な理由で,ランダム 化実験を実施することができない場合がまだまだ多い 森田(東北大) 実証分析入門演習Dec 13, 2014 18 / 28
  • 19. ランダム化:特殊な割当メカニズム 観察データの分析をランダム化実験と同じようにデザイ ンするには 1 デザイン段階が完了するまで,結果データは見ないようにする 2 意思決定者(割当メカニズムを実行している者)がどのように考え て割当を行っているのかについて分析し,割当に際して鍵となって いる共変量を取り出す 3 この共変量が,入手できなかったり,ノイズの多いデータだったら, 恐らくそのデータセットを使うのはあきらめて,別のデータセット を探した方が吉 4 treatment/control グループが,バランスしている(=観察された共 変量がほぼ同じような分布をしている)ようなサブグループを見つ け出す バランスしているかどうかには,分布を描いて目視してみることが 有益 必ずしも常に,十分なバランスが実現できるとは限らない この場合の推論は,当該サブグループの範囲内であることに注意 森田(東北大) 実証分析入門演習Dec 13, 2014 19 / 28
  • 20. さまざまな因果推論の手法 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 20 / 28
  • 21. さまざまな因果推論の手法 マッチング ランダム化実験の基本アイデア treatment/control の間で,共変量にバランスがとれた状態を実現する それならば,treatment に属する各ユニットについて,共変量が「同 じ」ユニットをcontrol から選び出してきて比較すれば良い: matching 共変量が全く同じものをマッチング 共変量ができるだけ近いものをマッチング propensity score でマッチング 最近のビッグデータでは,かなり正確なマッチングが実現できるよ うになってきている cf. ビッグデータ関連では,EL も発展してきている(まだまだ applied の世界での実例はあまり見ないが...) 森田(東北大) 実証分析入門演習Dec 13, 2014 21 / 28
  • 22. さまざまな因果推論の手法 DD/DiD differences-in-differences: (Y1T (1) Y0C(1)) (Y0T (0) Y0C(0)) 時点Treatment Control 時点0 Y1T (0) Y0T (0) Y1C(0) Y0C(0) 時点1 Y1T (1) Y0T (1) Y1C(1) Y0C(1) Red texts are counterfactuals. 私たちが知りたいもの:Y1T (1) Y0T (1) 一見,それらしそうな選択し: ビフォーアフター:Y1T (1) Y0T (0) 処置群vs コントロール群:Y1T (1) Y0C(1) 森田(東北大) 実証分析入門演習Dec 13, 2014 22 / 28
  • 23. さまざまな因果推論の手法 DD/DiD 森田(東北大) 実証分析入門演習Dec 13, 2014 23 / 28
  • 24. さまざまな因果推論の手法 FE 森田(東北大) 実証分析入門演習Dec 13, 2014 24 / 28
  • 25. さまざまな因果推論の手法 IV/LATE confounded な割当メカニズムについても利用可能 natural experiment を探す:instrumental variable 具体例(Angrist のベトナム戦争徴兵制のくじ) 従軍経験が賃金に与える影響の測定 ベトナム戦争時の徴兵は,くじ:ランダムな自然実験 くじに「当選する」かどうかはランダムだが,くじに当選することに よって従軍確率が増加し,それによって賃金は左右される wrong IV とweak IV に注意 wrong IV:「IV が従属変数に影響するのは,内生的な説明変数を通じ てだけ」というexclusion restriction [only through condition] が充足さ れない weak IV:IV と内生的な説明変数との相関関係が弱い また,IV はLATE (local average treatment effect on compliers) に過 ぎない〔されどLATE〕 complier = IV によって影響を受けるユニット 森田(東北大) 実証分析入門演習Dec 13, 2014 25 / 28
  • 26. さまざまな因果推論の手法 RD 恣意的な規制・介入が存在している場合 その規制の近傍では,ランダム化が実現しているはず それであれば,近傍のデータを取り出せば,規制の有無の影響を測定 できるはず 具体例 負債額に基づく規制の変化 世帯収入に基づく社会保障給付の変化 森田(東北大) 実証分析入門演習Dec 13, 2014 26 / 28
  • 27. 因果推論と構造推定 Outline 1 Introduction 2 因果推論の根本問題 3 因果推論の前提条件 4 割当メカニズムの重要性 5 ランダム化:特殊な割当メカニズム 6 さまざまな因果推論の手法 7 因果推論と構造推定 森田(東北大) 実証分析入門演習Dec 13, 2014 27 / 28
  • 28. 因果推論と構造推定 因果推論vs 構造推定 因果推論:最小限の前提に依拠して,因果関係を推定 伝統的な計量経済学における構造推定:世界が(経済学)モデルに したがって動いていると仮定した上で,モデルのパラメタを推定 いわゆる構造方程式(SEM/structural equation model)とは違う 両者の対立点 internal validity vs external validity 前提条件の明示 経済学教育への影響 分野の違い 森田(東北大) 実証分析入門演習Dec 13, 2014 28 / 28