16. 多重代⼊法
1. ⽋損値を予測するモデルを複数作る (m個とする)
2. それらm個のモデルから、m個の⽋損値を推定
3. m個の推定値を補完したm個の完全データセットを作る
4. m個の完全データセットそれぞれを使って、本来の⽬的変
数の推定値をm個得て、これを統合して1つの最終結果に
する
yi = wT
i x (i = 1, 2, ..., m)
CT
28. 参考⽂献
• ⽋測データ処理 Rによる単⼀代⼊法と多重代⼊法, ⾼橋将宜・渡辺美智⼦, 共⽴出版
• それを捨てるなんてとんでもない, https://www.slideshare.net/kato_kohaku/
imputation-of-missing-values-using-random-forest
• Random Forest missing data algorithms, Fei Tang and Hemant Ishwaran,
http://www.ccs.miami.edu/~hishwaran/papers/TI_SADM_2017.pdf
• Missing Data with Chained Equations, Melissa J. Azur, Elizabeth A.
Stuart, Constantine Frangakis, and Philip J. Leaf, https://
www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/
• keynoteに貼るSyntax Highlight, https://qiita.com/koudaiii/items/
1a9503141212a2115485