1. The Selective Labels Problem:
Evaluating Algorithmic Predictions in the Presence of
Unobservables
Himabindu Lakkaraju, Jon Kleinberg, Jure Leskovec, Jens Ludwig, Sendhil Mullainathan
KDD 2017
paper friday 2018/10/26
Shota Yasui
17. 本番で起きること
17
ML model 再犯率予測:低
誤差:高
● 学習データでは消えていたような被告に対しても予測しなければならない
● 被告の年齢を通じて家族の聴講の効果を学習している
● よって、年齢が若いだけの被告に対しても再犯確率が低いという予測を行う
こういったモデルを投入する事は避けたい →オフラインの評価を改善する必要がある
ML model 再犯率予測:低
誤差:低