4. コンペティション概要(問題設定)
• Quoraに投稿された質問文で、不適切な質問かどうかを識別するタスク(2値分類)
• 猥褻的な表現を含む質問(Bag-of-wordsでもある程度識別できそう)
• Which races have the smallest penis?
• Would you date a girl who had sex with a horse or a bull?
• 差別的、攻撃的な質問(単語レベルでは判断が難しそう)
• Do all women tell lies?
• Why do Indians not gives a shit on Pakistan?
• 事実に基づかない質問(単語レベルでは判断が難しそう)
• Why did an 0bama fan kill ovr 50 people in Las Vegas?
• Why is the US so good at brainwashing?
• 正例が少ない不均衡なクラス分類問題
• 負例 : 正例 ≒ 15 : 1
• 評価指標 : F1 score
6. コンペティションでのポイント
• 精度と計算コストのバランスが取れたモデルの選択
• 少数の大きなモデルで単体の性能勝負 vs 多数の小さなモデルでアンサンブル勝負
• 計算コスト削減方法
• 前処理・訓練時に行う処理をいかに効率化できるか
• 提供された学習済みword embeddingの活用法、含まれない単語の処理方法
• 表記揺れレベルの差異、ドメインの差分をどう埋めるか
• Public LBのスコアだけに頼らないsubmission戦略
• public test set は private test set と比較してデータが少なく、スコアが信用できない
(public: 5.6万件 vs private: 37.6万件)