SlideShare una empresa de Scribd logo
1 de 12
Descargar para leer sin conexión
セイバーメトリクス
Tokyo.R
2013.2.23
自己紹介
2
twitter @argyle320
勤務先 IT分野のリサーチ会社
データ分析歴 約18年
R歴 2年
Twitterの写真
(円空仏)
参考書籍
3
ワイン方程式 (前回LT)
セイバーメトリクスとは?
• SABRmetrics
「SABR」=Society for American Baseball Research(アメリカ野球学会)
• 統計学の視点で選手の評価指標や戦略を洗いなおす
• 1970年代にビル・ジェイムスが自主出版で提唱
• 当初はMLB+メディアからは冷淡な扱い
• アスレチックス(マネーボール)やレッドソックスの成功
でMLBでも広がりつつある
• 日本でも千葉ロッテマリーンズが導入
4
データ分析による経営改善の事例
使われている統計手法
• 平均・標準偏差
• 直線回帰 (決定係数なし)
• 二乗平均平方根誤差 (相関係数なし)
• 確率、期待値、条件付き確率 (場合分け、樹形図)
• 打率の移動平均
• 散布図、ヒストグラム、箱ひげ図
5
そんなに高度な手法を使っているわけではない
なにがすごいか
• 野球の評価指標の再定義
• 細かい場合分け
6
野球の評価指標の再定義
• 旧来の指標はチームと選手の力を正しく評価してい
ない
– 打率、打点、自責点、防御率、エラー、・・・
– 運と能力が混在している
• ジェイムスによるチーム得点予測式
7
得点数=(安打数+四球数)×塁打数÷(打数+四球数)
野球の評価指標の再定義
• 攻撃力は出塁率と長打率がカギ。安打より四球
• 投手の評価指標・・・DIPS
– 本塁打、四球、死球、三振だけが投手の能力を純粋に表す指標
– 安定している+翌年の成績との相関が高い
8
OPS 出塁率+長打率
NOI (出塁率+長打率÷3)×1000
GPA (出塁率×1.8+長打率)÷4
SecA (塁打-安打+四球+盗塁- 盗塁死)÷打数
細かい場合分け
9
アウト数は非常に貴重
送りバント 低打率の打者なら有効(投手など)
盗塁 成功確率が0.6以上でないと得点見込みは減少
敬遠
強打者のボンズが相手だとしても、敬遠が有効な場面は
限られる (2アウトで一塁が空いている場合のみ)
セイバーメトリクスから学ぶ点
• 基本的な統計手法でも有用な分析はできる
• Big dataでなくても有用な分析はできる
• 対象とデータを深く見ることが重要
• 素人が統計分析だけで切り込んでも受けが悪い
10
MLBの10年間の全試合の投球データ数は?
30球団×162試合×150球×10年=729万レコード
オマケ
• 2012のパ・リーグの打率王はロッテの角中勝也
• 受賞コメント「出塁率を上げたい」
• 打率で表彰されておいて「出塁率」か???
• セイバーメトリクスらしいコメント
• きっと査定で使われているんだ
11
ご清聴ありがとうございました
12

Más contenido relacionado

Destacado

「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」Nagi Teramo
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Yohei Sato
 
Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Nobuaki Oshiro
 
ニコニコ動画タグネットワーク
ニコニコ動画タグネットワークニコニコ動画タグネットワーク
ニコニコ動画タグネットワークTeruki Shinohara
 
偽相関と偏相関係数
偽相関と偏相関係数偽相関と偏相関係数
偽相関と偏相関係数Teruki Shinohara
 
Rで実験計画法 後編
Rで実験計画法 後編Rで実験計画法 後編
Rで実験計画法 後編itoyan110
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料tetsuro ito
 
Extend R with Rcpp!!!
Extend R with Rcpp!!!Extend R with Rcpp!!!
Extend R with Rcpp!!!mickey24
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側Takekatsu Hiramura
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション宏喜 佐野
 
R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦! R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦! Yurie Oka
 
Rから利用するオープンデータAPI
Rから利用するオープンデータAPIRから利用するオープンデータAPI
Rから利用するオープンデータAPIs3works
 
相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性もT T
 

Destacado (20)

外れ値
外れ値外れ値
外れ値
 
Tokyo r30 anova
Tokyo r30 anovaTokyo r30 anova
Tokyo r30 anova
 
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
「plyrパッケージで君も前処理スタ☆」改め「plyrパッケージ徹底入門」
 
Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門Tokyo r12 - R言語による回帰分析入門
Tokyo r12 - R言語による回帰分析入門
 
R-3.0.0でGLM
R-3.0.0でGLMR-3.0.0でGLM
R-3.0.0でGLM
 
ESS
ESSESS
ESS
 
Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33Doradora09 lt tokyo_r33
Doradora09 lt tokyo_r33
 
ニコニコ動画タグネットワーク
ニコニコ動画タグネットワークニコニコ動画タグネットワーク
ニコニコ動画タグネットワーク
 
偽相関と偏相関係数
偽相関と偏相関係数偽相関と偏相関係数
偽相関と偏相関係数
 
Rで実験計画法 後編
Rで実験計画法 後編Rで実験計画法 後編
Rで実験計画法 後編
 
rzmq
rzmqrzmq
rzmq
 
第31回TokyoR LT資料
第31回TokyoR LT資料第31回TokyoR LT資料
第31回TokyoR LT資料
 
Extend R with Rcpp!!!
Extend R with Rcpp!!!Extend R with Rcpp!!!
Extend R with Rcpp!!!
 
中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側中の人が語る seekR.jp の裏側
中の人が語る seekR.jp の裏側
 
Tokyo r30 anova_part2
Tokyo r30 anova_part2Tokyo r30 anova_part2
Tokyo r30 anova_part2
 
第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション第32回Tokyo.R#初心者セッション
第32回Tokyo.R#初心者セッション
 
R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦! R+pythonでKAGGLEの2値予測に挑戦!
R+pythonでKAGGLEの2値予測に挑戦!
 
Abテストと検定
Abテストと検定Abテストと検定
Abテストと検定
 
Rから利用するオープンデータAPI
Rから利用するオープンデータAPIRから利用するオープンデータAPI
Rから利用するオープンデータAPI
 
相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も相関係数と決定係数~回帰係数とその不偏性も
相関係数と決定係数~回帰係数とその不偏性も
 

Más de Mitsuo Shimohata

Más de Mitsuo Shimohata (6)

決定木学習
決定木学習決定木学習
決定木学習
 
ハイブリッド型樹木法
ハイブリッド型樹木法ハイブリッド型樹木法
ハイブリッド型樹木法
 
相関係数は傾きに影響される
相関係数は傾きに影響される相関係数は傾きに影響される
相関係数は傾きに影響される
 
因子分析
因子分析因子分析
因子分析
 
ワイン方程式
ワイン方程式ワイン方程式
ワイン方程式
 
質的変数の相関・因子分析
質的変数の相関・因子分析質的変数の相関・因子分析
質的変数の相関・因子分析
 

セイバーメトリクス