Enviar búsqueda
Cargar
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
•
13 recomendaciones
•
4,041 vistas
Hisao Soyama
Seguir
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
Leer menos
Leer más
Datos y análisis
Vista de diapositivas
Denunciar
Compartir
Vista de diapositivas
Denunciar
Compartir
1 de 34
Descargar ahora
Descargar para leer sin conexión
Recomendados
強化学習その3
強化学習その3
nishio
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
MCMC法
MCMC法
MatsuiRyo
PRML8章
PRML8章
弘毅 露崎
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
hoxo_m
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
Recomendados
強化学習その3
強化学習その3
nishio
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
マルコフ連鎖モンテカルロ法 (2/3はベイズ推定の話)
Yoshitake Takebayashi
MCMC法
MCMC法
MatsuiRyo
PRML8章
PRML8章
弘毅 露崎
Rで架空データの発生
Rで架空データの発生
Makoto Hirakawa
クラシックな機械学習入門:付録:よく使う線形代数の公式
クラシックな機械学習入門:付録:よく使う線形代数の公式
Hiroshi Nakagawa
階層モデルの分散パラメータの事前分布について
階層モデルの分散パラメータの事前分布について
hoxo_m
グラフィカルモデル入門
グラフィカルモデル入門
Kawamoto_Kazuhiko
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定
Joe Suzuki
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
PRMLrevenge_3.3
PRMLrevenge_3.3
Naoya Nakamura
Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)
Takashi J OZAKI
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
Chapter2.3.6
Chapter2.3.6
Takuya Minagawa
Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)
Kohta Ishikawa
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
Hakky St
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
Shuyo Nakatani
PRML2.4 指数型分布族
PRML2.4 指数型分布族
hiroki yamaoka
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
Yuya Takashina
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
Ken'ichi Matsui
PRML第3章@京大PRML輪講
PRML第3章@京大PRML輪講
Sotetsu KOYAMADA(小山田創哲)
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
Yasuyuki Okumura
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度
Masa Kato
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
Shuyo Nakatani
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
Hisao Soyama
『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ
Hisao Soyama
Más contenido relacionado
La actualidad más candente
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
shima o
相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定
Joe Suzuki
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
ARISE analytics
PRMLrevenge_3.3
PRMLrevenge_3.3
Naoya Nakamura
Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)
Takashi J OZAKI
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Shiga University, RIKEN
Chapter2.3.6
Chapter2.3.6
Takuya Minagawa
Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)
Kohta Ishikawa
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
takehikoihayashi
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
Hakky St
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
Takao Yamanaka
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
Shuyo Nakatani
PRML2.4 指数型分布族
PRML2.4 指数型分布族
hiroki yamaoka
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
Yuya Takashina
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
Ken'ichi Matsui
PRML第3章@京大PRML輪講
PRML第3章@京大PRML輪講
Sotetsu KOYAMADA(小山田創哲)
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
Yasuyuki Okumura
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
西岡 賢一郎
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度
Masa Kato
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
Shuyo Nakatani
La actualidad más candente
(20)
階層ベイズによるワンToワンマーケティング入門
階層ベイズによるワンToワンマーケティング入門
相互情報量を用いた独立性の検定
相互情報量を用いた独立性の検定
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
PRMLrevenge_3.3
PRMLrevenge_3.3
Granger因果による時系列データの因果推定(因果フェス2015)
Granger因果による時系列データの因果推定(因果フェス2015)
因果探索: 基本から最近の発展までを概説
因果探索: 基本から最近の発展までを概説
Chapter2.3.6
Chapter2.3.6
Rでisomap(多様体学習のはなし)
Rでisomap(多様体学習のはなし)
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
劣モジュラ最適化と機械学習1章
劣モジュラ最適化と機械学習1章
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
ノンパラベイズ入門の入門
ノンパラベイズ入門の入門
PRML2.4 指数型分布族
PRML2.4 指数型分布族
グラフィカル Lasso を用いた異常検知
グラフィカル Lasso を用いた異常検知
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
基礎からのベイズ統計学 輪読会資料 第4章 メトロポリス・ヘイスティングス法
PRML第3章@京大PRML輪講
PRML第3章@京大PRML輪講
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
ブラックボックスからXAI (説明可能なAI) へ - LIME (Local Interpretable Model-agnostic Explanat...
敵対的学習に対するラデマッハ複雑度
敵対的学習に対するラデマッハ複雑度
星野「調査観察データの統計科学」第3章
星野「調査観察データの統計科学」第3章
Destacado
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
Hisao Soyama
『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ
Hisao Soyama
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Hisao Soyama
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
Hisao Soyama
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論
Hisao Soyama
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
Hisao Soyama
みんなで使おう京都データストア・ワークショップ
みんなで使おう京都データストア・ワークショップ
Department of Policy Planning, Kyoto Prefectural Government
Matrix
Matrix
Hisao Soyama
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
Hisao Soyama
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
Hisao Soyama
SQL Developerって必要ですか? 株式会社コーソル 河野 敏彦
SQL Developerって必要ですか? 株式会社コーソル 河野 敏彦
CO-Sol for Community
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
Hisao Soyama
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
Toshihiro Kamishima
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Yasutomo Kawanishi
学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)
考司 小杉
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
Shinichi Nakagawa
PyMC mcmc
PyMC mcmc
Xiangze
Destacado
(17)
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
本当に知ってる!? リアルなデータ分析の世界~サイカのエンジニアが語る、話題の技術の「いま」と「未来」~
『アジャイルデータサイエンス』2章 データ
『アジャイルデータサイエンス』2章 データ
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
Pythonによるソーシャルデータ分析―わたしはこうやって修士号を取得しました―
10分でわかるPythonの開発環境
10分でわかるPythonの開発環境
『アジャイルデータサイエンス』1章 理論
『アジャイルデータサイエンス』1章 理論
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
大学生のTwitter利用に関する定量分析―利用目的とサービス設計の関係―
みんなで使おう京都データストア・ワークショップ
みんなで使おう京都データストア・ワークショップ
Matrix
Matrix
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
『オープンソースで学ぶ社会ネットワーク分析』1章 イントロダクション
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
グラフデータベース「Neo4j」の 導入の導入(続き)-Cypherの基本のキ-
SQL Developerって必要ですか? 株式会社コーソル 河野 敏彦
SQL Developerって必要ですか? 株式会社コーソル 河野 敏彦
グラフデータベース「Neo4j」の 導入の導入
グラフデータベース「Neo4j」の 導入の導入
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
PyMCがあれば,ベイズ推定でもう泣いたりなんかしない
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
Pythonによる機械学習入門 ~SVMからDeep Learningまで~
学部生向けベイズ統計イントロ(公開版)
学部生向けベイズ統計イントロ(公開版)
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
野球Hack!~Pythonを用いたデータ分析と可視化 #pyconjp
PyMC mcmc
PyMC mcmc
階層ベイズでプロ野球各球団の「本当の強さ」を推定してみる
1.
階層ベイズで プロ野球各球団の 「本当の強さ」を 推定してみる @who_you_me
2.
2016年 いろいろなことがありました
3.
ショッキングな出来事
4.
http://www.nikkansports.com/baseball/news/1730991.html (2017年1月8日閲覧)
5.
ちょっと待ってほしい
6.
日本シリーズ勝者 = 一番強いチーム なのか?
7.
私怨で言ってるんじゃなくて 統計の話がしたいんですよ私は ● Cの真の勝率が0.6、Fの真の勝率が0.4のと き、4勝2敗以上の成績でFが勝者となる確率 – 0.1792
8.
私怨で言ってるんじゃなくて 統計の話がしたいんですよ私は ● 「本当はCの方が強い場合でも17.9%の確率で 起こる現象」が実際に起こったからといってF の方が強いって言えますか奥さん – フォーマルに言うと「Cの真の勝率が0.6という帰 無仮説を有意水準0.05で棄却できない」
9.
私怨で言ってるんじゃなくて 統計の話がしたいんですよ私は ● 日本シリーズは「先に4勝した方が勝ち」 ● (引き分けを考慮しないと)最大7試合しかな いので、日本シリーズ勝者 = 真の強者である と主張することは難しい そもそも今はクライマックスシリーズがあるので議論はさらに面倒なことに
10.
ではどうすればよいか
11.
ではどうすればよいか ● 半年かけて年間143試合もやっているので、 「シーズン順位(勝率) = 真の強さを反映」 とは言えそう ● ではシーズン勝率を見ればいいのか?
12.
よくない
13.
よくない理由 ● リーグ間には実力差があるので(パ>>>セ) 異なるリーグ間で勝率を単純に比較することは できない ● 交流戦はあるが、1チームあたり18試合しかな いので「交流戦順位 = 真の強さを反映」とも 言えない –
(だからこそ日本シリーズがある)
14.
シーズンの全勝敗情報を活かしつつ、 直接対決が少ないチーム同士でも 実力を比較できるような方法は ないのだろうか……
15.
ある
16.
ベイズモデリングだ!!!
17.
こんなデータセットを作る ● 1試合が1行の勝敗データ ● F対Hの対戦成績が15-9のとき、LoserがF、 WinnerがHの行が9個、逆の行が15個ある
18.
こうモデリングする 松浦(2016) p. 189
モデル式10-4を一部改変
19.
こうモデリングする
20.
「ベースの強さ」 ● 各チームごとに「ベースの強さ」がある – 「ベースの強さ」はチームごとに異なる ● 「ベースの強さ」は正規分布に従う – 「身長は正規分布する」と似たような感じ チームtの「ベースの強さ」(μt)は平均0、分散σμの正規分布に従う Tはチーム数(今回は12)
21.
22.
パフォーマンス ● 毎試合「ベースの強さ」どおりのパフォーマン スが出せるわけではない ● 試合ごとのパフォーマンスは「ベースの強さ」 を平均とする正規分布に従う g試合目のチームtのパフォーマンスは平均μt(チームtの「ベースの強さ」)、 分散σtの正規分布から生成される Gは試合数(今回は840) σtの分布については識別性の話をしなければならなくなるので ここではスルーさせてください
23.
勝敗 ● パフォーマンスが高い方が勝つ – パフォーマンスは確率的に決まるので、たまたま 「調子の悪い日」と「調子の良い日」が重なれば、 弱者が強者に勝つこともある g試合目の勝者(W)のパフォーマンスは、敗者(L)のパフォーマンスを上回っている 引き分けはモデルに組み込むのが大変そうだったので除外しています
24.
25.
再掲 松浦(2016) p. 189
モデル式10-4を一部改変
26.
パラメータを推定する ● 以上のストーリーに沿いモデルを作成 ● 実際の勝敗データで学習し、「ベースの強さ」 のパラメータ(と他のパラメータ)を推定する パラメータの分布についての議論はより高度な知識が必要になるのでここでは割愛し、 事後分布の平均値で点推定しています σtの推定値についても今回の議論の本筋とはあまり関係がないので割愛します
27.
実際にやってみた ● データは手入力 – 12x12のセルを埋めるだけなので ● 前処理やグラフ描画はPython ● パラメータの推定にはStan – ベイズ推定が得意な確率的プログラミング言語 –
PyStanを使ってPythonから扱う ● pandasでごにょごにょしたデータをまんま渡せて便利
28.
29.
結果
30.
31.
32.
考察 ● リーグの実力差を反映したスコアになっている – 日本ハム(パ勝率.621) >
広島(セ勝率.631) – オリックス(パ勝率.407) > 中日(セ勝率.414)
33.
参考文献 東京大学教養学部統計学教室(1992)『自然科学の統計学』 東京大学出版会 松浦健太郎(2016)『StanとRでベイズ統計モデリング』 共立出版
34.
おしまい
Descargar ahora