Más contenido relacionado Sports ranking4. Introduction : FIFA Ranking
Japan (19th) Bhutan (198th)
VS
WIN LOSE
Sweden (18th) Spain (1st)
VS
1勝の重みが全く違う !!
5. スポーツランキング
• サッカーに限らず,総当たり戦でないスポーツでは
対戦相手の強弱による不公平性が生じやすい.
(e.g. 自国の大陸との対戦が多くなる)
→ 単純に勝敗数でランキングを決めるのは不適
切
• 実際のランキングには不公平性を是正するためのルー
ルが設けられているが…
(e.g. 「強い」大陸の国ほど得られるスコアが大きい)
・ 複雑でわかりにくい場合が多い
・ 新たな不公平性を生むことも
• → ネットワークを用いたランキング手法
6. ネットワークを用いたランキング手法
• 頂点 = 選手 (or team)
• 1試合の勝者と敗者を有向辺で結ぶ.
• 各頂点の中心性 = 選手のランキング
• 計算方法 :
1. prestige score [Radicchi, 2011]
2. win-lose score [Park & Newman, 2005]
→ static ranking systems
7. Static and dynamic ranking
Static ranking
• 時間構造を無視.つまり,「選手の実力は不変」 と想定
– 実際には,選手の実力は時間に依存するはず.
Dynamic ranking
本研究の目的:
時間構造を導入し, 実力の変動を考慮し
た
ランキング手法を提案する.
8. Prestige score
• player i が player j に勝った回数: win lose
i
• : j が負けた総数 j
0<q<1
• 多くの相手に勝つほどスコアが上がる.
• 勝った相手のスコアが大きいほどスコアが上がる.
• 勝った相手の負け数 が小さいほどスコアが上がる.
• 負けの影響は直接は考慮されていない.
• PageRank と同じ
9. win-lose score (1)
• 1 は 2 に勝利 (距離 1)
2 は 3 に勝利 (距離 1)
→ 1 は 3 に間接的に勝利 (距離 2 )
1
間接勝利
• 2 は 1 に敗北 (距離 1)
3 は 2 に敗北 (距離 1) 2 3
→ 3 は 1 に間接的に敗北 (距離 2 )
10. win-lose score (2)
A = j が i に勝った回数を (i , j) 成分にもつ勝敗行列
i の距離 1 の勝利数 =
i の距離 2 の勝利数 =
i の距離 3 の勝利数 =
距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α < 1).
k = 1, 2, … で和をとる → i の win score wi
13. 例2
1
= A の最大固有値.
収束条件は
2 3
実際には全試合終了まで は不明なので, 上の条
件を満たすように を十分小さくする必要がある.
14. Static ranking の問題点
• Static ranking では対戦が行われた時刻に関する
情報がないため, 過去の対戦を たった今行われた
かのように扱う (実力を不変と想定)
• しかし,プレイヤーの実力が変化するスポーツは多い.
• デビュー当時の Federer に勝つことと10年後の Federer
に勝つことが同じ評価となる.
1
year year
2000 2010
2 3
15. Dynamic win-lose score (1)
• win-lose score を以下のように拡張した dynamic win-lose
score を提案する.
1. 間接的な勝ち負けは,過去に遡るものしか
考 えない.
2. player のスコアは時間について指数関数的に
減衰する.
25. Dynamic win-lose score (3)
勝敗行列:
n 番目の試合でプレイヤー i と j が対戦し, j が勝ったとき
j が i に勝つことで得られる win score を (i, j) 成分にもつ行列
を とすると 時刻 tn-1 まで遡って得られる win score
時刻 tnで得られる win score
時刻 tn-2 まで遡って
得られる win score
時刻 t1 まで遡って
得られる win score
27. テニスのデータの解析
• 1972年12月から 2010年 5月までの ATP World Tour
(男子プロテニス協会) のシングルス 381570 試
合, 14554人の対戦結果を使用する.
• 試合の内容や大会の大きさは考慮しない.
• 1 試合毎に各プレイヤーのスコアを更新
28. β の決め方
• 公式ランキングでの 1 勝のスコアは 1 年間持続する
• Dynamic win-lose score では 1 勝のスコアは指数関数的に
減衰しながら永久に持続する
• 1 勝の寄与の合計が両者で一致 ⇔ β=1/365
y=1 (0≦t≦365)
1勝したときのスコア
1
y=exp(-βt) (t≧0)
0
0 365 730
経過時間 t [day]
28
29. ランキングの予測性能
• A game between players i and j at time tn
• 直前の両プレイヤーのスコアの大小から,試合結果を予
測
スコアが大きいプレイヤーの勝利 → 予測成功
スコアが小さいプレイヤーの勝利 → 予測失敗
同点 → 予測対象から外す
• Prediction accuracy = (予測成功試合数) / (予測対象試合
数)
• win-lose score および prestige score では, 時刻 tn 以前の試合
結果も全て含めたネットワークを用いてスコアを算出す
33. Prediction accuracy at the end of the data
• Dynamic win-lose score with α = 0.1~0.2 outperforms the
other two ranking systems.
Ranking 手法 Prediction accuracy
Dynamic win-lose score 0.650
(α = 0.1, β = 1/365)
Dynamic win-lose score 0.655
(α = 0.15, β = 1/365)
Dynamic win-lose score 0.653
(α = 0.2, β = 1/365)
win-lose score (α = 0) 0.602
Prestige score (q = 0.05) 0.630
35. Rank correlation with two α values given β = 1/365
・ Rank correlation of the
top 300 players
・ @ end of the data
(i.e., May 2010).
・ A modified Kendall rank
corr (Fagin et al., 2003)
・ corr ≧ 0.9 when α ≧ 0.15
・ Not robust only for small
α
36. Rank correlation with two β values
(one β value = 1/365)
・ Insensitive for small β ≦ 3/365 or so. (note: β = 1/365 included)
37. Sum of the scores
・ From the top, α = 0.15, 0.1, 0.08, 10 -5. We set β = 1/365.
・ Exponential increases.
39. 結論
• win-lose score に時間構造を導入
– 設計指針,公平性の意味でより適切かも
– Tennis の data で良好なパフォーマンス
– ランキング結果はパラメータの変動に対して安
定.
• 計算コストとも小さい
– 様々な統計学習的手法は存在する
• Ref: Motegi & Masuda, arXIv:1203.2228