SlideShare una empresa de Scribd logo
1 de 39
ネットワークの中心性に基づ
く個人スポーツの動的なラン
     キング
       増田 直紀

 東京大学大学院 情報理工学系研究科


     With 茂木 隼 (M2)
FIFA Ranking
Japan (ranked 19th)            Bhutan (198th)

                   VS


Sweden (18th)                   Spain (1st)

                   VS
FIFA Ranking
Japan (19th)                   Bhutan (198th)

                   VS

  WIN                          LOSE
Sweden (18th)                   Spain (1st)

                   VS
Introduction : FIFA Ranking
Japan (19th)              Bhutan (198th)

                  VS

  WIN                      LOSE
Sweden (18th)               Spain (1st)

                  VS
    1勝の重みが全く違う !!
スポーツランキング
• サッカーに限らず,総当たり戦でないスポーツでは
  対戦相手の強弱による不公平性が生じやすい.
  (e.g. 自国の大陸との対戦が多くなる)
 → 単純に勝敗数でランキングを決めるのは不適
 切

• 実際のランキングには不公平性を是正するためのルー
  ルが設けられているが…
  (e.g. 「強い」大陸の国ほど得られるスコアが大きい)
  ・ 複雑でわかりにくい場合が多い
  ・ 新たな不公平性を生むことも

• → ネットワークを用いたランキング手法
ネットワークを用いたランキング手法

• 頂点 = 選手 (or team)

• 1試合の勝者と敗者を有向辺で結ぶ.

• 各頂点の中心性 = 選手のランキング

• 計算方法 :
  1. prestige score [Radicchi, 2011]
  2. win-lose score [Park & Newman, 2005]

      → static ranking systems
Static and dynamic ranking

Static ranking
• 時間構造を無視.つまり,「選手の実力は不変」 と想定
 – 実際には,選手の実力は時間に依存するはず.


Dynamic ranking

     本研究の目的:
       時間構造を導入し, 実力の変動を考慮し
     た
     ランキング手法を提案する.
Prestige score
• player i が player j に勝った回数:          win   lose
                                   i
•     : j が負けた総数                                    j




                                        0<q<1

•   多くの相手に勝つほどスコアが上がる.
•   勝った相手のスコアが大きいほどスコアが上がる.
•   勝った相手の負け数    が小さいほどスコアが上がる.
•   負けの影響は直接は考慮されていない.
•   PageRank と同じ
win-lose score   (1)

•   1 は 2 に勝利 (距離 1)
     2 は 3 に勝利 (距離 1)
    → 1 は 3 に間接的に勝利 (距離 2 )
                                  1
                                      間接勝利

•   2 は 1 に敗北 (距離 1)
     3 は 2 に敗北 (距離 1)     2           3
    → 3 は 1 に間接的に敗北 (距離 2 )
win-lose score    (2)

A = j が i に勝った回数を (i , j) 成分にもつ勝敗行列
  i の距離 1 の勝利数 =
  i の距離 2 の勝利数 =
  i の距離 3 の勝利数 =


距離 k の勝利の価値 = 距離 1 の勝利の                倍 (0 ≦ α < 1).
k = 1, 2, … で和をとる → i の win score wi
win-lose score   (3)

• 負けの影響も同様に考える.

 lose score:




Player i’s score:
例1
Note 0 ≦ α < 1




                          1



                      2       3
例2




                         1

  = A の最大固有値.
収束条件は
                     2       3

実際には全試合終了まで    は不明なので, 上の条
件を満たすように  を十分小さくする必要がある.
Static ranking の問題点
• Static ranking では対戦が行われた時刻に関する
  情報がないため, 過去の対戦を たった今行われた
  かのように扱う (実力を不変と想定)
• しかし,プレイヤーの実力が変化するスポーツは多い.
• デビュー当時の Federer に勝つことと10年後の Federer
  に勝つことが同じ評価となる.



                                    1
                          year          year
                          2000          2010

                                2       3
Dynamic win-lose score (1)


• win-lose score を以下のように拡張した dynamic win-lose
  score を提案する.



   1. 間接的な勝ち負けは,過去に遡るものしか
      考 えない.

   2. player のスコアは時間について指数関数的に
      減衰する.
Example




    1                 1


2       2         3       3




        (α,βは正の定数)
Example




    1                 1


2       2         3       3




        (α,βは正の定数)
Example




    1                 1


2       2         3       3




        (α,βは正の定数)
Example




    1                 1


2       2         3       3




        (α,βは正の定数)
Dynamic win-lose score   (2)




    1                                  1


2               2         3                3




               (α,βは正の定数)
Dynamic win-lose score   (2)




    1                                  1


2               2         3                3




               (α,βは正の定数)
Dynamic win-lose score   (2)




    1                                  1


2               2         3                3




               (α,βは正の定数)
Dynamic win-lose score   (2)




    1                                  1


2               2         3                3




               (α,βは正の定数)
win-lose score




       1             1           1


 2               2       3   2       3




                 (αは正の定数)
Dynamic win-lose score   (3)

   勝敗行列:
   n 番目の試合でプレイヤー i と j が対戦し, j が勝ったとき



    j が i に勝つことで得られる win score を (i, j) 成分にもつ行列
    を       とすると 時刻 tn-1 まで遡って得られる win score
               時刻 tnで得られる win score


時刻 tn-2 まで遡って
得られる win score

   時刻 t1 まで遡って
   得られる win score
Update equations
Win score at time tn:
                        ( はすべての要素が1の列ベクトル)



lose score:




Score の更新式:
テニスのデータの解析

• 1972年12月から 2010年 5月までの ATP World Tour
  (男子プロテニス協会) のシングルス 381570 試
  合, 14554人の対戦結果を使用する.


• 試合の内容や大会の大きさは考慮しない.


• 1 試合毎に各プレイヤーのスコアを更新
β の決め方
• 公式ランキングでの 1 勝のスコアは 1 年間持続する
• Dynamic win-lose score では 1 勝のスコアは指数関数的に
  減衰しながら永久に持続する
• 1 勝の寄与の合計が両者で一致 ⇔ β=1/365



                                               y=1 (0≦t≦365)
     1勝したときのスコア




                  1




                                               y=exp(-βt) (t≧0)




                  0
                      0   365                     730
                                経過時間 t [day]
28
ランキングの予測性能

• A game between players i and j at time tn
• 直前の両プレイヤーのスコアの大小から,試合結果を予
  測

      スコアが大きいプレイヤーの勝利 → 予測成功
      スコアが小さいプレイヤーの勝利 → 予測失敗
      同点 → 予測対象から外す

• Prediction accuracy = (予測成功試合数) / (予測対象試合
  数)
• win-lose score および prestige score では, 時刻 tn 以前の試合
  結果も全て含めたネットワークを用いてスコアを算出す
Dynamic win-lose score
win-lose score




                 Note: λmax = 0.00438
Prestige score
Prediction accuracy at the end of the data
• Dynamic win-lose score with α = 0.1~0.2 outperforms the
  other two ranking systems.



          Ranking 手法                Prediction accuracy
     Dynamic win-lose score               0.650
       (α = 0.1, β = 1/365)
     Dynamic win-lose score               0.655
      (α = 0.15, β = 1/365)
     Dynamic win-lose score               0.653
      (α = 0.2, β = 1/365)
      win-lose score (α = 0)              0.602
     Prestige score (q = 0.05)            0.630
パラメータの感度分析
• パラメータの決め方によってランキングが大きく変動
  してしまうことは望ましくない.
• Dynamic win-lose score におけるパラメータの感度
  を,            順位相関を用いて調べる.

• 全試合終了時点でランキング上位300人の順位相関を計算す
  る. (Fagin et al. (2003) の方法)
Rank correlation with two α values given β = 1/365




                                 ・ Rank correlation of the
                                 top 300 players
                                 ・ @ end of the data
                                 (i.e., May 2010).
                                 ・ A modified Kendall rank
                                 corr (Fagin et al., 2003)
                                 ・ corr ≧ 0.9 when α ≧ 0.15
                                 ・ Not robust only for small
                                 α
Rank correlation with two β values
                (one β value = 1/365)




・ Insensitive for small β ≦ 3/365 or so. (note: β = 1/365 included)
Sum of the scores




・ From the top, α = 0.15, 0.1, 0.08, 10 -5. We set β = 1/365.
・ Exponential increases.
相対スコアと公式ランクの比較
結論

• win-lose score に時間構造を導入
   – 設計指針,公平性の意味でより適切かも
   – Tennis の data で良好なパフォーマンス
   – ランキング結果はパラメータの変動に対して安
     定.
• 計算コストとも小さい
   – 様々な統計学習的手法は存在する


• Ref: Motegi & Masuda, arXIv:1203.2228

Más contenido relacionado

Último

Último (10)

Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
 
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
 
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
 
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアルLoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
 
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native IntegrationsUtilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
 
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半        2024/04/26の勉強会で発表されたものです。新人研修 後半        2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
 
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
 
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
 
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイスLoRaWANスマート距離検出センサー  DS20L  カタログ  LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
 
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
 

Destacado

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

Destacado (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Sports ranking

  • 1. ネットワークの中心性に基づ く個人スポーツの動的なラン キング 増田 直紀 東京大学大学院 情報理工学系研究科 With 茂木 隼 (M2)
  • 2. FIFA Ranking Japan (ranked 19th) Bhutan (198th) VS Sweden (18th) Spain (1st) VS
  • 3. FIFA Ranking Japan (19th) Bhutan (198th) VS WIN LOSE Sweden (18th) Spain (1st) VS
  • 4. Introduction : FIFA Ranking Japan (19th) Bhutan (198th) VS WIN LOSE Sweden (18th) Spain (1st) VS 1勝の重みが全く違う !!
  • 5. スポーツランキング • サッカーに限らず,総当たり戦でないスポーツでは 対戦相手の強弱による不公平性が生じやすい. (e.g. 自国の大陸との対戦が多くなる) → 単純に勝敗数でランキングを決めるのは不適 切 • 実際のランキングには不公平性を是正するためのルー ルが設けられているが… (e.g. 「強い」大陸の国ほど得られるスコアが大きい) ・ 複雑でわかりにくい場合が多い ・ 新たな不公平性を生むことも • → ネットワークを用いたランキング手法
  • 6. ネットワークを用いたランキング手法 • 頂点 = 選手 (or team) • 1試合の勝者と敗者を有向辺で結ぶ. • 各頂点の中心性 = 選手のランキング • 計算方法 : 1. prestige score [Radicchi, 2011] 2. win-lose score [Park & Newman, 2005] → static ranking systems
  • 7. Static and dynamic ranking Static ranking • 時間構造を無視.つまり,「選手の実力は不変」 と想定 – 実際には,選手の実力は時間に依存するはず. Dynamic ranking 本研究の目的: 時間構造を導入し, 実力の変動を考慮し た ランキング手法を提案する.
  • 8. Prestige score • player i が player j に勝った回数: win lose i • : j が負けた総数 j 0<q<1 • 多くの相手に勝つほどスコアが上がる. • 勝った相手のスコアが大きいほどスコアが上がる. • 勝った相手の負け数 が小さいほどスコアが上がる. • 負けの影響は直接は考慮されていない. • PageRank と同じ
  • 9. win-lose score (1) • 1 は 2 に勝利 (距離 1) 2 は 3 に勝利 (距離 1) → 1 は 3 に間接的に勝利 (距離 2 ) 1 間接勝利 • 2 は 1 に敗北 (距離 1) 3 は 2 に敗北 (距離 1) 2 3 → 3 は 1 に間接的に敗北 (距離 2 )
  • 10. win-lose score (2) A = j が i に勝った回数を (i , j) 成分にもつ勝敗行列 i の距離 1 の勝利数 = i の距離 2 の勝利数 = i の距離 3 の勝利数 = 距離 k の勝利の価値 = 距離 1 の勝利の 倍 (0 ≦ α < 1). k = 1, 2, … で和をとる → i の win score wi
  • 11. win-lose score (3) • 負けの影響も同様に考える. lose score: Player i’s score:
  • 12. 例1 Note 0 ≦ α < 1 1 2 3
  • 13. 例2 1 = A の最大固有値. 収束条件は 2 3 実際には全試合終了まで は不明なので, 上の条 件を満たすように を十分小さくする必要がある.
  • 14. Static ranking の問題点 • Static ranking では対戦が行われた時刻に関する 情報がないため, 過去の対戦を たった今行われた かのように扱う (実力を不変と想定) • しかし,プレイヤーの実力が変化するスポーツは多い. • デビュー当時の Federer に勝つことと10年後の Federer に勝つことが同じ評価となる. 1 year year 2000 2010 2 3
  • 15. Dynamic win-lose score (1) • win-lose score を以下のように拡張した dynamic win-lose score を提案する. 1. 間接的な勝ち負けは,過去に遡るものしか 考 えない. 2. player のスコアは時間について指数関数的に 減衰する.
  • 16. Example 1 1 2 2 3 3 (α,βは正の定数)
  • 17. Example 1 1 2 2 3 3 (α,βは正の定数)
  • 18. Example 1 1 2 2 3 3 (α,βは正の定数)
  • 19. Example 1 1 2 2 3 3 (α,βは正の定数)
  • 20. Dynamic win-lose score (2) 1 1 2 2 3 3 (α,βは正の定数)
  • 21. Dynamic win-lose score (2) 1 1 2 2 3 3 (α,βは正の定数)
  • 22. Dynamic win-lose score (2) 1 1 2 2 3 3 (α,βは正の定数)
  • 23. Dynamic win-lose score (2) 1 1 2 2 3 3 (α,βは正の定数)
  • 24. win-lose score 1 1 1 2 2 3 2 3 (αは正の定数)
  • 25. Dynamic win-lose score (3) 勝敗行列: n 番目の試合でプレイヤー i と j が対戦し, j が勝ったとき j が i に勝つことで得られる win score を (i, j) 成分にもつ行列 を とすると 時刻 tn-1 まで遡って得られる win score 時刻 tnで得られる win score 時刻 tn-2 まで遡って 得られる win score 時刻 t1 まで遡って 得られる win score
  • 26. Update equations Win score at time tn: ( はすべての要素が1の列ベクトル) lose score: Score の更新式:
  • 27. テニスのデータの解析 • 1972年12月から 2010年 5月までの ATP World Tour (男子プロテニス協会) のシングルス 381570 試 合, 14554人の対戦結果を使用する. • 試合の内容や大会の大きさは考慮しない. • 1 試合毎に各プレイヤーのスコアを更新
  • 28. β の決め方 • 公式ランキングでの 1 勝のスコアは 1 年間持続する • Dynamic win-lose score では 1 勝のスコアは指数関数的に 減衰しながら永久に持続する • 1 勝の寄与の合計が両者で一致 ⇔ β=1/365 y=1 (0≦t≦365) 1勝したときのスコア 1 y=exp(-βt) (t≧0) 0 0 365 730 経過時間 t [day] 28
  • 29. ランキングの予測性能 • A game between players i and j at time tn • 直前の両プレイヤーのスコアの大小から,試合結果を予 測 スコアが大きいプレイヤーの勝利 → 予測成功 スコアが小さいプレイヤーの勝利 → 予測失敗 同点 → 予測対象から外す • Prediction accuracy = (予測成功試合数) / (予測対象試合 数) • win-lose score および prestige score では, 時刻 tn 以前の試合 結果も全て含めたネットワークを用いてスコアを算出す
  • 31. win-lose score Note: λmax = 0.00438
  • 33. Prediction accuracy at the end of the data • Dynamic win-lose score with α = 0.1~0.2 outperforms the other two ranking systems. Ranking 手法 Prediction accuracy Dynamic win-lose score 0.650 (α = 0.1, β = 1/365) Dynamic win-lose score 0.655 (α = 0.15, β = 1/365) Dynamic win-lose score 0.653 (α = 0.2, β = 1/365) win-lose score (α = 0) 0.602 Prestige score (q = 0.05) 0.630
  • 34. パラメータの感度分析 • パラメータの決め方によってランキングが大きく変動 してしまうことは望ましくない. • Dynamic win-lose score におけるパラメータの感度 を, 順位相関を用いて調べる. • 全試合終了時点でランキング上位300人の順位相関を計算す る. (Fagin et al. (2003) の方法)
  • 35. Rank correlation with two α values given β = 1/365 ・ Rank correlation of the top 300 players ・ @ end of the data (i.e., May 2010). ・ A modified Kendall rank corr (Fagin et al., 2003) ・ corr ≧ 0.9 when α ≧ 0.15 ・ Not robust only for small α
  • 36. Rank correlation with two β values (one β value = 1/365) ・ Insensitive for small β ≦ 3/365 or so. (note: β = 1/365 included)
  • 37. Sum of the scores ・ From the top, α = 0.15, 0.1, 0.08, 10 -5. We set β = 1/365. ・ Exponential increases.
  • 39. 結論 • win-lose score に時間構造を導入 – 設計指針,公平性の意味でより適切かも – Tennis の data で良好なパフォーマンス – ランキング結果はパラメータの変動に対して安 定. • 計算コストとも小さい – 様々な統計学習的手法は存在する • Ref: Motegi & Masuda, arXIv:1203.2228