5. ゴルフゲームのモデリング
ホール FairwayRough Sand WaterGreenOB
クラブ
6I,7I,8I,9I,PW,SW, PT}
Club{Driver,3W,5W, 2I,3I,4I,5I,
方向 [0, 2 )
行動 Club, k a
地点2 P (x, y) R 0.059025 cup カップ半径r
k 1 k 打目における、スタート地点P ,エンド地点P k
k k 1 k P ~ next | P ,a
cup r k c 終了条件; dist P ,P
Teeing ground
Fairway
Sand
Water
Green
Rough
OB
0 0 x , y 0 P
c c x , y c P
Cup
Green
rcup
k
h g
dist( , )
0
( )
Pk Pc
c k 合計スコアP P
1 otherwise k スコアg P 2 State ,Water
6. 戦略のモデリング
の状態;State k 1 P
OB OB
Green Green
Water Water
Sand Sand
Rough Rough
Fairway Fairway
k-1
k-1
k-1
k-1
k-1
k-1
P
P
P
P
P
P
St
St
St
St
St
St
2 2 ~ ; , ~ ; , r f r, f r
直交座標系に変換
x rcos , y rsin = P
平均飛距離
飛距離・方向の標準偏差
OB P P k 1 k P k 1 P
P P k 1 OB,water P P k 1
w P a min water, OB,water k1 w P P P
1 , 0 a a w h k 1 h ただしP P P P P
エンド地点
Club r Club r
Driver 210 6I 110
3W 185 7I 100
5W 160 8I 90
2I 160 9I 80
3I 150 PW 70
4I 135 SW 50
5I 120 PT 40
State Club σr (yard) σθ (度)
Fairway
0~2 30 15
3~12 20 10
Rough
0~2 40 20
3~12 30 15
Sand
0~2 50 25
3~12 40 20
θ
r
Cup
Water
Next
Green
k k 1 k next P | P ,a
Club, r, k a
飛距離、方向は正規分布に従うと仮定
k 1 k P a 戦略S :
行動
戦略をどう決定する? k 1 k P a S :
7. 対象とする戦略
max Point( ) k
k
P
a
選択する行動
Point( ) safe( ) dist( ) k k k P P P
行動決定のためのヒューリスティック
堅実性 距離
dist( ) カップまでの残り距離k P
距離
堅実性
safe( ) k P
Green
Rough
・戦略として堅実性と距離を考慮 β Fairway
k k k P target P ,a 1
評価手法
全行動に対して、それぞれN打サンプリングを行い、
1打毎に評価値を与える。
N打の合計評価値を行動の妥当性とし、
妥当性が最も高い行動を最適な行動とする
(x , y ) i{0,1,2,...,N}
ki ki k ki P からのサンプリングP
N個
N個
戦略の総数
クラブ×全方向