Se ha denunciado esta presentación.
Utilizamos tu perfil de LinkedIn y tus datos de actividad para personalizar los anuncios y mostrarte publicidad más relevante. Puedes cambiar tus preferencias de publicidad en cualquier momento.

A3Cという強化学習アルゴリズムで遊んでみた話

17.354 visualizaciones

Publicado el

2015/07/23 PFIセミナー発表資料 https://www.youtube.com/watch?v=uiEtfyBAAHQ

Publicado en: Tecnología

A3Cという強化学習アルゴリズムで遊んでみた話

  1. 1. d✓v = @(R V (si; ✓v))2 @✓v d✓ = r✓ log ⇡(ai|si; ✓)(R V (si; ✓v))
  2. 2. g = ↵g + (1 ↵) ✓2 ✓ ✓ ⌘ ✓ p g + ✏

×