Se ha denunciado esta presentación.
Se está descargando tu SlideShare. ×

From REINFORCE to PPO

Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Anuncio
Próximo SlideShare
464. naivcine iz elkinsa
464. naivcine iz elkinsa
Cargando en…3
×

Eche un vistazo a continuación

1 de 75 Anuncio

From REINFORCE to PPO

Descargar para leer sin conexión

RLKorea의 프로젝트인 피지여행에서 진행한 내용을 정리한 것입니다. 피지여행은 DeepRL에서 중요한 Policy Gradient를 쭉 정리해보는 프로젝트입니다. PG의 처음 시작인 REINFORCE 부터 현재 새로운 baseline이 된 PPO까지 이론과 코드를 함께 살펴봅니다.

RLKorea의 프로젝트인 피지여행에서 진행한 내용을 정리한 것입니다. 피지여행은 DeepRL에서 중요한 Policy Gradient를 쭉 정리해보는 프로젝트입니다. PG의 처음 시작인 REINFORCE 부터 현재 새로운 baseline이 된 PPO까지 이론과 코드를 함께 살펴봅니다.

Anuncio
Anuncio

Más Contenido Relacionado

Presentaciones para usted (20)

Más reciente (20)

Anuncio

×