TRPO 리뷰 : Trust region policy optimization
editor, Junyeob Baek Robotics Software Engineer /RL, Motion Planning and Control, SLAM, Vision - 해당 글은 기존 markdown형식으로 적어오던 리뷰 글을 블로그형식으로 다듬고 재구성한 글입니다 - original repo : github.com/CUN-bjy/rl-paper-review CUN-bjy/rl-paper-review road-map & paper review for Reinforcement Learning - CUN-bjy/rl-paper-review github.com 관련 페이지: [whitebot/강화학습이야기] - 개인적으로 정리하는 rl-roadmap [whitebot/강화학습이야기] - DDPG 리뷰 :..
whitebot/강화학습이야기
2021. 2. 4. 23:25