editor, Junyeob Baek Robotics Software Engineer /RL, Motion Planning and Control, SLAM, Vision 이번에는 얼마전 Github에 공개한 오픈소스 패키지에 대해 소개해보려한다. :) policy distillation은 현재 연구중인 논문과 관련해 찾아보다가 유용하게 쓸 수 있겠다 싶어 자세히 공부하고 있었던 개념이다. 근데 생각보다 Github에 control task를 위한 policy distillation 모듈이 제대로 구현되어있는 repo가 없다는게 함정이다. 나름 DeepMind에서 나온 논문이고 쓸만하다고 생각하는 개념인데 인기가 생각보다 없나보다...T.T 어짜피 하던 연구를 진행하려면 제대로 된 policy distil..
editor, Junyeob Baek Robotics Software Engineer /RL, Motion Planning and Control, SLAM, Vision - 해당 글은 기존 markdown형식으로 적어오던 리뷰 글을 블로그형식으로 다듬고 재구성한 글입니다 - original repo : github.com/CUN-bjy/rl-paper-review implementation repo: github.com/CUN-bjy/gym-td3-keras CUN-bjy/gym-td3-keras Keras Implementation of TD3(Twin Delayed DDPG) with PER(Prioritized Experience Replay) option on OpenAI gym frame..
editor, Junyeob Baek Robotics Software Engineer /RL, Motion Planning and Control, SLAM, Vision original repo : github.com/CUN-bjy/rl-paper-review CUN-bjy/rl-paper-review road-map & paper review for Reinforcement Learning - CUN-bjy/rl-paper-review github.com 관련 페이지: [whitebot/강화학습이야기] - DDPG 리뷰 : Continuous control with deep reinforcement learning [whitebot/강화학습이야기] - TRPO 리뷰 : Trust region polic..