
논문 링크 : https://www.i-support-project.eu/web/wp-content/uploads/2018/08/3_Multiobjective-optimization-for-stiffness-and-position-control-in-a-soft-robot-arm-module_SSSA_CL.pdf 배경지식 : distance metric : https://joonable.tistory.com/14 absorbing state : https://en.wikipedia.org/wiki/Absorbing_Markov_chain hypersphere : https://cumulu-s.tistory.com/9 [Abstract] 이 논문의 주된 목적은 노인을 위한 입욕을 도와줄 로봇 팔을 연구..

강화학습 Tips and Tricks(2) Author: Benthebear93[이해구] Reference: https://medium.com/@BonsaiAI/deep-reinforcement-learning-models-tips-tricks-for-writing-reward-functions-a84fe525e8e0 https://stable-baselines3.readthedocs.io/en/master/guide/rl_tips.html 본 글은 reference 내용의 번역본입니다. 이번 글에서는 RL모델을 학습 시키는데 필요한 reward function(보상함수)를 효과적으로 작성하는 방법에 대해서 다루려고 한다. The Cobra Effect RL모델을 학습 시키는데 필요한 reward fun..

Evolutionary 알고리즘에 대한 개략적인 설명은 이전 포스트에서 언급됐다. Evolutionary strategy 1 - Simple Gaussian Evolution 최근 RL관련 논문이나 구루들의 토의 영상들을 보면 evolution strategy(혹은 evolution algorithm)이란 단어가 심심치 않게 등장한다. Evolution algorithm은 Black box optimization의 일종이다. Black box opti.. ropiens.tistory.com 오늘은 (μ,λ)-ES 방식과는 약간 다른 Elitarian selection (μ+λ)-ES에 대해 알아보겠다. Elitarian selection $(\mu + \lambd..

최근 RL관련 논문이나 구루들의 토의 영상들을 보면 evolution strategy(혹은 evolution algorithm)이란 단어가 심심치 않게 등장한다. Evolution algorithm은 Black box optimization의 일종이다. Black box optimization은 우리가 최적화 하고자 하는 함수의 전체적인 형태는 알 수 없지만 입력에 대한 출력은 확인 할 수 있는 함수(evaluation만 가능한 black box)에 대해 우리가 원하는 최적 인풋을 찾는 기법을 말한다. 기존의 딥러닝 기법들은 경사도 기반 기법(gradient descent 등)들을 주로 사용하여 loss 함수를 최적화하는 것을 통해 학습을 진행해 왔다. Black box optimization이 이와 좀..

editor, Seungeon Baek Reinforcement learning Engineer / RL, Planning and Control - 해당 글은 개인 블로그의 글들을 옮겨온 글입니다. - https://seungeonbaek.tistory.com/21 Paper reivew of RL (6) Hindsight Experience Replay (HER) 강화학습 논문 리뷰 연재 여섯 번째 입니다. 현재 감사하게도 함께 하고있는, '로봇이 아닙니다' 팀블로그에 합류한 이후 처음으로 쓰는 연재글이다 보니 퀄리티에 신경을 쓰려고 노력했고, 그 seungeonbaek.tistory.com 클릭해 주셔서 감사합니다. 강화학습 논문 리뷰 연재 여섯 번째 입니다. 현재 감사하게도 함께 하고있는, '로봇..

작성자 1 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 작성자 2 : 한양대학교 로봇공학과 홍윤기 학부연구생 정말 오랜만에 팀블로그에 글을 작성해보네요ㅎㅎ 오늘은 value iter 기반 강화학습 알고리즘인 DDQN : Deep Reinforcement Learning with Double Q-learning 논문 리뷰를 진행하겠습니다!! 참고로 DDQN은 AAAI 2016에 출판(?)된 논문입니다~ 링크 0 (원문) : https://arxiv.org/pdf/1509.06461.pdf 링크 1 (참고 블로그) : https://taek-l.tistory.com/36 [강화학습 Key Paper] Double DQN 본 포스트는 OpenAI에서 공개한 강화학습 교육자료인 Spinni..

editor, Junyeob Baek Robotics & ML Research Engineer / RL, Motion Planning and Control, SLAM, Vision 관련 포스팅 Continual Learning for Robotics(2) 0. Prologue 딥러닝 분야를 공부하다보면 continual learning 또는 life-long learning이라는 이야기를 들어본 적이 있을 것이다. 그리고 잘 모르겠지만 지속 가능한 학습, 계속 학습하는것(?) 정도로 이해하면 되는 개념인가보다 하고 넘어갔다면, 이 글을 통해 조금이라도 해당 분야에 대한 인사이트를 얻어갈 수 있는 시간이 될 수 있길 바란다. 인공지능을 연구하는 사람들에게 지속 가능한 학습은 범용지능(AGI)을 만들기 위한..

강화학습 Tips and Tricks Author: Benthebear93[이해구] & Keep9oing[정민재] Reference: https://stable-baselines3.readthedocs.io/en/master/guide/rl_tips.html Stable Baseline 3(SB3)에서 본격적으로 강화학습을 적용하고자 하는 사람들을 위한 팁들과 트릭들을 정리한 포스트의 번역물입니다. 오역이 있을 경우 피드백 환영입니다. Reinforcement Learning Tips and Tricks 이번 글의 목적은 강화학습을 연구하는 데 있어서 도움을 주기 위함입니다. 글에서는 강화학습을 연구하면서 '어떻게 시작하고, 어떤 알고리즘을 선택하고 평가하는지 등'에 대한 일반적인 조언들로 부터 커스텀 ..