작성자 : 한양대학원 인공지능융합학과 유승환 박사과정 (CAI LAB) 드디어... 블로그에 논문 리뷰 글을 포스팅할 수 있게 되었습니다 ㅎㅎ 방학 때는 열심히 논문 리뷰와 연구 프로젝트 3개의 진행을, 학기 중에는 수업 4개와 5개의 연구 프로젝트를 진행하다보니 1개의 몸둥아리 밖에 없는게 너무 서글픕니다 ㅋㅋ 그래도 열심히해서 살아남겠습니다 ㅎㅎ 오늘부터 차근차근 겨울방학 때 강화학습 논문을 리뷰했던 내용을 올리고자 합니다~! 이번 포스팅은 강화학습 분야의 Sim-to-Real Transfer에 대한 서베이 논문을 리뷰하고자 합니다! 글로도 보완 설명을 하고 싶었으나, 시간이 부족한 관계로... 저를 포함한 대학원생 및 학부연구생 친구들이 논문 리뷰를 진행했던 피피티 원본을 공유하고자 합니다 ㅎㅎ 궁..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 안녕하세요~~ 저번 1편에서는 Open AI GYM에서 제공하는 Atrai Game들을 A2C 모델로 학습해보는 시간을 가졌었습니다! 이번 2편에서는 강화학습의 환경(env)과 관련된 코드를 분석하는 시간을 가지겠습니다!!ㅎㅎ 아쉽게도 Atari 게임의 코드는 공식적으로 지원하지 않습니다 ㅜㅜ 그래서 Atrai의 환경 코드는 간단하게만 보고, 대표적인 환경 중 하나인 'mountain car' 예제를 분석해보겠습니다~~~!! 그럼 시작하겠습니다~! 강화학습 실습 1편 : https://ropiens.tistory.com/153 강화학습 실습 1편 : OpenAI GYM-Atari 환경 셋팅 (Window 10, anaconda) 작..
보호되어 있는 글입니다.
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 한양대학교 로봇공학과 홍윤기 학부생 (CAI LAB) 안녕하세요~~ 딥러닝 실습과 관련된 글은 정말 오랜만에 작성을 해보네요 ㅎㅎ 작년의 저는 Computer Vision 분야를 연구했다면, 올해의 저는 Reinforcement Learning 분야를 연구하고 있습니다!! 그래서 앞으로는 RL과 관련된 논문, 실습(github 코드) 게시물을 많이 많이 업로드하겠습니다~!! 강화학습 환경으로 OpenAI-GYM이 엄청 유명한데요, 그 중 Atari 2600 게임을 사용할 수 있는 gym 환경을 생성할 수 있는 환경 셋팅을 진행해보겠습니다! 저희는 Ubnutu보다 Window 환경을 선호해서, Window 10에서 설정하는 방법을 소..
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 정말 오랜만에!!! 작성하는 논문 리뷰입니다!ㅎㅎ 올해 저는 6축 협동로봇 UR5e에 강화학습을 적용하는 연구를 진행하고 있습니다! 첫 강화학습 연구다보니 감을 익혀보기 위해 action space의 차원을 간략화 시켜서, 앤드이펙터의 x, y 좌표, 즉 2차원의 action space를 가지고 DDPG 모델을 진행하고 있습니다ㅎㅎ 그런데... 학습을 진행할수록 x, y 좌표가 한 방향으로 증가 혹은 감소하는, 즉 한 point로 수렴해서 갇히는 문제가 발생하고 있습니다ㅜㅜ 그래서 DDPG의 한계점 및 해결책을 파악하고자, 이번 논문을 리뷰하고자 합니다! 그럼 시작하겠습니다~!! :) 1. 참고 링크 (원문) : https://ar..