작성자 : 한양대학원 인공지능융합학과 유승환 박사과정 (CAI LAB) 안녕하세요!! 정말 오랜만의 블로그 포스팅입니다 ㅎㅎ 요새는 Offline Reinforcement Learning 분야를 연구하고 있습니다! 그런데 요녀석이 학습이 생각보다 잘 안돼더라고요 ㅜㅜ 저와 비슷한 고민을 하는 분들을 위해 오프라인 강화학습을 위한 팁! 논문을 가져왔습니다 ㅎㅎ 재밌게 읽어봐주세요~! 논문 링크 : https://openreview.net/forum?id=POvMvLi91f DR3: Value-Based Deep Reinforcement Learning Requires Explicit... Despite overparameterization, deep networks trained via supervised..
보호되어 있는 글입니다.
작성자 : 한양대학원 인공지능융합학과 유승환 박사과정 (CAI LAB) 드디어... 블로그에 논문 리뷰 글을 포스팅할 수 있게 되었습니다 ㅎㅎ 방학 때는 열심히 논문 리뷰와 연구 프로젝트 3개의 진행을, 학기 중에는 수업 4개와 5개의 연구 프로젝트를 진행하다보니 1개의 몸둥아리 밖에 없는게 너무 서글픕니다 ㅋㅋ 그래도 열심히해서 살아남겠습니다 ㅎㅎ 오늘부터 차근차근 겨울방학 때 강화학습 논문을 리뷰했던 내용을 올리고자 합니다~! 이번 포스팅은 강화학습 분야의 Sim-to-Real Transfer에 대한 서베이 논문을 리뷰하고자 합니다! 글로도 보완 설명을 하고 싶었으나, 시간이 부족한 관계로... 저를 포함한 대학원생 및 학부연구생 친구들이 논문 리뷰를 진행했던 피피티 원본을 공유하고자 합니다 ㅎㅎ 궁..
보호되어 있는 글입니다.
보호되어 있는 글입니다.
보호되어 있는 글입니다.
작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 안녕하세요~~ 저번 1편에서는 Open AI GYM에서 제공하는 Atrai Game들을 A2C 모델로 학습해보는 시간을 가졌었습니다! 이번 2편에서는 강화학습의 환경(env)과 관련된 코드를 분석하는 시간을 가지겠습니다!!ㅎㅎ 아쉽게도 Atari 게임의 코드는 공식적으로 지원하지 않습니다 ㅜㅜ 그래서 Atrai의 환경 코드는 간단하게만 보고, 대표적인 환경 중 하나인 'mountain car' 예제를 분석해보겠습니다~~~!! 그럼 시작하겠습니다~! 강화학습 실습 1편 : https://ropiens.tistory.com/153 강화학습 실습 1편 : OpenAI GYM-Atari 환경 셋팅 (Window 10, anaconda) 작..
보호되어 있는 글입니다.