본문 바로가기 메뉴 바로가기

로봇이 아닙니다.

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

로봇이 아닙니다.

         당황했습니까 휴먼?

검색하기 폼
  • 분류 전체보기 (241)
    • Members (1)
    • keep9oing (35)
    • Luanbot-factory (10)
      • MISO-bot (9)
      • Stanford CNN (1)
    • sinanju06 (51)
      • 딥러닝 논문 리뷰 (25)
      • 딥러닝 환경 셋팅 및 코드 분석 (20)
      • 대학원 수업 (6)
    • 미니멀공대생 (74)
      • Control (60)
      • Point Cloud (9)
    • interactics (4)
      • ROS (2)
      • HRI (1)
      • Logistics (1)
      • Mobile Robot (0)
    • whitebot (12)
      • 강화학습이야기 (6)
      • Continual Learning (2)
      • 사이드 프로젝트 (1)
      • 그 외 (3)
    • 잿빛들판 (7)
      • RL environment (1)
      • Model-free RL (1)
      • Multi-agent RL (2)
      • Multi-goal _ Multi-task _ M.. (1)
      • Graph Neural Network (1)
    • maengkyun (13)
      • Study note (13)
    • djjin (6)
      • Mujoco (6)
    • HAILAN (1)
      • Soft grippers (1)
      • Soft sensors (0)
    • ashcircle_robot (1)
      • Perception (1)
    • 은가 (3)
      • LLM (2)
    • memyself (0)
    • 논문 리뷰 (12)
    • 0-DoF Robot (2)
    • 딩딩기 (8)
      • RLHF (4)
      • Graph (3)
      • 강화학습 자율주행 (1)
  • 방명록

CQL (1)
강화학습 논문 정리 9편 : DR3 : Value-Based Deep Reinforcement Learning Requires Explicit Regularization 논문 리뷰 (ICLR 2022)

작성자 : 한양대학원 인공지능융합학과 유승환 박사과정 (CAI LAB) 안녕하세요!! 정말 오랜만의 블로그 포스팅입니다 ㅎㅎ 요새는 Offline Reinforcement Learning 분야를 연구하고 있습니다! 그런데 요녀석이 학습이 생각보다 잘 안돼더라고요 ㅜㅜ 저와 비슷한 고민을 하는 분들을 위해 오프라인 강화학습을 위한 팁! 논문을 가져왔습니다 ㅎㅎ 재밌게 읽어봐주세요~! 논문 링크 : https://openreview.net/forum?id=POvMvLi91f DR3: Value-Based Deep Reinforcement Learning Requires Explicit... Despite overparameterization, deep networks trained via supervised..

sinanju06/딥러닝 논문 리뷰 2023. 9. 17. 20:39
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 로봇공학
  • Mujoco
  • 로봇
  • MARL
  • deep learning
  • moveit2
  • Reinforcement Learning
  • 임피던스제어
  • 임피던스컨트롤
  • continual learning
  • ROS2
  • continual learning for robotics
  • DDPG
  • 제어이론
  • 제어
  • AI
  • RL
  • 포인트클라우드
  • 강화학습
  • mujoco-py
  • 머신러닝
  • 로봇팔
  • 논문리뷰
  • nullspace
  • 인공지능
  • trpo
  • pointcloud
  • PCL
  • WSL
  • 모바일매니퓰레이터
more
«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28

Blog is powered by Tistory / Designed by Tistory

티스토리툴바