본문 바로가기 메뉴 바로가기

로봇이 아닙니다.

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

로봇이 아닙니다.

         당황했습니까 휴먼?

검색하기 폼
  • 분류 전체보기 (241)
    • Members (1)
    • keep9oing (35)
    • Luanbot-factory (10)
      • MISO-bot (9)
      • Stanford CNN (1)
    • sinanju06 (51)
      • 딥러닝 논문 리뷰 (25)
      • 딥러닝 환경 셋팅 및 코드 분석 (20)
      • 대학원 수업 (6)
    • 미니멀공대생 (74)
      • Control (60)
      • Point Cloud (9)
    • interactics (4)
      • ROS (2)
      • HRI (1)
      • Logistics (1)
      • Mobile Robot (0)
    • whitebot (12)
      • 강화학습이야기 (6)
      • Continual Learning (2)
      • 사이드 프로젝트 (1)
      • 그 외 (3)
    • 잿빛들판 (7)
      • RL environment (1)
      • Model-free RL (1)
      • Multi-agent RL (2)
      • Multi-goal _ Multi-task _ M.. (1)
      • Graph Neural Network (1)
    • maengkyun (13)
      • Study note (13)
    • djjin (6)
      • Mujoco (6)
    • HAILAN (1)
      • Soft grippers (1)
      • Soft sensors (0)
    • ashcircle_robot (1)
      • Perception (1)
    • 은가 (3)
      • LLM (2)
    • memyself (0)
    • 논문 리뷰 (12)
    • 0-DoF Robot (2)
    • 딩딩기 (8)
      • RLHF (4)
      • Graph (3)
      • 강화학습 자율주행 (1)
  • 방명록

Agent57 (1)
[2] Agent57: Outperforming the Atari Human Benchmark (DeepMind "Agent57")

editor, Seungeon Baek Reinforcement learning Engineer / RL, Planning and Control ​- 해당 글은 개인 블로그의 글들을 옮겨온 글입니다. - https://seungeonbaek.tistory.com/4?category=806051 Paper review of RL (2) Agent57: Outperforming the Atari Human Benchmark (DeepMind "Agent57") 강화학습 논문 리뷰 연재 두번째입니다. DeepMind의 이번 연구는, 기존 강화학습 알고리즘의 benchmark로써 자주 활용되곤 하는 모든 Atari 2600 게임에서(수 백개중 벤치마크로써 사용되는 57개의 게임) seungeonbaek.tist..

잿빛들판/Model-free RL 2021. 5. 15. 18:35
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 임피던스제어
  • 로봇
  • AI
  • 논문리뷰
  • Mujoco
  • 임피던스컨트롤
  • 제어
  • 모바일매니퓰레이터
  • 제어이론
  • moveit2
  • 포인트클라우드
  • Reinforcement Learning
  • 로봇팔
  • continual learning
  • trpo
  • 인공지능
  • deep learning
  • continual learning for robotics
  • RL
  • 로봇공학
  • 강화학습
  • PCL
  • 머신러닝
  • pointcloud
  • DDPG
  • ROS2
  • nullspace
  • MARL
  • WSL
  • mujoco-py
more
«   2026/03   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

Blog is powered by Tistory / Designed by Tistory

티스토리툴바