본문 바로가기 메뉴 바로가기

로봇이 아닙니다.

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

로봇이 아닙니다.

         당황했습니까 휴먼?

검색하기 폼
  • 분류 전체보기 (241)
    • Members (1)
    • keep9oing (35)
    • Luanbot-factory (10)
      • MISO-bot (9)
      • Stanford CNN (1)
    • sinanju06 (51)
      • 딥러닝 논문 리뷰 (25)
      • 딥러닝 환경 셋팅 및 코드 분석 (20)
      • 대학원 수업 (6)
    • 미니멀공대생 (74)
      • Control (60)
      • Point Cloud (9)
    • interactics (4)
      • ROS (2)
      • HRI (1)
      • Logistics (1)
      • Mobile Robot (0)
    • whitebot (12)
      • 강화학습이야기 (6)
      • Continual Learning (2)
      • 사이드 프로젝트 (1)
      • 그 외 (3)
    • 잿빛들판 (7)
      • RL environment (1)
      • Model-free RL (1)
      • Multi-agent RL (2)
      • Multi-goal _ Multi-task _ M.. (1)
      • Graph Neural Network (1)
    • maengkyun (13)
      • Study note (13)
    • djjin (6)
      • Mujoco (6)
    • HAILAN (1)
      • Soft grippers (1)
      • Soft sensors (0)
    • ashcircle_robot (1)
      • Perception (1)
    • 은가 (3)
      • LLM (2)
    • memyself (0)
    • 논문 리뷰 (12)
    • 0-DoF Robot (2)
    • 딩딩기 (8)
      • RLHF (4)
      • Graph (3)
      • 강화학습 자율주행 (1)
  • 방명록

coma (1)
[keep9oing] Counterfactual Multi-Agent Policy Gradient (COMA) 리뷰

Foerster, Jakob, et al. "Counterfactual multi-agent policy gradients." Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 32. No. 1. 2018. 0. Comment MADDPG와 더불어, Centralized learning, Decentralized executing 진영의 대표적인 알고리즘. COMA라 불리고 있으며 discrete action 에 대해서만 다룬다는 것이 MADDPG에 비해 한계점을 가지고 있으나, Deep multi agent reinfrocement learning 관점에서 개별 agent의 공헌도를 부여하는 credit assignment(리워드 ..

논문 리뷰 2021. 1. 21. 17:08
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
TAG
  • 로봇공학
  • PCL
  • 포인트클라우드
  • Reinforcement Learning
  • continual learning
  • moveit2
  • continual learning for robotics
  • AI
  • mujoco-py
  • 제어이론
  • 로봇팔
  • trpo
  • WSL
  • pointcloud
  • 제어
  • 임피던스제어
  • MARL
  • 로봇
  • 임피던스컨트롤
  • nullspace
  • 모바일매니퓰레이터
  • DDPG
  • Mujoco
  • 인공지능
  • ROS2
  • 머신러닝
  • deep learning
  • RL
  • 강화학습
  • 논문리뷰
more
«   2026/02   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28

Blog is powered by Tistory / Designed by Tistory

티스토리툴바