
포트 임피던스와 어드미턴스는 선형시스템 반응 표현들이다. 일반적인 입력, 출력값으로 표현되는 전달함수와 다른점(차이점)을 알아두는 것이 좋다. 그림의 시스템의 경우 2개의 power interface가 있기 때문에 2-port 예제로 볼 수 있다. 첫번째 power interface는 Fa와 x1속도로 표현할 수 있고 두번째 power interface의 경우 Fe와 x2의 속도로 표현 가능하다. 만약 위 사진과 같은 요소들이 로봇을 표현한다면, 한쪽은 주로 액추에이터와 연결되어 있고 다른 한쪽은 로봇의 아래쪽이나, 바로 환경과 연결되어 있다. 기계적 2-port는 모션에 따른 힘에 대한 4가지의 전달함수를 가지게 된다. 그 중 2개는 아래와 같다. 이들은 입력과 출력의 전달함수로 다른 power 변..

기계적 임피던스와 어드미턴스 상호작용 컨트롤의 일반적인 형태는 매니퓰레이터의 임피던스나 어드미턴스를 조절하는 것이다. 힘을 전압이라고 보고 전류를 속도라고 보게 되면 기계적인 임피던스는 전기적 임피던스와 동일하게 볼 수 있고, 전력의 흐름을 정의하는 변수들의 결합으로 특정지어 진다. 이는 아래의 내용으로 정의 된다. 정의1. 포트에서의 기계적인 임피던스는 동일한 포트에서 시간에 대한 속도(velocity, angular velocity) 함수를 Input으로 가지고, 시간에 대한 힘(force, Torque)을 output으로 만드는 동적 연사자이다. 이를 Z 라고 두자. 그리고 포트에서 기계적인 임피던스는 동일한 포트에서 시간에 대한 함수 힘을 input으로 가지고, 속도를 시간에 대한 함수로 ou..
QMIX는 저번 COMA리뷰에 이은 2번째 멀티에이전트 강화학습에 대한 논문리뷰입니다. QMIX에 대해 공부할때는 크게 3가지 자료를 보시면 많이 도움이 되는데요, 1. 원 논문 arxiv.org/abs/1803.11485 QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning In many real-world settings, a team of agents must coordinate their behaviour while acting in a decentralised way. At the same time, it is often possible to train the agents in a centr..

작성자 : 한양대학원 융합로봇시스템학과 유승환 석사과정 (CAI LAB) 오늘은 PMLR(Proceedings of Machine Learning Research) 학회의 2019년에 나온 딥러닝 논문인 EfficientNet에 대해 리뷰해보겠습니다~!원문 : arxiv.org/pdf/1905.11946.pdf참고 블로그 : hoya012.github.io/blog/EfficientNet-review/ EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 리뷰ICML 2019에 제출된 “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks” 논문에 ..

Atari, Mujoco, Gym이런거 말고 더 없을까 해서 알아봄. 마리오같은 흔한 환경은 제외함 재밌는 환경들이 많으니 감상만 하셔도 될듯합니다 ㅎㅎㅎ 1. D4RL 다양한 환경들 sites.google.com/view/d4rl/home D4RL A collection of benchmarks and datasets for offline reinforcement learning sites.google.com 주방 환경도 있음 ㅋ 2. CHALET: Cornell House Agent Learning Environment 집안일 관련 환경 제공. 방사이를 옮겨다니면서 집안 가구들과 상호작용을 액션으로 할 수 있음 github.com/lil-lab/chalet lil-lab/chalet Cornell H..

#rangeimage #로봇공학 #pointcloud #포인트클라우드 Range image란 특정 위치에서 환경속의 특정 포인트까지의 거리를 2D 이미지로 표현한 것을 말한다. 특정 위치는 주로 센서의 위치가 되는 경우가 일반적이다. Range image는 거리에 상응하는 픽셀값들을 가지게 된다. 만약 range image를 만드는게 사용 된 센서가 픽셀값들이 잘 켈리브레이션이 되어 있다면 바로 실제 수치값으로 변환될 수 있다. ToF를 쓰는 뎁스카메라에 대해서 이야기해보자. 깊이는 RF펄스 대신 광펄스가 사용된다는 점을 제외하고 rador image와 range image는 비슷하다. ToF는 스캔방식이 아니고 single light pulse 형태로 전체 환경(scene)을 캡쳐한다는 점에서 회전 하..

editor, Junyeob Baek Robotics Software Engineer /RL, Motion Planning and Control, SLAM, Vision 이번에는 얼마전 Github에 공개한 오픈소스 패키지에 대해 소개해보려한다. :) policy distillation은 현재 연구중인 논문과 관련해 찾아보다가 유용하게 쓸 수 있겠다 싶어 자세히 공부하고 있었던 개념이다. 근데 생각보다 Github에 control task를 위한 policy distillation 모듈이 제대로 구현되어있는 repo가 없다는게 함정이다. 나름 DeepMind에서 나온 논문이고 쓸만하다고 생각하는 개념인데 인기가 생각보다 없나보다...T.T 어짜피 하던 연구를 진행하려면 제대로 된 policy distil..
보호되어 있는 글입니다.