Adaptive control은 쉽게 말해 모델의 불확실성을 파라미터를 조절하여 해결하는 제어 방식이다. Adaptive control에 사용되는 개념 중에 integral adaptive law가 있다. Integral adaptive law는 파라미터가 불확실하거나 time variant(시간에 따라 변할 때)할 때 파라미터를 추정할 때 사용 된다. 즉, Adaptive control의 큰 틀에서 estimator에 사용 되는 개념이다. Integral adaptive law는 이름에서도 알 수 있듯이 시스템 오차 신호를 적분하여 파라미터 추정치를 업데이트 하게 된다. 시스템의 출력과 원하는 reference 출력 사이의 오차를 시간에 대해 적분하여 이를 파라미터 추정에 사용한다. 시간에 따른 파..
Abstract RL의 time limit을 어떻게 다뤄야 하는지에 대해 연구 Time limit을 적절하게 고려하지 않을 경우 일어나는 문제점 state aliasing invalidation of experience replay 위 문제점들로 인한 sub-optimal policy학습과 training instability 발생 RL적용 시 time horizon 종류별 time limit에대한 관점 제시 Fixed period 이 경우 time limit은 환경의 부분으로 생각해야하며 Markov property를 위반하지 않기위해선 남은 시간(remaining time)에 대한 개념을 고려해야한다. Indefinite period Time limit은 환경으로써 고려될 필요 없고, 오직 학습을 위..