연구를 시작할 때 나는 종종 새로운 아이디어가 주는 흥분에 먼저 끌렸다. 문제를 수학적으로 정식화할 수 있고, 모델 구조도 떠오르고, 구현의 윤곽도 보이면 이미 절반쯤은 해낸 것 같은 기분이 들었다. 이번에도 그랬다. discrete action과 continuous action을 함께 순차적으로 생성하는 policy를 설계하고, 이를 Dubins TSP에 적용해 볼 수 있지 않을까 생각했다. 문제는 분명 흥미로웠다. 방문 순서라는 이산적 결정과 heading angle이라는 연속적 결정을 한 모델 안에서 함께 다루는 그림은 아름다워 보였다. 한동안은 그 구조 자체가 연구의 충분한 이유처럼 느껴졌다. 하지만 조금 더 들여다보자 다른 질문이 생겼다. “이 문제가 정말 지금 내가 시간을 쏟아부을 만한 문제인..
이번 포스팅은 무인기나 로봇의 다개체 시스템을 위한 알고리즘을 연구하고 적용해보면서 경험해본 군집 시스템 운용을 위한 구조화에 대한 두서없는 개인적인 생각이다. 군집 무인기나 멀티 로봇 시스템을 다룰 때 단일 개체인 상황과 가장 다른 부부을 꼽자면 군집 구조이다. 이 때 군집 구조는 크게 중앙 집중, 계층화, 분산화 구조처럼 3가지를 나눌 수 있다.이 구조를 또 다시 의사결정 혹은 정보공유(통신) 2가지 측면에서 나눠서 생각할 수 있게 된다.특히 정보공유에 (통신)이라고 붙인 이유는, 두 개념이 서로 강하게 의존적이지만 때에 따라서 분리될 수 있기 떄문에 이렇게 불렀다. 그럼 대충 크게 6가지 정도되는 경우의 수가 나오게 되는 것이다. 저 2가지 측면[의사결정/정보공유(통신)]으로 나눠진다는 것이 좀 생..
분산형 multi agent 제어 분야에서는 주로 agent들의 합의(consensus)가 얼마나 빨리 이뤄지는 지가 주된 관심사이다.예를 들어, formation 제어에서 모든 agent들이 정해진 거리를 유지하는 것과, randezvous 제어에서 공통된 위치로 모이는 것과 같은 일들이 중요한 것이다. multi agent 제어 분야가 일반적인 single agent제어와 가장 다른점은 agent간의 통신을 고려해야 한다는 점이다. 이 때 agent들이 어떤 모양으로 연결되어 통신 가능한지 나타낸 것이 network topology인데, 이 형상이 consensus가 이뤄지는 수렴 속도에 큰 영향을 미친다. 이 network topology는 무선 통신의 경우 통신 거리에 따라 다르게 형성 될 수 도..
기본 개념Wh = Ah X VWh: 1시간 동안 생산 혹은 소비되는 전력의 양Ah: 1암페어 전류가 1시간동안 흘렀을 때 전류량 (capacity)V: 공칭 전압 (nominal voltage)Energy Consumed(Wh) = Power Consumption(W) X Time(h)Remaining Energy(Wh) = Total Battery Capacity(Wh) - Energy Consumed(Wh)EvaluationRemaining Time(h) = Remaining Energy(Wh) / Average Power Consumption(W)Remaining Percentage(%) = Remaining Energy(Wh) / Total Battery Capacity(Wh) X 100Fixed..
Free space path loss model (dB)경로 손실$$ 20log_{10}d + 20log_{10}f+20log_{10}\left( \frac{4\pi}{c} \right)$$$d$ (m): 통신 거리$f$ (Hz): 신호 주파수$c$ (m/s): 빛의 속도RSSI (dBm)수신 신호 강도$$P_{tx} - pathloss$$$P_{tx}$ (dBm): 송신 전력$pathloss$ (dB): 경로 손실SNR (dB)신호 대 잡음비$$RSSI-Noise=\frac{P_s}{P_n}$$$P_s$ (dBm): 신호 전력$P_n$ (dBm): 노이즈 전력Channel capacity (bps, bit/sec)채널 용량: 오류 없는 통신의 이론적 한계, 신뢰성 있는 통신이 가능한 최고 전송률, 채..
Abstract RL의 time limit을 어떻게 다뤄야 하는지에 대해 연구 Time limit을 적절하게 고려하지 않을 경우 일어나는 문제점 state aliasing invalidation of experience replay 위 문제점들로 인한 sub-optimal policy학습과 training instability 발생 RL적용 시 time horizon 종류별 time limit에대한 관점 제시 Fixed period 이 경우 time limit은 환경의 부분으로 생각해야하며 Markov property를 위반하지 않기위해선 남은 시간(remaining time)에 대한 개념을 고려해야한다. Indefinite period Time limit은 환경으로써 고려될 필요 없고, 오직 학습을 위..
2023년도 이제 이틀정도 남았습니다. 매년하는건 아니지만 올해 마무리를 하며 간단히 작성합니다. 올 한해는 크게 두 시즌으로 나뉜것 같네요. 상반기는 연구와 공부를 진행했고, 하반기는 밀려드는 과제에 휩쓸려 다녔습니다. 연구는 그동안 진행하던 학습기반 task allocation (mission planning) 연구를 좀 더 복잡한 환경에 대해 심화시켜 적용하는 것과 non holonomic robot들의 학습기반 flocking 알고리즘에 대한 연구를 진행했습니다. flocking은 군집로봇들이 특별한 formation없이 부딪히지 않고 몰려다니는 이동 방식인데, 사실 학위과정을 시작하며 가장 해보고 싶었던 연구라 상당히 만족하면서 진행했습니다. 과제는,, 올해가 첫해인 과제도 있어서 상당히 애를 ..
오랜 생각이 하나 있는데, 좀 두서 없고 말도안되더라도 용서해주시길 바랍니다. ㅎㅎ 하나의 가정(상상)에서 시작한다. 만약 로봇들이 만들어진 목적에 맞게 완벽하게 작동하면 어떻게 될까? 그리고 그 유효성이 입증돼서 사용가능한 로봇의 수가 굉장히 많아진다면? 그렇게되면, 로봇 한대의 개체는 한 가지 이상의 작업을 잘 하기위한 복잡한 시스템으로 여겨져 왔지만 그냥 입력을 주면 당연히 그 작업을 잘 수행해내는 유닛(unit)으로 보게되는 시점이 올 것이다. 그렇다면 여러대의 로봇 묶음을 컴퓨터의 CPU처럼 생각해서 하나의 큰 작업 과정 자체를 작은 작업 단위들로 프로그래밍을 할 수 있을 것이다. CPU의 연산 유닛을 로봇 묶음의 로봇 한 대로 볼 수 있게되는 것이다. 그렇게해서 소프트웨어나 서비스를 개발하듯이..
