연구를 시작할 때 나는 종종 새로운 아이디어가 주는 흥분에 먼저 끌렸다. 문제를 수학적으로 정식화할 수 있고, 모델 구조도 떠오르고, 구현의 윤곽도 보이면 이미 절반쯤은 해낸 것 같은 기분이 들었다. 이번에도 그랬다. discrete action과 continuous action을 함께 순차적으로 생성하는 policy를 설계하고, 이를 Dubins TSP에 적용해 볼 수 있지 않을까 생각했다. 문제는 분명 흥미로웠다. 방문 순서라는 이산적 결정과 heading angle이라는 연속적 결정을 한 모델 안에서 함께 다루는 그림은 아름다워 보였다. 한동안은 그 구조 자체가 연구의 충분한 이유처럼 느껴졌다. 하지만 조금 더 들여다보자 다른 질문이 생겼다. “이 문제가 정말 지금 내가 시간을 쏟아부을 만한 문제인..
keep9oing
2026. 4. 6. 18:00
