자기 중심 위치 인식을 통합한 더 현실적인 포인트-골 탐색 에이전트 개발

최근 연구들은 새로운 실내 환경에서 포인트 목표(점 목표)로 이동하는 몸을 가진 에이전트들(embodied agents)이 거의 완벽한 정확도로 탐색할 수 있음을 보여주었다. 그러나 이러한 에이전트들은 정밀한 센서를 갖추고 있으며, 결정론적인 동작을 수행한다. 이와 같은 설정은 현실 세계에서 흔히 발생하는 노이즈가 있는 센서와 동작의 복잡한 현실과 비교할 때 실질적으로 단조롭고 이상적인 상황이다. 예를 들어, 로봇의 바퀴는 미끄러질 수 있고, 운동 센서에는 오차가 존재하며, 액추에이터의 동작은 반동을 일으킬 수 있다. 본 연구에서는 이러한 노이즈가 있는 현실에 더 가까운 환경을 고려하여, 노이즈 있는 동작 역학 하에서 시각적 자기 운동 추정(egomotion)에 기반한 포인트 목표 탐색 에이전트를 개발한다. 실험 결과, 기존 포인트 목표 에이전트를 이 환경에 단순히 적용한 경우나 고전적인 위치 추정 기반 베이스라인을 통합한 경우보다 본 연구에서 제안한 에이전트가 더 우수한 성능을 보였다. 또한 본 모델은 개념적으로 에이전트의 동역학 또는 오도메트리(현재 어디에 있는가?) 학습과 특정 작업에 맞춘 탐색 정책(어디로 가야 하는가?) 학습을 분리한다. 이로 인해 시각적 오도메트리 모델만 재보정하면, 로봇의 변경 또는 바닥 유형의 변화와 같은 동역학의 변화에 원활하게 대응할 수 있으며, 탐색 정책의 재학습이 필요 없어 비용을 절감할 수 있다. 본 에이전트는 2020년 CVPR Habitat 챌린지의 PointNav 트랙에서 준우승을 차지했다.