PRANK: RANKing을 기반으로 한 동작 예측

보행자나 인간 운전 차량과 같은 에이전트의 운동을 예측하는 것은 자율주행 분야에서 가장 핵심적인 문제 중 하나이다. 운전의 전반적인 안전성과 승객의 편안함은 이 문제의 성공적인 해결에 직접적으로 의존한다. 또한, 운동 예측 문제는 자율주행 공학 분야에서 여전히 가장 도전적인 과제 중 하나로 남아 있으며, 주로 특정 상황에서 에이전트의 미래 행동이 매우 다양할 수 있다는 점에서 기인한다. 이러한 다양성의 원인은 두 가지 현상에 기인한다. 첫째, 에이전트의 의도에 대한 불확실성(예: 오른쪽으로 회전할지 직진할지)으로 인한 다중모달성(multimodality)이며, 둘째, 주어진 의도를 구현할 때의 불확실성(예: 어느 차선으로 회전할지)이다. 실시간 자율주행 파이프라인 내에서 유용하게 활용되기 위해서는, 운동 예측 시스템이 이러한 불확실성을 효율적으로 설명하고 정량화할 수 있어야 한다. 예를 들어, 사후 모드(posterior modes)와 그 확률을 계산하거나, 주어진 궤적에 해당하는 점에서의 밀도를 추정하는 방식이 필요하다. 또한, 물리적으로 불가능한 궤적에 과도한 확률 밀도를 부여해서는 안 되며, 그렇지 않으면 예측 결과를 처리하는 시스템이 혼란에 빠질 수 있다. 본 논문에서는 이러한 요구사항을 충족하는 PRANK 방법을 제안한다. PRANK는 에이전트 주변의 래스터화된 위성 이미지를 입력으로 받아, 컨볼루션 신경망을 통해 장면의 특징을 추출한다. 이후 주어진 장면에서 가능성이 있는 에이전트의 궤적에 대한 조건부 분포를 생성한다. PRANK의 핵심 기여는 잠재 궤적 공간에서 최근접 이웃(nearest-neighbor) 기법을 활용하여 이러한 분포를 표현하는 방식으로, 실시간에서 효율적인 추론을 가능하게 한다. 우리는 PRANK을 자체 개발 데이터셋과 Argoverse 데이터셋에서 평가하였으며, 경쟁력 있는 성능을 보였다.