
본 논문에서는 사회적 환경 이미지와 과거 궤적을 바탕으로 실세계에서 이동하는 에이전트의 미래 궤적 분포를 예측하는 것을 목표로 한다. 그러나 실제 분포는 알려져 있지 않고 관측할 수 없으며, 모델 학습을 위한 지도 신호로는 그 분포로부터 추출된 단일 샘플만 사용할 수 있기 때문에, 이는 편향이 발생하기 쉬운 도전적인 과제이다. 최근 대부분의 연구들은 실제 분포의 모든 모드를 포괄할 수 있도록 다양한 궤적을 예측하는 데 초점을 맞추고 있으나, 정밀도를 간과하여 현실성이 낮은 예측에 과도한 신뢰를 두는 경향이 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 점유 그리드 맵(occupancy grid maps)을 실제 분포에 대한 명시적이고 장면에 부합하는 근사치로 사용하여 대칭 교차 엔트로피(symmetric cross-entropy)를 통해 분포를 학습한다. 이 방법은 부적절한 예측에 효과적으로 벌점을 부과할 수 있다. 구체적으로, 우리는 종단적(end-to-end)으로 근사가치 반복 네트워크(approximate value iteration network)를 통해 계획을 학습하는 기반을 두고, 역강화학습(inverse reinforcement learning) 기반의 다중 모드 궤적 분포 예측 프레임워크를 제안한다. 또한 예측된 분포를 바탕으로, 주목기반(attention-based)의 미분 가능한 Transformer 기반 네트워크를 통해 대표적인 궤적의 소규모 집합을 생성하며, 이 네트워크의 주목 메커니즘이 궤적 간의 관계를 효과적으로 모델링하는 데 기여한다. 실험 결과, 본 방법은 스탠포드 드론 데이터셋(Stanford Drone Dataset)과 인터섹션 드론 데이터셋(Intersection Drone Dataset)에서 최신 기술 대비 우수한 성능을 달성하였다.