
초록
우리는 과거의 운동 정보와 장면 구조를 바탕으로 알 수 없는 환경에서 보행자 및 차량의 궤적을 예측하는 문제를 다룬다. 장면 구조의 큰 변동성과 미래 궤적의 다중모달 분포로 인해 궤적 예측은 도전적인 문제이다. 기존의 접근 방식이 관측된 맥락에서 다수의 미래 궤적을 직접 일대다 매핑으로 학습하는 반면, 본 연구에서는 최대 엔트로피 역강화 학습(MaxEnt IRL)을 통해 학습된 격자 기반 정책에서 샘플링한 계획을 조건으로 하여 궤적 예측을 수행하는 새로운 방법을 제안한다. 우리는 MaxEnt IRL을 재정의하여, 장면에 정의된 거친 2차원 격자 위에서 에이전트의 타당한 목표와 그 목표로 이어지는 경로를 동시에 추론할 수 있도록 한다. 또한, MaxEnt 정책에서 샘플링된 상태 시퀀스를 조건으로 하여 연속적인 미래 궤적을 생성하는 주의 기반 궤적 생성기(attention-based trajectory generator)를 제안한다. 공개된 Stanford Drone 및 NuScenes 데이터셋을 대상으로 한 정량적 및 정성적 평가 결과, 제안하는 모델은 장기 예측 수평에서 다양한 궤적을 생성함으로써 다중모달 예측 분포를 잘 반영하며, 동시에 장면의 기하적 구조를 정확히 따르는 성능을 보였다.