2달 전

Social-BiGAT: 자전거-GAN과 그래프 어텐션 네트워크를 사용한 다중 모달 트라젝토리 예측

Vineet Kosaraju; Amir Sadeghian; Roberto Martín-Martín; Ian Reid; S. Hamid Rezatofighi; Silvio Savarese
Social-BiGAT: 자전거-GAN과 그래프 어텐션 네트워크를 사용한 다중 모달 트라젝토리 예측
초록

장면 내 여러 상호작용하는 대상들의 미래 궤도를 예측하는 것은 자율 주행 차량 및 사회적 로봇의 제어부터 보안 및 감시에 이르기까지 다양한 응용 분야에서 점점 더 중요한 문제가 되고 있습니다. 이 문제는 인간 간의 사회적 상호작용과 장면과의 물리적 상호작용이 존재함으로써 더욱 복잡해집니다. 기존 연구에서는 이러한 일부 신호를 탐구했지만, 대부분 각 인간의 미래 궤도가 다중 모달(multimodal) 성격을 가지고 있다는 점을 무시했습니다. 본 논문에서는 장면 내 보행자의 사회적 상호작용을 더 잘 모델링하여 실제적인 다중 모달 궤도 예측을 생성하는 그래프 기반 생성 적대 네트워크인 Social-BiGAT를 제시합니다. 우리의 방법은 장면 내 인간 간의 사회적 상호작용을 인코딩하는 신뢰할 수 있는 특징 표현을 학습하는 그래프 어텐션 네트워크(GAT)와 이러한 특징을 바탕으로 인간의 경로를 예측하도록 적대적으로 훈련된 순환 인코더-디코더 구조에 기반하고 있습니다. 우리는 자전거-GAN(Bicycle-GAN)에서와 같이 각 장면과 잠재 노이즈 벡터 사이의 가역 변환(reversible transformation)을 형성하여 예측 문제의 다중 모달 성격을 명시적으로 고려합니다. 실험 결과, 우리 프레임워크는 기존 궤도 예측 벤치마크에서 여러 베이스라인들과 비교하여 최신 수준(state-of-the-art)의 성능을 달성함을 보여주었습니다.