17일 전
다중 감독을 이용한 보행자 궤적 예측을 위한 시계열 피라미드 네트워크
Rongqin Liang, Yuanman Li, Xia Li, yi tang, Jiantao Zhou, Wenbin Zou

초록
혼잡한 인파 속에서 사람의 운동 행동을 예측하는 것은 자율 주행 차량의 자연스러운 주행부터 영상 감시 시스템의 지능형 보안까지 다양한 응용 분야에서 매우 중요하다. 기존의 모든 연구들은 단일 해상도로 궤적을 모델링하고 예측하는 방식을 사용해 왔으며, 이는 효율성이 낮고, 궤적의 장거리 정보(예: 목적지)와 단거리 정보(예: 특정 시점에서의 걷는 방향 및 속도)를 동시에 효과적으로 활용하기 어려웠다. 본 논문에서는 압축 조절(squeeze modulation)과 확장 조절(dilation modulation)을 통해 보행자 궤적 예측을 위한 시계열 피라미드 네트워크(temporal pyramid network)를 제안한다. 제안하는 계층적 프레임워크는 상단에서 하단으로 갈수록 점점 더 풍부한 시계열 정보를 갖춘 특징 피라미드를 구축함으로써 다양한 속도에서의 운동 행동을 보다 효과적으로 포착할 수 있다. 더불어 다중 감독을 활용한 거친 것에서 세밀한 것으로의 융합 전략(coarse-to-fine fusion strategy)을 제안한다. 상단의 전역적 맥락의 거친 특징을 하단의 풍부한 국소적 맥락의 세밀한 특징에 단계적으로 병합함으로써, 본 방법은 궤적의 장거리 및 단거리 정보를 모두 최대한 활용할 수 있다. 다양한 벤치마크에서의 실험 결과를 통해 제안한 방법의 우수성이 입증되었다.