
摘要
在人群环境中预测人类运动行为对于众多应用具有重要意义,涵盖自动驾驶车辆的自然导航,到视频监控系统的智能安防等多个领域。以往的研究大多采用单一分辨率对轨迹进行建模与预测,这种方法效率较低,难以同时有效利用运动行为中的长距离信息(如轨迹的终点)与短距离信息(如某一时刻的行走方向和速度)。本文提出一种基于挤压调制(squeeze modulation)与扩张调制(dilation modulation)的时序金字塔网络,用于行人轨迹预测。所提出的分层框架自上而下构建了一个包含逐层丰富时序信息的特征金字塔,能够更有效地捕捉不同节奏下的运动行为特征。此外,我们设计了一种粗到细的融合策略,并结合多监督机制,通过逐步将高层全局上下文的粗粒度特征融合至底层局部上下文的细粒度特征中,充分挖掘轨迹的长距离与短距离信息。在多个基准数据集上的实验结果表明,所提方法具有显著优势。