
摘要
行人轨迹预测是一项实际任务,旨在预测道路上行人在未来的位置,通常涵盖轨迹中从短期到长期的全部时间范围。然而,现有方法普遍采用单一且统一的训练范式来处理整个轨迹的预测,忽视了行人轨迹中短期动态与长期依赖之间的本质差异。为克服这一局限,本文提出一种新颖的渐进式预训练任务学习框架(Progressive Pretext Task learning, PPT),该框架通过逐步提升模型捕捉短期动态与长期依赖的能力,最终实现对完整未来轨迹的精准预测。具体而言,PPT框架精心设计了三个阶段的训练任务:在第一阶段,模型通过逐步预测下一步位置的任务,学习理解短期动态行为;在第二阶段,模型进一步通过目的地预测任务,增强对长期依赖关系的建模能力;在第三阶段,模型综合前两个阶段所习得的知识,完成对完整未来轨迹的预测任务。为缓解模型在多阶段训练中可能出现的知识遗忘问题,我们进一步引入跨任务知识蒸馏机制,有效保留和迁移先前阶段的学习成果。此外,我们设计了一种基于Transformer的轨迹预测器,通过融合目的地驱动的预测策略与一组可学习的提示嵌入(learnable prompt embeddings),实现了高效的两步推理过程,显著提升了预测效率与精度。在多个主流基准数据集上的大量实验结果表明,所提出的PPT方法在保持高效率的同时,达到了当前最先进的性能水平。相关代码已开源,地址为:https://github.com/iSEE-Laboratory/PPT。