
歩行者の軌道予測は、道路における歩行者の将来位置を予測する実用的なタスクであり、軌道全体にわたり短期から長期までのあらゆる時間範囲をカバーするものである。しかし、従来の手法は、軌道予測全体を単一かつ均一な学習枠組みで扱おうとしており、歩行者の軌道における短期的ダイナミクスと長期的依存関係の違いを無視している。この制約を克服するため、本研究では、最終的な全軌道予測に向けた短期的ダイナミクスの捉え方と長期的依存関係の理解能力を段階的に向上させる新しい「プログレッシブ事前タスク学習(Progressive Pretext Task learning, PPT)」フレームワークを提案する。具体的には、PPTフレームワーク内で3段階の学習タスクを精緻に設計している。第一段階では、ステップワイズな次位置予測タスクを通じて、モデルが短期的ダイナミクスを理解する能力を学習する。第二段階では、目的地予測タスクを用いて、モデルが長期的依存関係をより深く理解できるように強化する。第三段階では、前段階で得られた知識を活かして、全体の将来軌道予測タスクに取り組む。知識の忘却を軽減するため、さらにクロストラック知識蒸留(cross-task knowledge distillation)を適用している。また、目的地駆動型予測戦略と学習可能なプロンプト埋め込み(prompt embeddings)の統合により、二段階の効率的な推論を実現できるTransformerベースの軌道予測器を設計した。多数の代表的なベンチマークにおける広範な実験結果から、本手法が高い効率性を維持しつつ、最先端の性能を達成することが示された。コードは以下のURLから公開されている:https://github.com/iSEE-Laboratory/PPT。