7日前
HiP-AD:シングルデコーダーにおける自律走行のための変形アテンションを用いた階層的かつ多粒度計画
Yingqi Tang, Zhuoran Xu, Zhaotie Meng, Erkang Cheng

要約
近年、エンドツーエンド自動運転(E2E-AD)技術は顕著な進展を遂げているが、クローズドループ評価においては依然として満足のいかない性能が見られる。クエリ設計および相互作用における計画(planning)の活用可能性は、まだ十分に探求されていない。本論文では、多段階の計画クエリ表現を導入し、さまざまなサンプリングパターン下で空間的、時系列的、ドライビングスタイルに分類される異種のウェイポイントを統合する。この表現により、軌道予測に対して追加の教師信号を提供し、エゴ車両の高精度なクローズドループ制御を実現する。さらに、計画軌道の幾何学的特性を明示的に活用し、可変アテンション(deformable attention)を用いて物理的な位置に基づいて関連する画像特徴を効果的に検索する。これらの戦略を統合することで、新たなエンドツーエンド自動運転フレームワーク「HiP-AD」を提案する。HiP-ADは、統一されたデコーダ内で同時並行的に認知(perception)、予測(prediction)、計画(planning)を実行する。また、BEV(Bird's Eye View)空間において計画クエリが認知クエリと反復的に相互作用できるようにし、パースペクティブビューから動的に画像特徴を抽出することで、包括的な相互作用を可能にする。実験の結果、HiP-ADはクローズドループベンチマーク「Bench2Drive」において、既存のすべてのエンドツーエンド自動運転手法を上回り、実世界データセットnuScenesにおいても競争力ある性能を達成した。