7日前

DriveTransformer:スケーラブルなエンドツーエンド自動運転のための統合型Transformer

Jia, Xiaosong, You, Junqi, Zhang, Zhiyuan, Yan, Junchi
DriveTransformer:スケーラブルなエンドツーエンド自動運転のための統合型Transformer
要約

エンドツーエンド自動運転(E2E-AD)は、データ駆動型かつスケーラブルなシステム設計のアプローチを約束する、自動運転分野における新たなトレンドとして浮上している。しかし、既存のE2E-AD手法は、一般的に「認識-予測-計画」という順次的パラダイムを採用しており、累積誤差や学習の不安定性を引き起こす。また、タスクの手動的な順序付けにより、タスク間の相乗効果(例えば、計画に配慮した認識やゲーム理論に基づく相互作用予測・計画)を活用する能力が制限される。さらに、既存手法で採用されている高密度のBEV(Bird’s Eye View)表現は、長距離の認識や長期的な時系列融合において計算上の課題をもたらす。こうした課題に対処するために、本研究ではスケーラビリティを重視した簡素化されたE2E-ADフレームワーク「DriveTransformer」を提案する。このフレームワークは以下の3つの特徴を持つ:(1)タスク並列性(各ブロックにおいて、すべてのエージェント、地図、計画クエリが直接相互作用)、(2)疎な表現(タスククエリがセンサの生データ特徴と直接相互作用)、(3)ストリーミング処理(タスククエリは履歴情報として保持・伝達される)。その結果、新たなフレームワークは、タスク自己注意(task self-attention)、センサクロス注意(sensor cross-attention)、時系列クロス注意(temporal cross-attention)という3つの統一された演算によって構成され、システムの複雑性を著しく低減し、学習の安定性を向上させる。DriveTransformerは、シミュレートされたクローズドループベンチマーク「Bench2Drive」と、現実世界のオープンループベンチマーク「nuScenes」の両方で、最先端の性能を達成しており、高いFPS(フレーム毎秒)での実行を実現している。

DriveTransformer:スケーラブルなエンドツーエンド自動運転のための統合型Transformer | 最新論文 | HyperAI超神経