SparseDrive:スパースなシーン表現を用いたエンドツーエンド自動運転

広く確立されたモジュール型自律走行システムは、認識(perception)、予測(prediction)、計画(planning)といった独立したタスクに分解されるが、この構成はモジュール間で情報損失や誤差の累積を引き起こすという課題を抱えている。これに対して、エンドツーエンド(end-to-end)アプローチは、複数のタスクを微分可能かつ統合的なフレームワークに統合し、計画志向の最適化を可能にする。エンドツーエンドアプローチには大きな潜在能力があるものの、現行手法の性能および効率は満足できるものではなく、特に計画の安全性において課題が残っている。この原因は、計算コストが高くなる鳥瞰図(BEV: bird’s eye view)特徴量と、予測および計画の設計が単純すぎる点にあると我々は捉えている。こうした課題に対処するため、本研究ではスパース表現(sparse representation)の活用を検討し、エンドツーエンド自律走行のタスク設計を見直し、「SparseDrive」という新しいアーキテクチャを提案する。具体的には、SparseDriveは対称的なスパース認識モジュールと並列型の運動計画モジュールから構成される。スパース認識モジュールは、検出、追跡、オンラインマッピングを対称的なモデル構造により統合し、走行環境の完全なスパース表現を学習する。運動予測と計画に関しては、両者の間にある顕著な類似性を検証した結果、運動計画モジュールを並列構造で設計することを提案する。この並列構造に基づき、計画をマルチモーダル問題としてモデル化した上で、衝突を意識した再スコアリングモジュールを組み込んだ階層的計画選択戦略を提案する。これにより、合理的かつ安全な軌道を最終的な計画出力として選択可能となる。こうした効果的な設計により、SparseDriveはすべてのタスクにおいて従来の最先端技術を大幅に上回る性能を達成するとともに、学習および推論の効率性も著しく向上した。コードは、今後の研究を促進するために https://github.com/swc-17/SparseDrive にて公開される予定である。