7日前

DiffAD:自律走行のための統一された拡散モデリングアプローチ

Tao Wang, Cong Zhang, Xingguang Qu, Kun Li, Weiwei Liu, Chang Huang
DiffAD:自律走行のための統一された拡散モデリングアプローチ
要約

エンドツーエンド自動運転(E2E-AD)は、完全自動運転の実現に向けて急速に注目される有望なアプローチとして浮上している。しかし、従来のE2E-ADシステムは一般的に従来のマルチタスク枠組みを採用しており、認識(perception)、予測(prediction)、計画(planning)といったタスクをそれぞれ専用の出力ヘッドで処理している。完全微分可能な形で学習されているにもかかわらず、タスク間の連携に課題が残っており、システムの複雑性も依然として高いという問題がある。本研究では、自動運転を条件付き画像生成タスクとして再定式化する新しい拡散確率モデル「DiffAD」を提案する。異種の対象物を統一された鳥瞰図(Bird's-Eye View, BEV)にラスタライズし、それらの潜在分布をモデル化することで、DiffADはさまざまな運転目標を統合し、単一のフレームワーク内ですべての運転タスクを共同最適化する。これにより、システムの複雑性を顕著に低減するとともに、タスク間の連携を効果的に調和させる。逆過程(reverse process)により生成されたBEV画像を反復的に精緻化することで、より堅牢で現実的な運転行動が得られる。Carlaにおけるクローズドループ評価において、本手法は新たな最良成績(state-of-the-art)を達成し、成功確率(Success Rate)およびドライブスコア(Driving Score)の両面で優位性を示した。コードは公開予定である。

DiffAD:自律走行のための統一された拡散モデリングアプローチ | 最新論文 | HyperAI超神経