7日前

GenAD:生成型エンドツーエンド自律走行

Wenzhao Zheng, Ruiqi Song, Xianda Guo, Chenming Zhang, Long Chen
GenAD:生成型エンドツーエンド自律走行
要約

自律走行において、原始的なセンサー入力から直接計画結果を生成するアプローチは長年にわたり望まれてきたものであり、近年ますます注目を集めている。現在の多くの中間段階を経る自律走行手法は、この問題を認識(perception)、運動予測、計画の3つのフェーズに分解している。しかし、本研究では従来の段階的パイプラインでは、交通環境全体の進化過程を十分にモデル化できない、特に自車と他の交通参加者との将来の相互作用や、軌道の構造的事前知識(trajectory prior)を包括的に捉えることが難しいと指摘する。本論文では、過去のシーンを前提として自車と周囲環境の将来の進化を予測することをキーポイントとする、エンドツーエンド自律走行の新たなパラダイムを提案する。そこで、自律走行を生成モデル化の問題として定式化する「GenAD」という生成フレームワークを提案する。まず、インスタンス中心のシーントークナイザーを用いて、周囲のシーンを地図情報を反映したインスタンストークンに変換する。次に、構造的な潜在空間(structural latent space)において未来の軌道分布を学習するため、変分自己符号化器(variational autoencoder)を導入し、軌道の事前知識をモデル化する。さらに、潜在空間内でエージェントおよび自車の時系列的動きを捉えるための時系列モデルを採用し、より効果的な未来軌道の生成を実現する。GenADは、学習済みの構造的潜在空間からインスタンストークンを条件として分布をサンプリングし、学習済みの時系列モデルを用いて未来を生成することで、運動予測と計画を同時に実行する。広く用いられているnuScenesベンチマークにおける大規模な実験により、本手法が視覚中心のエンドツーエンド自律走行において、高い効率性を伴いながら最先端の性能を達成することが示された。コード:https://github.com/wzzheng/GenAD。

GenAD:生成型エンドツーエンド自律走行 | 最新論文 | HyperAI超神経