2ヶ月前

Bench2Drive: クローズドループのエンドツーエンド自動運転における多機能ベンチマークを目指して

Jia, Xiaosong ; Yang, Zhenjie ; Li, Qifeng ; Zhang, Zhiyuan ; Yan, Junchi
Bench2Drive: クローズドループのエンドツーエンド自動運転における多機能ベンチマークを目指して
要約

基礎モデルの急速な拡大が特徴的な時代において、自動運転技術はデータ駆動型のスケーラビリティの可能性により、エンドツーエンド自動運転(E2E-AD)が変革の閾値に近づいています。しかし、既存のE2E-AD手法は主にオープンループ・ログリプレイ方式で評価されており、L2誤差と衝突率を指標として使用しています(例:nuScenes)。これらの指標は最近コミュニティで認識されているように、アルゴリズムの運転性能を完全に反映していません。クローズドループプロトコルで評価されるE2E-AD手法については、固定ルート(例:CARLAのTown05LongとLongest6)でドライビングスコアを使用してテストされますが、この方法は長いルートでの未平滑化された指標関数と大きなランダム性により高分散が知られています。さらに、これらの手法は通常独自にデータを収集して訓練を行うため、アルゴリズムレベルでの公正な比較が困難となっています。フルセルフドライブ(FSD)の包括的かつ現実的で公平なテスト環境の重要なニーズに対応するため、私たちはBench2Driveを提案します。これは初めてクローズドループ方式でE2E-ADシステムの複数の能力を評価するベンチマークです。Bench2Driveの公式トレーニングデータには、CARLA v2における44種類のインタラクティブシナリオ(カットイン、追い越し、迂回など)、23種類の天候条件(晴れ、霧、雨など)、12種類の街並み(都市部、村、大学など)から均等に分布した13638個の短いクリップを集めた約200万フレームが含まれています。その評価プロトコルでは、異なる場所と天候条件下で44種類のインタラクティブシナリオを通過することを求められており、合計220ルートを提供することで様々な状況下での運転能力について包括的かつ分解された評価を行います。私たちは最先端のE2E-ADモデルを実装し、Bench2Drive上で評価を行い、現在の状況と将来の方針に関する洞察を提供します。

Bench2Drive: クローズドループのエンドツーエンド自動運転における多機能ベンチマークを目指して | 最新論文 | HyperAI超神経