2ヶ月前

PlanT: オブジェクトレベルの表現を用いた説明可能なプランニングトランスフォーマー

Katrin Renz; Kashyap Chitta; Otniel-Bogdan Mercea; A. Sophia Koepke; Zeynep Akata; Andreas Geiger
PlanT: オブジェクトレベルの表現を用いた説明可能なプランニングトランスフォーマー
要約

複雑な環境での最適ルートの計画には、周囲のシーンに関する効率的な推論が必要です。人間の運転手は重要な物体に優先的に注意を払い、決定に関係ない詳細を無視しますが、学習ベースのプランナーは通常、すべての車両と道路状況情報を含む高次元かつ高密度のグリッド表現から特徴を抽出します。本論文では、自動運転の文脈における計画に標準的なトランスフォーマー構造を使用する新しい手法であるPlanTを提案します。PlanTは、コンパクトなオブジェクトレベルの入力表現を使用した模倣学習に基づいています。CARLAのLongest6ベンチマークにおいて、PlanTは既存のすべての手法(専門家の運転スコアと同等)を上回り、推論時には同等のピクセルベース計画基準よりも5.3倍高速です。また、市販の認識モジュールとPlanTを組み合わせることで、既存の最先端技術よりも10ポイント以上高い運転スコアを持つセンサーベースド運転システムを提供できます。さらに、プランナーが関連する物体を識別する能力を定量的に評価するプロトコルも提案しており、その意思決定に関する洞察を得ることができます。我々の結果は、PlanTがシーン内の最も関連性のある物体に焦点を当てる能力があることを示しています。これは、その物体が幾何学的に遠くにある場合でも同様です。注:「pixel-based planning baselines」(ピクセルベース計画基準)、「object-level input representation」(オブジェクトレベルの入力表現)などの専門用語については一般的な日本語訳を使用しました。「transformer architecture」(トランスフォーマー構造)や「imitation learning」(模倣学習)なども同様です。ただし、「Longest6 benchmark for CARLA」についてはカッコ内に原文を記載しました。

PlanT: オブジェクトレベルの表現を用いた説明可能なプランニングトランスフォーマー | 最新論文 | HyperAI超神経