2ヶ月前

RepVF: 多タスク3D認識のための統一されたベクトル場表現

Li, Chunliang ; Han, Wencheng ; Yin, Junbo ; Zhao, Sanyuan ; Shen, Jianbing
RepVF: 多タスク3D認識のための統一されたベクトル場表現
要約

複数の自動運転3D認識タスクを同一の空間時間シーン内で並行処理することは、特に従来の多タスク学習アプローチを使用する場合の計算効率の低さとタスク間での特徴競合により、大きな課題となっています。本論文では、これらの問題に対処するために、3D物体検出や3D車線検出などの様々な認識タスクを単一のフレームワーク内に調和させる新しい統一表現であるRepVFを提案します。RepVFは、シーン内の異なる目標物の構造をベクトル場で表現し、計算冗長性と特徴競合を大幅に削減する単一ヘッド・多タスク学習モデルを可能にします。RepVFに基づいて、我々はRFTRというネットワークを導入します。このネットワークは、階層的なクエリ構造を利用して異なるタスク間およびタスク内の関係性を暗黙的にモデル化することで、異なるタスク間に固有の接続性を活用するように設計されています。この手法は、タスク固有のヘッドやパラメータが必要なくなるため、従来の多タスク学習パラダイムに内在する矛盾を根本的に軽減します。我々はOpenLaneデータセットとWaymo Openデータセットからラベルを組み合わせることで、本手法の有効性を検証しました。本研究は自動運転における多タスク認識の効率性和実効性において重要な進歩であり、複数の3D認識タスクを同期的かつ並列的に処理する新たな視点を提供しています。コードは以下のURLで公開されます: https://github.com/jbji/RepVF