2ヶ月前

FSD V2: 仮想ボクセルを用いた完全スパース3D物体検出の改善

Fan, Lue ; Wang, Feng ; Wang, Naiyan ; Zhang, Zhaoxiang
FSD V2: 仮想ボクセルを用いた完全スパース3D物体検出の改善
要約

LiDARを基にした完全スパースアーキテクチャが注目を集めています。FSDv1は代表的な作品として、優れた効果と効率を達成していますが、複雑な構造と手作りの設計を特徴としています。本論文では、FSDv1の簡素化を目指し、その手作りのインスタンスレベル表現によって導入された誘導バイアスを排除することで、より良い汎用性を促進するFSDv2の進化版を提案します。この目的のために、FSDv1におけるクラスタリングベースのインスタンスセグメンテーションを置き換える仮想ボクセルという概念を導入します。仮想ボクセルは、完全スパース検出器において有名な「中心特徴欠損問題(Center Feature Missing problem)」に対処するだけでなく、フレームワークにより洗練されかつ流れるような手法を与えるものです。これにより、仮想ボクセルエンコーダー、仮想ボクセルミキサー、および仮想ボクセル割り当て戦略などの一連のコンポーネントを開発しました。経験的な検証を通じて、仮想ボクセルメカニズムが機能的にFSDv1の手作りクラスタリングと類似していることを示すとともに、より一般的であることを確認しました。私たちはWaymoオープンデータセット、Argoverse 2データセット、nuScenesデータセットという3つの大規模データセットで実験を行いました。結果はすべての3つのデータセットで最先端の性能を示しており、FSDv2が長距離シナリオでの優位性と多様なシナリオにおける競争力のある性能を達成する汎用性を持つことを強調しています。さらに、FSDv2の動作について包括的な実験分析を提供しています。再現性とさらなる研究を促進するために、FSDv2のオープンソースコードをhttps://github.com/tusen-ai/SSTで公開しています。

FSD V2: 仮想ボクセルを用いた完全スパース3D物体検出の改善 | 最新論文 | HyperAI超神経