2ヶ月前
DAOcc: 3Dオブジェクト検出支援マルチセンサフュージョンによる3D占有予測
Yang, Zhen ; Dong, Yanpeng ; Wang, Heng ; Ma, Lichao ; Cui, Zijian ; Liu, Qi ; Pei, Haoran

要約
マルチセンサ融合は、自動運転やロボティクスにとって重要な3次元セマンティック占有予測の精度と堅牢性を大幅に向上させます。しかし、既存の大多数の手法は最上位の性能を達成するために高解像度の画像と複雑なネットワークに依存しており、実際の応用が妨げられています。さらに、多くのマルチセンサ融合手法は融合特徴量の改善に焦点を当てていますが、これらの特徴量に対する監督戦略の探索が見過ごされています。この問題に対処するため、私たちはDAOccという新しいマルチモーダル占有予測フレームワークを提案します。DAOccは3次元物体検出監督を利用し、優れた性能を達成するのに役立ちます。また、展開に適した画像特徴抽出ネットワークと実用的な入力画像解像度を使用しています。さらに、BEVビュー範囲拡張戦略を導入することで、低解像度画像による悪影響を軽減します。実験結果では、DAOccがOcc3D-nuScenesおよびSurroundOccベンチマークで新たな最先端性能を達成し、ResNet50と256*704入力画像解像度を使用しながら他の方法よりも大幅に優れていることが示されました。コードはhttps://github.com/AlphaPlusTT/DAOccで公開されます。