11日前

BEVDepth:マルチビュー3Dオブジェクト検出における信頼性のあるDepthの取得

Yinhao Li, Zheng Ge, Guanyi Yu, Jinrong Yang, Zengran Wang, Yukang Shi, Jianjian Sun, Zeming Li
BEVDepth:マルチビュー3Dオブジェクト検出における信頼性のあるDepthの取得
要約

本研究では、カメラベースの鳥瞰図(Bird's-Eye-View, BEV)3次元物体検出を目的として、信頼性の高い深度推定を備えた新しい3次元物体検出器「BEVDepth」を提案する。本研究の出発点は、カメラによる3次元検出において深度情報が極めて重要であるという事実に対し、最近のアプローチにおける深度推定の性能が驚くほど不十分であるという重要な観察である。BEVDepthは、明示的な深度監視(explicit depth supervision)を活用することで、この課題を解決する。さらに、深度推定能力を向上させるために、カメラに適応した深度推定モジュールを導入している。また、不正確な特徴のアンプロジェクション(unprojection)によって引き起こされる副作用を軽減するため、新規の深度精調モジュール(Depth Refinement Module)を設計した。カスタマイズされた効率的なボクセルプーリング(Efficient Voxel Pooling)とマルチフレーム機構を組み合わせることで、BEVDepthは挑戦的なnuScenesテストセットにおいて、新たな最先端のNDSスコア60.9%を達成しつつ、高い効率性を維持した。本研究により、カメラモデルにおけるNDSスコアが初めて60%を達成した。

BEVDepth:マルチビュー3Dオブジェクト検出における信頼性のあるDepthの取得 | 最新論文 | HyperAI超神経