11日前

レイノイズ除去:マルチビュー3Dオブジェクト検出における深さ認識型ハードネガティブサンプリング

Feng Liu, Tengteng Huang, Qianjing Zhang, Haotian Yao, Chi Zhang, Fang Wan, Qixiang Ye, Yanzhao Zhou
レイノイズ除去:マルチビュー3Dオブジェクト検出における深さ認識型ハードネガティブサンプリング
要約

マルチビュー3Dオブジェクト検出システムは、画像からの深度推定が困難なことにより、正確な予測を生成することが難しく、重複や誤検出が増加する傾向にあります。本論文では、カメラの視線(ray)に沿って戦略的にサンプリングすることで、難易度の高い負例(hard negative examples)を構築する新しい手法「Ray Denoising」を提案します。これらの負例は視覚的に真陽性(true positive)と区別がつきにくく、モデルが深度に敏感な特徴を学習するよう強制することで、真陽性と偽陽性の区別能力が向上します。Ray Denoisingは、任意のDETR型マルチビュー3D検出器と互換性を持つプラグアンドプレイ型モジュールとして設計されており、トレーニング時の計算コストはわずかに増加するのみで、推論速度に影響を与えません。包括的な実験、特に詳細なアブレーションスタディを通じて、複数のデータセットにおいて強力なベースラインを常に上回ることを確認しました。特にNuScenesデータセットにおいて、最先端手法であるStreamPETRに対して平均精度(mAP)で1.9%の向上を達成しました。また、Argoverse 2データセットにおいても顕著な性能向上が見られ、本手法の汎化能力の高さが示されました。コードは https://github.com/LiewFeng/RayDN にて公開予定です。

レイノイズ除去:マルチビュー3Dオブジェクト検出における深さ認識型ハードネガティブサンプリング | 最新論文 | HyperAI超神経