2ヶ月前
単眼3D物体検出の解明
Simonelli, Andrea ; Bulò, Samuel Rota Rota ; Porzi, Lorenzo ; López-Antequera, Manuel ; Kontschieder, Peter

要約
本論文では、単一のRGB画像から単眼3D物体検出を行うための手法を提案します。この手法は、2Dと3D検出損失の新しい分離変換と、3Dバウンディングボックス用の新しい自己監督信頼度スコアを活用しています。我々が提案する損失分離は、パラメータ間の複雑な相互作用を持つ損失が存在する場合の学習ダイナミクスを簡素化し、独立した回帰項のバランス調整問題を回避するという二つの利点があります。この解決策は、特定の損失に対するパラメータ群の貢献をその性質を変えずに分離することによってこれらの問題を克服します。さらに、2D検出結果の向上のために、符号付きIntersection-over-Union(IoU)基準駆動型損失にも損失分離を適用しています。方法論的な革新に加えて、3D検出結果比較で最も重要なデータセットとなったKITTI3Dで使用されているAP指標について批判的に見直しました。11ポイント補間AP指標に存在する欠陥を特定し、解決しました。この欠陥はこれまでに公開されたすべての検出結果に影響を与え、特に単眼3D検出の結果に偏りをもたらしていました。我々はKITTI3DおよびnuScenesデータセットにおいて広範な実験評価と削減研究を行い、自動車オブジェクトカテゴリにおいて大幅なマージンで新たな最先端結果を達成しました。