2ヶ月前

SeaBird: 鳥瞰図でのセグメンテーションにDice損失を用いることで大物の単眼3D検出が改善される

Kumar, Abhinav ; Guo, Yuliang ; Huang, Xinyu ; Ren, Liu ; Liu, Xiaoming
SeaBird: 鳥瞰図でのセグメンテーションにDice損失を用いることで大物の単眼3D検出が改善される
要約

単眼3D検出器は、自動車や小さな物体に対して優れた性能を達成しています。しかし、大きな物体に対する性能が低下し、致命的な事故につながることがあります。一部の研究者は、この失敗を訓練データの不足や大きな物体に対する感受野の要件に帰しています。本論文では、大きな物体への汎化という未十分に研究されてきた問題に焦点を当てます。我々は、現代の前面検出器であってもほぼ均等なデータセットでさえ、大きな物体への汎化が困難であることを発見しました。失敗の原因は、大きな物体のノイズに対する深度回帰損失の感度にあると主張します。このギャップを埋めるために、我々は回帰損失とダイス損失を包括的に調査し、異なる誤差レベルと物体サイズにおけるロバスト性を検討しました。数学的に証明した結果によれば、単純化されたケースにおいてダイス損失は回帰損失よりも優れたノイズ耐性とモデル収束性を持つことが示されました。これらの理論的洞察に基づいて、我々はSeaBird(俯瞰画像でのセグメンテーション)を提案し、これが大きな物体への汎化への第一歩となることを目指しています。SeaBirdは前景オブジェクトのBEV(Bird's Eye View)セグメンテーションを3D検出に効果的に統合しており、セグメンテーションヘッドはダイス損失で学習されています。SeaBirdはKITTI-360リーダーボードで最先端の結果を達成し、特に大きな物体に対してnuScenesリーダーボードでの既存の検出器の性能向上に寄与しています。コードとモデルは https://github.com/abhi1kumar/SeaBird で公開されています。

SeaBird: 鳥瞰図でのセグメンテーションにDice損失を用いることで大物の単眼3D検出が改善される | 最新論文 | HyperAI超神経