2ヶ月前
点群データにおける3Dインスタンスセグメンテーションのための学習オブジェクトバウンディングボックス
Bo Yang; Jianan Wang; Ronald Clark; Qingyong Hu; Sen Wang; Andrew Markham; Niki Trigoni

要約
私たちは、3D点群上のインスタンスセグメンテーションのための新しい、概念的に単純で汎用的なフレームワークを提案します。当該手法は3D-BoNetと呼ばれ、各点に対するマルチレイヤーパーセプトロン(MLP)の単純な設計哲学に従っています。このフレームワークは、点群内のすべてのインスタンスに対して直接3Dバウンディングボックスを回帰するだけでなく、各インスタンスに対してポイントレベルのマスクを同時に予測します。具体的には、バックボーンネットワークに続いて、1) バウンディングボックス回帰と 2) ポイントマスク予測のための2つの並列ネットワークブランチから構成されています。3D-BoNetは一段階型、アンカーなしであり、エンドツーエンドで学習可能です。さらに、既存のアプローチとは異なり、非最大値抑制や特徴サンプリング、クラスタリングや投票などの後処理ステップを必要としないため、計算効率が非常に高いという特長があります。広範な実験結果により、当該手法がScanNetおよびS3DISデータセットにおいて既存の研究を上回りつつ、約10倍の計算効率であることが示されました。包括的なアブレーションスタディでは、当該設計の有効性が確認されています。