11日前
MaskGroup:3次元インスタンスセグメンテーションのための階層的ポイントグループ化とマスク化
Min Zhong, Xinghao Chen, Xiaokang Chen, Gang Zeng, Yunhe Wang

要約
本論文では、ロボット工学や拡張現実(AR)など多岐にわたる実世界応用が期待される3Dインスタンスセグメンテーション問題に焦点を当てる。3Dオブジェクトの周囲環境は極めて複雑であるため、異なるオブジェクトを正確に分離することは極めて困難である。この課題に対処するため、本研究では新たなフレームワークを提案し、3Dインスタンスのグループ化と精緻化を実現する。実際の手順として、各点に対してオフセットベクトルを学習し、それを予測されたインスタンス中心へと移動させる。点のより良いグループ化を実現するため、中心に集約された点を段階的にマージする「階層的ポイントグループ化(Hierarchical Point Grouping)」アルゴリズムを提案する。すべての点はまず小さなクラスタにグループ化され、その後、さらに段階的に大規模なグループへと統合される。この多スケールのグループ構造を活用してインスタンス予測を行うことで、異なるスケールのインスタンスを効果的に予測できる。さらに、これらのグループに対するバイナリーポイントマスクを生成するための新規なMaskScoreNetを設計し、セグメンテーション結果の精緻化を図る。ScanNetV2およびS3DISベンチマーク上での広範な実験により、提案手法の有効性が確認された。具体的には、ScanNetV2のテストセットにおいて、0.5のIoU閾値下で66.4%のmAPを達成し、最先端手法よりも1.9%高い性能を示した。