2ヶ月前

MSTA3D: 多スケール双方向注意機構を用いた3Dインスタンスセグメンテーション

Tran, Duc Dang Trung ; Kang, Byeongkeun ; Lee, Yeejin
MSTA3D: 多スケール双方向注意機構を用いた3Dインスタンスセグメンテーション
要約

最近、スーパーポイントを組み込んだトランスフォーマーに基づく手法が3Dインスタンスセグメンテーションで主流となっています。しかし、これらの手法は特に大型の物体に対して過分割問題にしばしば遭遇します。さらに、スーパーポイントマスク予測から派生する信頼性の低いマスク予測がこの問題をより複雑にしています。これらの課題に対処するために、私たちはMSTA3Dと呼ばれる新しいフレームワークを提案します。MSTA3Dはマルチスケール特徴表現を活用し、双方向アテンション機構を導入することで这些问题を効果的に捉えます。また、MSTA3Dはボックスクエリとボックスレギュライザを統合し、意味的なクエリとともに空間的な制約を補完的に提供します。ScanNetV2、ScanNet200およびS3DISデータセットでの実験評価により、私たちの手法が最先端の3Dインスタンスセグメンテーション方法を超えることが示されています。

MSTA3D: 多スケール双方向注意機構を用いた3Dインスタンスセグメンテーション | 最新論文 | HyperAI超神経