HyperAIHyperAI
il y a 2 mois

MSTA3D : Attention jumelle multi-échelle pour la segmentation d'instances 3D

Tran, Duc Dang Trung ; Kang, Byeongkeun ; Lee, Yeejin
MSTA3D : Attention jumelle multi-échelle pour la segmentation d'instances 3D
Résumé

Récemment, les techniques basées sur les transformateurs incorporant des superpoints sont devenues prédominantes dans le domaine du segmention d'instances en 3D. Cependant, elles rencontrent souvent un problème de sur-segmentation, particulièrement visible avec les objets de grande taille. De plus, les prédictions de masques peu fiables issues des prédictions de masques de superpoints aggravent encore cette problématique. Pour répondre à ces défis, nous proposons un nouveau cadre appelé MSTA3D. Ce cadre exploite la représentation des caractéristiques à plusieurs échelles et introduit un mécanisme d'attention jumelée pour capturer efficacement ces caractéristiques. De plus, MSTA3D intègre une requête de boîte avec un régulariseur de boîte, offrant une contrainte spatiale complémentaire aux requêtes sémantiques. Les évaluations expérimentales sur les jeux de données ScanNetV2, ScanNet200 et S3DIS démontrent que notre approche dépasse les méthodes actuelles d'avant-garde en segmention d'instances en 3D.

MSTA3D : Attention jumelle multi-échelle pour la segmentation d'instances 3D | Articles de recherche récents | HyperAI