HyperAIHyperAI
il y a 17 jours

Une Revue de la Segmentation Panoptique pour les Nuages de Points de Cartographie Mobile

Binbin Xiang, Yuanwen Yue, Torben Peters, Konrad Schindler
Une Revue de la Segmentation Panoptique pour les Nuages de Points de Cartographie Mobile
Résumé

La segmentation panoptique de nuages de points 3D est une tâche combinée qui consiste à (i) attribuer à chaque point une classe sémantique et (ii) séparer les points appartenant à chaque classe en instances d'objets distincts. Ces dernières années, un intérêt croissant s'est porté sur cette compréhension complète des scènes 3D, tirant parti des progrès rapides de la segmentation sémantique rendus possibles par l'émergence des réseaux neuronaux profonds 3D. Toutefois, à ce jour, peu de travaux se sont consacrés à la segmentation panoptique des données de cartographie mobile en extérieur, et aucune comparaison systématique n’a été menée. Ce papier vise à combler cette lacune. Il passe en revue les composants fondamentaux nécessaires à la construction d’un pipeline de segmentation panoptique ainsi que la littérature associée. En outre, un pipeline modulaire est mis en place afin de réaliser des expériences complètes et systématiques visant à évaluer l’état de l’art de la segmentation panoptique dans le contexte de la cartographie routière. À titre secondaire, nous proposons également le premier jeu de données public dédié à cette tâche, en étendant le jeu de données NPM3D par l’ajout d’étiquettes d’instances. Ce jeu de données ainsi que notre code source sont rendus accessibles publiquement. Nous discutons des adaptations nécessaires pour adapter les méthodes actuelles de segmentation panoptique aux scènes en extérieur et aux objets de grande taille. Notre étude montre que, pour les données de cartographie mobile, KPConv obtient les meilleurs résultats, bien qu’il soit plus lent, tandis que PointNet++ est le plus rapide mais présente des performances significativement inférieures. Les CNNs creux se situent entre les deux. Quel que soit le modèle de base utilisé, la segmentation d’instances basée sur le regroupement des caractéristiques d’embedding s’avère supérieure à l’utilisation des coordonnées décalées.