3D-BEVIS : Segmentation d'instances en vue aérienne

Les modèles de deep learning récents obtiennent des résultats impressionnants dans les tâches d'analyse de scènes 3D en opérant directement sur des nuages de points non structurés. De grands progrès ont été réalisés dans les domaines de la classification d'objets et de la segmentation sémantique. Cependant, la tâche de segmentation d'instances est moins explorée. Dans ce travail, nous présentons 3D-BEVIS, un cadre de deep learning pour la segmentation sémantique d'instances 3D sur des nuages de points. En suivant l'idée des approches précédentes de segmentation d'instances sans proposition, notre modèle apprend une empreinte caractéristique (feature embedding) et regroupe l'espace caractéristique obtenu en instances sémantiques. Les méthodes actuelles basées sur les points évoluent linéairement avec le nombre de points en traitant individuellement des sous-parties locales d'une scène. Cependant, pour effectuer une segmentation d'instances par regroupement (clustering), des caractéristiques globalement cohérentes sont nécessaires. Par conséquent, nous proposons de combiner la géométrie locale des points avec des informations contextuelles globales issues d'une représentation intermédiaire en vue du dessus (bird's-eye view).