PointNetVLAD : Recherche approfondie basée sur les nuages de points pour la reconnaissance de lieux à grande échelle

Contrairement à ses homologues basés sur les images, la recherche basée sur les nuages de points pour la reconnaissance des lieux est restée un problème peu exploré et non résolu. Cela est principalement dû à la difficulté d'extraire des descripteurs de caractéristiques locales à partir d'un nuage de points, qui peuvent ensuite être encodés en un descripteur global pour la tâche de recherche. Dans cet article, nous proposons PointNetVLAD, où nous tirons parti du récent succès des réseaux profonds pour résoudre la recherche basée sur les nuages de points pour la reconnaissance des lieux. Plus précisément, notre PointNetVLAD est une combinaison/modification des PointNet existants et de NetVLAD, ce qui permet une formation et une inférence bout-à-bout pour extraire le descripteur global à partir d'un nuage de points 3D donné. De plus, nous proposons les fonctions de perte "triplet paresseux" et "quadruplet paresseux" qui peuvent produire des descripteurs globaux plus discriminants et généralisables pour aborder la tâche de recherche. Nous créons des jeux de données de référence pour la recherche basée sur les nuages de points pour la reconnaissance des lieux, et les résultats expérimentaux sur ces jeux de données démontrent la faisabilité de notre PointNetVLAD. Notre code source et le lien pour télécharger les jeux de données de référence sont disponibles sur notre site web du projet.http://github.com/mikacuy/pointnetvlad/