HyperAIHyperAI
il y a 2 mois

MinkLoc3D : Reconnaissance de lieux à grande échelle basée sur des nuages de points

Komorowski, Jacek
MinkLoc3D : Reconnaissance de lieux à grande échelle basée sur des nuages de points
Résumé

L'article présente une méthode basée sur l'apprentissage pour calculer un descripteur de nuage de points 3D discriminatif destiné à la reconnaissance des lieux. Les méthodes existantes, comme PointNetVLAD, reposent sur une représentation non ordonnée du nuage de points. Elles utilisent PointNet comme première étape de traitement pour extraire des caractéristiques locales, qui sont ensuite agrégées en un descripteur global. L'architecture PointNet n'est pas bien adaptée pour capturer les structures géométriques locales. Par conséquent, les méthodes les plus récentes améliorent l'architecture PointNet de base en ajoutant différents mécanismes pour capturer des informations contextuelles locales, tels que les réseaux de convolution graphique ou l'utilisation de caractéristiques conçues manuellement (hand-crafted features). Nous présentons une approche alternative, baptisée MinkLoc3D, pour calculer un descripteur de nuage de points 3D discriminatif, basée sur une représentation voxelisée éparsa du nuage de points et des convolutions 3D éparses. La méthode proposée dispose d'une architecture simple et efficace. Les évaluations sur des benchmarks standards démontrent que MinkLoc3D surpassent les méthodes actuelles les plus performantes. Notre code est disponible au public sur le site web du projet : https://github.com/jac99/MinkLoc3D