GeoTransformer : Une méthode rapide et robuste pour l'enregistrement de nuages de points avec transformateur géométrique

Nous étudions le problème d'extraction de correspondances précises pour l'enregistrement de nuages de points. Les méthodes récentes sans points d'intérêt ont montré un grand potentiel en évitant la détection de points d'intérêt répétables, une tâche particulièrement difficile dans les scénarios à faible chevauchement. Ces méthodes recherchent des correspondances sur des superpoints échantillonnés, qui sont ensuite propagées aux points denses. Les superpoints sont appariés en fonction de la chevauchement de leurs patchs voisins. Un tel appariement épars et lâche nécessite des caractéristiques contextuelles capables de capturer la structure géométrique des nuages de points. Nous proposons le Geometric Transformer, ou GeoTransformer pour faire court, pour apprendre des caractéristiques géométriques permettant un appariement robuste des superpoints. Ce modèle encode les distances entre paires et les angles entre triplets, ce qui le rend invariant aux transformations rigides et robuste dans les cas à faible chevauchement. Malgré sa conception simple, il atteint une précision d'appariement surprenante, au point que l'estimation de la transformation d'alignement n'a pas besoin de RANSAC (Random Sample Consensus), ce qui entraîne une accélération de $100$ fois. De nombreuses expériences sur des bancs d'essai variés incluant des scènes intérieures, extérieures, synthétiques, multi-voies et non rigides démontrent l'efficacité du GeoTransformer. Notamment, notre méthode améliore le taux de bonnes correspondances (inlier ratio) de $18{\sim}31$ points pourcentage et le rappel d'enregistrement (registration recall) de plus de $7$ points sur le banc d'essai 3DLoMatch difficile. Notre code source et nos modèles sont disponibles à l'adresse \url{https://github.com/qinzheng93/GeoTransformer}.