Abordage de la généralisation des méthodes de recalage 3D à l’aide d’une base sans caractéristiques et d’un benchmark non biaisé
Les méthodes récentes de recalage 3D sont principalement fondées sur l’apprentissage, et consistent soit à établir des correspondances dans l’espace des caractéristiques avant de les appariérer, soit à estimer directement la transformation de recalage à partir des caractéristiques des nuages de points donnés. Par conséquent, ces méthodes basées sur les caractéristiques éprouvent des difficultés à généraliser sur des nuages de points sensiblement différents de ceux utilisés lors de l’entraînement. Ce problème n’est pas toujours évident en raison de définitions de benchmarks problématiques, qui ne permettent pas d’analyses approfondies et biaisent fortement en faveur de données similaires. Ainsi, nous proposons une méthodologie pour créer un benchmark de recalage 3D à partir d’un jeu de données de nuages de points, offrant une évaluation plus informative d’une méthode par rapport aux benchmarks existants. En appliquant cette méthodologie, nous construisons un nouveau benchmark, appelé FAUST-partial (FP), basé sur le jeu de données FAUST, comprenant plusieurs niveaux de difficulté. Le benchmark FP remédie aux limites des benchmarks actuels — notamment le manque de variabilité dans les données et les paramètres, ainsi que la faible diversité des conditions d’évaluation — et permet d’évaluer de manière fine les forces et faiblesses d’une méthode de recalage 3D en fonction d’un seul paramètre de recalage. À l’aide de ce nouveau benchmark FP, nous menons une analyse approfondie des méthodes de pointe actuelles, et constatons que celles-ci peinent encore à généraliser sur des données hors-échantillon fortement différentes. Par conséquent, nous proposons une méthode de base traditionnelle, sans caractéristiques, pour le recalage 3D, fondée sur la corrélation croisée pondérée entre deux nuages de points donnés. Notre méthode obtient des résultats remarquables sur les jeux de données de benchmark actuels, surpassant la plupart des méthodes basées sur l’apprentissage profond. Le code source est disponible sur github.com/DavidBoja/exhaustive-grid-search.