LightGlue : Appariement de Caractéristiques Locales à la Vitesse de l'Éclair

Nous présentons LightGlue, un réseau neuronal profond qui apprend à faire correspondre des caractéristiques locales entre les images. Nous reprenons plusieurs décisions de conception de SuperGlue, la référence actuelle en matière de correspondance parcimonieuse, et en dérivons des améliorations simples mais efficaces. Collectivement, ces améliorations rendent LightGlue plus performant - tant en termes de mémoire que de calcul, plus précis, et beaucoup plus facile à entraîner. Une propriété clé est que LightGlue s'adapte à la difficulté du problème : l'inférence est beaucoup plus rapide sur des paires d'images qui sont intuitivement faciles à faire correspondre, par exemple en raison d'un chevauchement visuel plus important ou d'une variation limitée de l'apparence. Cela ouvre des perspectives passionnantes pour le déploiement de correspondants profonds dans des applications sensibles à la latence, comme la reconstruction 3D. Le code source et les modèles entraînés sont disponibles publiquement sur https://github.com/cvg/LightGlue.