Découplage Améliore les Caractéristiques Locales Faiblement Supervisées

L'apprentissage faiblement supervisé peut aider les méthodes de caractéristiques locales à surmonter l'obstacle de l'acquisition d'un grand ensemble de données avec des correspondances étiquetées en densité. Cependant, puisque la supervision faible ne peut pas distinguer les pertes causées par les étapes de détection et de description, la réalisation directe de l'apprentissage faiblement supervisé dans une pipeline conjointe "décrire puis détecter" souffre d'une performance limitée. Dans cet article, nous proposons une pipeline "décrire puis détecter" décorrélée, spécialement conçue pour l'apprentissage faiblement supervisé des caractéristiques locales. Au sein de notre pipeline, l'étape de détection est décorrélée de l'étape de description et reportée jusqu'à ce que des descripteurs discriminants et robustes soient appris. De plus, nous introduisons une stratégie de recherche ligne-fenêtre pour utiliser explicitement les informations sur la pose caméra afin d'améliorer l'apprentissage des descripteurs. Des expériences approfondies montrent que notre méthode, nommée PoSFeat (Caractéristique Supervisée par la Pose Caméra), surpassent les méthodes précédemment pleinement et faiblement supervisées et atteint des performances de pointe sur un large éventail de tâches en aval.