Appariement de Formes Profondes

Nous abordons le problème de l'appariement de formes en tant qu'apprentissage de métriques avec des réseaux de neurones convolutifs. Nous divisons le processus global de représentation d'images en deux étapes. Premièrement, nous sélectionnons des méthodes efficaces et bien établies pour transformer les images en cartes de contours. Deuxièmement, le réseau est entraîné à partir des cartes de contours d'images caractéristiques, obtenues automatiquement par un pipeline de reconstruction 3D à partir du mouvement (structure-from-motion). La représentation apprise est évaluée sur une variété de tâches différentes, offrant des améliorations dans des cas difficiles de généralisation de domaine, de recherche d'images basée sur des esquisses génériques ou de sa version fine-grainée. Contrairement à d'autres méthodes qui apprennent un modèle différent par tâche, catégorie d'objets ou domaine, nous utilisons le même réseau dans toutes nos expériences, obtenant ainsi des résultats d'état de l'art dans plusieurs benchmarks.