Apprentissage par Few-Shot avec Découverte et Augmentation de Parties à partir d'Images Non Étiquetées

L'apprentissage à partir de peu d'exemples (few-shot learning) est une tâche complexe car seules quelques instances sont fournies pour reconnaître une classe inconnue. Une façon d'atténuer ce problème consiste à acquérir un biais inductif fort grâce à l'apprentissage métadynamique (meta-learning) sur des tâches similaires. Dans cet article, nous démontrons que ce biais inductif peut être appris à partir d'une collection plate d'images non étiquetées et instancié comme des représentations transférables entre les classes vues et non vues. Plus précisément, nous proposons un nouveau schéma d'apprentissage auto-supervisé basé sur les parties pour apprendre des représentations transférables en maximisant la similarité d'une image avec sa partie discriminante. Pour atténuer le surapprentissage dans la classification à partir de peu d'exemples, causé par la pénurie de données, nous proposons également une stratégie de renforcement des parties en récupérant des images supplémentaires à partir d'un jeu de données de base. Nous menons des études systématiques sur les benchmarks miniImageNet et tieredImageNet. Remarquablement, notre méthode produit des résultats impressionnants, surpassant les meilleures méthodes non supervisées précédentes de 7,74 % et 9,24 % sous les configurations 5-classes 1-exemple et 5-classes 5-exemples, respectivement, ces performances étant comparables aux méthodes supervisées de pointe.