Delta-encoder : une méthode efficace de synthèse d'échantillons pour la reconnaissance d'objets en few-shot

L'apprentissage de la classification de nouvelles catégories à partir d'un seul exemple ou de quelques exemples seulement est un défi de longue date dans la vision par ordinateur moderne. Dans ce travail, nous proposons une méthode simple mais efficace pour la reconnaissance d'objets en few-shot (et en one-shot). Notre approche repose sur un auto-encodeur modifié, appelé Delta-encodeur, qui apprend à synthétiser de nouveaux échantillons pour une catégorie inconnue en ne voyant que quelques exemples provenant de cette catégorie. Les échantillons synthétisés sont ensuite utilisés pour entraîner un classifieur. La méthode proposée apprend non seulement à extraire des déformations transférables intra-classe, ou « deltas », entre les paires d'exemples d'entraînement de la même classe, mais aussi à appliquer ces deltas aux quelques exemples fournis d'une nouvelle classe (non vue lors de l'entraînement) afin de synthétiser efficacement des échantillons de cette nouvelle classe. La méthode proposée améliore l'état de l'art en reconnaissance d'objets en one-shot et se compare favorablement dans le cas du few-shot. Le code sera rendu disponible à la suite de l'acceptation.