HyperAIHyperAI
il y a 17 jours

Complémentarité de la déficience de représentation dans la classification d’images à faible exemple : une approche par métaprise de décision

Xian Zhong, Cheng Gu, Wenxin Huang, Lin Li, Shuqin Chen, Chia-Wen Lin
Complémentarité de la déficience de représentation dans la classification d’images à faible exemple : une approche par métaprise de décision
Résumé

L’apprentissage en peu d’exemples constitue un problème difficile qui suscite un intérêt croissant depuis que l’obtention d’un grand nombre d’échantillons d’entraînement s’avère difficile dans les applications pratiques. L’apprentissage métaléarning a été proposé pour relever ce défi, en se concentrant sur l’adaptation rapide d’un prédicteur, appelé base-learner, à de nouvelles tâches, à partir de très peu d’exemples étiquetés. Toutefois, un défi majeur de l’apprentissage métaléarning réside dans le défaut de représentation, car il est difficile de découvrir des informations communes à partir d’un petit nombre d’échantillons d’entraînement, voire d’un seul, ce qui limite la capacité à extraire des représentations pertinentes des caractéristiques clés à partir d’un tel faible apport d’information. En conséquence, un métaléarner ne peut pas être correctement entraîné dans un espace de paramètres à haute dimension afin de généraliser efficacement à de nouvelles tâches. Les méthodes existantes s’appuient souvent sur l’extraction de caractéristiques moins expressives afin d’éviter ce défaut de représentation. Dans le but d’apprendre des représentations plus performantes, nous proposons une approche d’apprentissage métaléarning basée sur un réseau à représentations complétées (MCRNet) pour la classification d’images en peu d’exemples. Plus précisément, nous intégrons un espace latent dans lequel les codes latents sont reconstruits à l’aide d’informations supplémentaires de représentation afin de pallier ce défaut. En outre, cet espace latent est construit par inférence variationnelle, ce qui permet une bonne compatibilité avec divers base-learners et une extension aisée à d’autres modèles. Enfin, notre cadre end-to-end atteint des performances de pointe dans la classification d’images sur trois jeux de données standards d’apprentissage en peu d’exemples.