HyperAIHyperAI
il y a 17 jours

Inférence de crédibilité d'instance pour l'apprentissage peu supervisé

Yikai Wang, Chengming Xu, Chen Liu, Li Zhang, Yanwei Fu
Inférence de crédibilité d'instance pour l'apprentissage peu supervisé
Résumé

L’apprentissage à très peu d’exemples (few-shot learning, FSL) vise à reconnaître de nouveaux objets à partir d’un nombre extrêmement limité d’exemples d’entraînement par catégorie. Les travaux antérieurs ont cherché à atténuer ce problème de données extrêmement rares en s’appuyant soit sur des paradigmes d’apprentissage métacognitif, soit sur de nouveaux principes d’augmentation des données. À l’inverse, cet article présente une approche statistique simple, appelée Inférence de crédibilité des instances (Instance Credibility Inference, ICI), visant à exploiter le soutien de distribution des instances non étiquetées pour l’apprentissage à très peu d’exemples. Plus précisément, nous entraînons d’abord un classificateur linéaire à partir des exemples peu étiquetés, puis utilisons ce modèle pour inférer des pseudo-étiquettes sur les données non étiquetées. Pour mesurer la crédibilité de chaque instance pseudo-étiquetée, nous proposons de résoudre une autre hypothèse de régression linéaire en augmentant la parcimonie des paramètres incidentels, puis classons les instances pseudo-étiquetées selon leur degré de parcimonie. Nous sélectionnons les instances pseudo-étiquetées les plus fiables, que nous combinons aux exemples étiquetés pour réentraîner le classificateur linéaire. Ce processus est itéré jusqu’à ce que toutes les instances non étiquetées soient intégrées à l’ensemble d’entraînement élargi, c’est-à-dire jusqu’à convergence des pseudo-étiquettes pour l’ensemble des données non étiquetées. Des expérimentations étendues menées dans deux cadres d’apprentissage à très peu d’exemples démontrent que notre approche simple établit de nouveaux états de l’art sur quatre bases de données largement utilisées pour l’apprentissage à très peu d’exemples : miniImageNet, tieredImageNet, CIFAR-FS et CUB. Le code source est disponible à l’adresse suivante : https://github.com/Yikai-Wang/ICI-FSL