Command Palette
Search for a command to run...
Inférence de crédibilité d'instance pour l'apprentissage peu supervisé
Inférence de crédibilité d'instance pour l'apprentissage peu supervisé
Yikai Wang Chengming Xu Chen Liu Li Zhang Yanwei Fu
Résumé
L’apprentissage à très peu d’exemples (few-shot learning, FSL) vise à reconnaître de nouveaux objets à partir d’un nombre extrêmement limité d’exemples d’entraînement par catégorie. Les travaux antérieurs ont cherché à atténuer ce problème de données extrêmement rares en s’appuyant soit sur des paradigmes d’apprentissage métacognitif, soit sur de nouveaux principes d’augmentation des données. À l’inverse, cet article présente une approche statistique simple, appelée Inférence de crédibilité des instances (Instance Credibility Inference, ICI), visant à exploiter le soutien de distribution des instances non étiquetées pour l’apprentissage à très peu d’exemples. Plus précisément, nous entraînons d’abord un classificateur linéaire à partir des exemples peu étiquetés, puis utilisons ce modèle pour inférer des pseudo-étiquettes sur les données non étiquetées. Pour mesurer la crédibilité de chaque instance pseudo-étiquetée, nous proposons de résoudre une autre hypothèse de régression linéaire en augmentant la parcimonie des paramètres incidentels, puis classons les instances pseudo-étiquetées selon leur degré de parcimonie. Nous sélectionnons les instances pseudo-étiquetées les plus fiables, que nous combinons aux exemples étiquetés pour réentraîner le classificateur linéaire. Ce processus est itéré jusqu’à ce que toutes les instances non étiquetées soient intégrées à l’ensemble d’entraînement élargi, c’est-à-dire jusqu’à convergence des pseudo-étiquettes pour l’ensemble des données non étiquetées. Des expérimentations étendues menées dans deux cadres d’apprentissage à très peu d’exemples démontrent que notre approche simple établit de nouveaux états de l’art sur quatre bases de données largement utilisées pour l’apprentissage à très peu d’exemples : miniImageNet, tieredImageNet, CIFAR-FS et CUB. Le code source est disponible à l’adresse suivante : https://github.com/Yikai-Wang/ICI-FSL