HyperAIHyperAI
il y a 17 jours

Apprentissage par peu d'exemples étendu : Exploitation des ressources existantes pour des tâches nouvelles

Reza Esfandiarpoor, Amy Pu, Mohsen Hajabdollahi, Stephen H. Bach
Apprentissage par peu d'exemples étendu : Exploitation des ressources existantes pour des tâches nouvelles
Résumé

Dans de nombreux problèmes pratiques d'apprentissage peu supervisé, même lorsque les exemples étiquetés sont rares, des jeux de données auxiliaires abondants sont souvent disponibles et peuvent potentiellement contenir des informations utiles. Nous proposons le problème d'apprentissage peu supervisé étendu afin d'étudier ces scénarios. Nous introduisons ensuite un cadre pour relever les défis liés à la sélection efficace et à l'utilisation efficace des données auxiliaires dans la classification d'images en peu de tirages. Étant donné un grand jeu de données auxiliaires et une notion de similarité sémantique entre les classes, nous sélectionnons automatiquement des « pseudo-tirages », c’est-à-dire des exemples étiquetés provenant d'autres classes liées à la tâche cible. Nous montrons que des approches naïves, telles que (1) modéliser ces exemples supplémentaires de la même manière que les exemples de la tâche cible ou (2) les utiliser pour apprendre des caractéristiques via un apprentissage par transfert, n’augmentent l’exactitude que modérément. À la place, nous proposons un module de masquage qui ajuste les caractéristiques des données auxiliaires afin de les rendre plus similaires à celles des classes cibles. Nous démontrons que ce module de masquage surpasse les approches naïves de modélisation des exemples d’appui et l’apprentissage par transfert de respectivement 4,68 et 6,03 points de pourcentage.