HyperAIHyperAI
il y a 2 mois

Apprendre à apprendre par l'auto-critique

Antreas Antoniou; Amos Storkey
Apprendre à apprendre par l'auto-critique
Résumé

Dans l'apprentissage à partir de quelques exemples (few-shot learning), un système d'apprentissage automatique apprend à partir d'un petit ensemble d'exemples étiquetés liés à une tâche spécifique, afin de pouvoir généraliser à de nouveaux exemples de la même tâche. Étant donné la disponibilité limitée d'exemples étiquetés pour ces tâches, nous souhaitons tirer parti de toutes les informations dont nous disposons. Généralement, un modèle apprend des informations spécifiques à la tâche à partir d'un petit ensemble d'entraînement (ensemble de support) pour effectuer des prédictions sur un ensemble de validation non étiqueté (ensemble cible). L'ensemble cible contient des informations supplémentaires spécifiques à la tâche qui ne sont pas exploitées par les méthodes actuelles d'apprentissage à partir de quelques exemples. L'utilisation des exemples de l'ensemble cible par le biais de l'apprentissage transitif nécessite des approches dépassant les méthodes actuelles ; au moment de l'inférence, l'ensemble cible ne contient que des points de données d'entrée non étiquetés, et donc l'apprentissage discriminatif ne peut pas être utilisé. Dans cet article, nous proposons un cadre appelé Auto-Critique et Adaptation (Self-Critique and Adapt ou SCA), qui apprend à optimiser une fonction de perte sans étiquette, paramétrée sous forme de réseau neuronal. Un modèle de base s'entraîne sur un ensemble de support en utilisant des méthodes existantes (par exemple, la descente stochastique du gradient combinée avec la perte d'entropie croisée), puis est mis à jour pour la tâche cible entrante en utilisant la fonction de perte apprise. Cette fonction de perte sans étiquette est elle-même optimisée afin que le modèle appris atteigne une meilleure performance en généralisation. Les expériences montrent que SCA offre une réduction substantielle des taux d'erreur par rapport aux modèles basiques qui n'adaptent que l'ensemble de support, et obtient des performances au niveau de l'état de l'art sur les benchmarks Mini-ImageNet et Caltech-UCSD Birds 200.