HyperAIHyperAI
il y a 2 mois

Moyenne Géométrique Améliore la Perte pour l'Apprentissage par Quelques Exemples

Wu, Tong ; Kobayashi, Takumi
Moyenne Géométrique Améliore la Perte pour l'Apprentissage par Quelques Exemples
Résumé

L'apprentissage à partir de quelques exemples (Few-shot learning, FSL) est une tâche complexe en apprentissage automatique, exigeant d'un modèle qu'il effectue une classification discriminante en utilisant seulement un petit nombre d'exemples étiquetés. Dans la littérature sur le FSL, les modèles profonds sont formés selon une approche d'apprentissage par métrique pour fournir une métrique dans un espace de caractéristiques qui se généralise bien pour classer des échantillons de nouvelles classes ; dans cet espace, même un faible nombre d'exemples d'entraînement étiquetés peut construire un classificateur efficace. Dans cet article, nous proposons une nouvelle fonction de perte pour le FSL basée sur la \emph{moyenne géométrique} afin d'intégrer une métrique discriminante aux caractéristiques profondes. Contrairement à d'autres fonctions de perte telles que celles utilisant la moyenne arithmétique dans la formulation basée sur le softmax, notre méthode utilise la moyenne géométrique pour agréger les relations entre paires d'échantillons, améliorant ainsi la métrique discriminante entre les catégories de classes. La fonction de perte proposée non seulement est formulée sous une forme simple, mais elle est également analysée théoriquement de manière approfondie pour révéler ses caractéristiques favorables à l'apprentissage de métriques de caractéristiques en FSL. Dans les expériences menées sur des tâches de classification d'images à partir de quelques exemples, cette méthode produit des performances compétitives comparées aux autres fonctions de perte.