HyperAIHyperAI
il y a 2 mois

Catégorisation visuelle fine-grainée utilisant l'optimisation par apprentissage par méta-apprentissage avec sélection d'échantillons de données auxiliaires

Yabin Zhang; Hui Tang; Kui Jia
Catégorisation visuelle fine-grainée utilisant l'optimisation par apprentissage par méta-apprentissage avec sélection d'échantillons de données auxiliaires
Résumé

La catégorisation visuelle fine (FGVC) est un défi en partie dû à la difficulté d'acquérir un nombre suffisant d'échantillons de formation. Pour utiliser des modèles de grande taille dans le FGVC sans subir de surapprentissage, les méthodes existantes adoptent généralement une stratégie de pré-entraînement des modèles à l'aide d'un ensemble riche de données auxiliaires, suivi d'un ajustement fin sur la tâche cible de FGVC. Cependant, l'objectif du pré-entraînement ne prend pas en compte la tâche cible, et par conséquent, les modèles ainsi obtenus sont sous-optimaux pour l'ajustement fin. Pour résoudre ce problème, nous proposons dans cet article un nouveau modèle profond de FGVC appelé MetaFGNet. L'entraînement de MetaFGNet repose sur un nouvel objectif d'apprentissage métadonné régularisé, qui vise à guider l'apprentissage des paramètres du réseau afin qu'ils soient optimaux pour s'adapter à la tâche cible de FGVC. Sur la base de MetaFGNet, nous proposons également un schéma simple mais efficace pour sélectionner des échantillons plus utiles parmi les données auxiliaires. Les expériences menées sur des jeux de données de référence en FGVC montrent l'efficacité de notre méthode proposée.