HyperAIHyperAI
il y a 8 jours

Initialisation de la relation entre les images et leurs étiquettes propres et bruitées

Brandon Smart, Gustavo Carneiro
Initialisation de la relation entre les images et leurs étiquettes propres et bruitées
Résumé

De nombreuses méthodes de pointe en apprentissage avec étiquettes bruitées reposent sur des mécanismes d’apprentissage qui estiment les étiquettes propres des échantillons pendant l’entraînement, tout en ignorant leurs étiquettes bruitées d’origine. Toutefois, cette approche empêche l’apprentissage des relations entre les images, les étiquettes bruitées et les étiquettes propres, qui se sont avérées utiles dans le traitement des problèmes de bruit d’étiquettes dépendant des instances. En outre, les méthodes visant explicitement à modéliser ces relations nécessitent généralement des sous-ensembles de données correctement annotés, ainsi que des procédés de distillation ou des modèles multifacettes pour l’entraînement. Dans cet article, nous proposons un nouvel algorithme d’entraînement fondé sur un modèle simple permettant d’apprendre la relation entre étiquettes propres et étiquettes bruitées, sans nécessiter de sous-ensemble correctement annoté. Notre algorithme suit un processus en trois étapes : 1) pré-entraînement auto-supervisé suivi d’un entraînement avec early-stopping du classificateur afin de prédire de manière fiable les étiquettes propres pour un sous-ensemble de l’ensemble d’entraînement ; 2) utilisation de l’ensemble propre obtenu à l’étape (1) pour initier l’apprentissage de la relation entre images, étiquettes bruitées et étiquettes propres, que nous exploitons pour un relabeling efficace du reste de l’ensemble d’entraînement via un apprentissage semi-supervisé ; 3) entraînement supervisé du classificateur sur l’ensemble complet des échantillons relabelés à l’étape (2). En apprenant cette relation, nous atteignons des performances de pointe sur des problèmes de bruit d’étiquettes asymétriques et dépendant des instances.