HyperAIHyperAI
il y a 17 jours

Apprentissage itératif multi-label pour la classification d'images en présence d'ambiguïté des étiquettes

Sai Rajeswar, Pau Rodriguez, Soumye Singhal, David Vazquez, Aaron Courville
Apprentissage itératif multi-label pour la classification d'images en présence d'ambiguïté des étiquettes
Résumé

Le transfert d’apprentissage à partir de modèles pré-entraînés à grande échelle est devenu essentiel pour de nombreuses tâches de vision par ordinateur. Des études récentes ont montré que des jeux de données comme ImageNet sont faiblement étiquetés, car les images contenant plusieurs classes d’objets sont attribuées à une seule étiquette. Cette ambiguïté biaise les modèles vers une seule prédiction, ce qui peut entraîner la suppression des classes qui ont tendance à co-occurrence dans les données. Inspirés par la littérature sur l’émergence du langage, nous proposons une méthode d’apprentissage itératif à plusieurs étiquettes (MILe) pour intégrer les biais inductifs de l’apprentissage multi-étiquettes à partir d’étiquettes simples, au sein du cadre de l’apprentissage itératif. MILe est une procédure simple mais efficace qui construit une description multi-étiquettes d’une image en propageant des prédictions binaires à travers plusieurs générations successives de réseaux enseignants et élèves, avec un goulot d’étranglement d’apprentissage. Les expériences montrent que notre approche offre des avantages systématiques en termes de précision sur ImageNet ainsi que de score F1 sur ReaL, ce qui indique que MILe gère mieux l’ambiguïté des étiquettes que la procédure d’entraînement standard, même lors d’un fine-tuning à partir de poids auto-supervisés. Nous démontrons également que MILe est efficace pour réduire le bruit d’étiquetage, atteignant des performances de pointe sur des données réelles à grande échelle bruitées, telles que WebVision. En outre, MILe améliore les performances dans des scénarios d’apprentissage incrémental par classes, comme IIRC, et se révèle robuste aux décalages de distribution. Code : https://github.com/rajeswar18/MILe

Apprentissage itératif multi-label pour la classification d'images en présence d'ambiguïté des étiquettes | Articles de recherche récents | HyperAI