HyperAIHyperAI
il y a 8 jours

Apprentissage par cohérence des voisins pour des étiquettes bruitées

Ahmet Iscen, Jack Valmadre, Anurag Arnab, Cordelia Schmid
Apprentissage par cohérence des voisins pour des étiquettes bruitées
Résumé

Les avancées récentes en apprentissage profond reposent sur des jeux de données étiquetés de grande taille pour entraîner des modèles à forte capacité. Toutefois, la collecte de tels jeux de données de manière efficace en temps et en coût entraîne souvent du bruit dans les étiquettes. Nous proposons une méthode d’apprentissage à partir d’étiquettes bruitées, qui exploite les similarités entre les exemples d’entraînement dans l’espace des caractéristiques, en encourageant la prédiction de chaque exemple à être proche de ses voisins les plus proches. Contrairement aux algorithmes d’entraînement utilisant plusieurs modèles ou des étapes distinctes, notre approche prend la forme d’un terme de régularisation simple et additionnel. Elle peut être interprétée comme une version inductive de l’algorithme classique de propagation d’étiquettes transductives. Nous évaluons de manière approfondie notre méthode sur des jeux de données présentant à la fois des bruits synthétiques (CIFAR-10, CIFAR-100) et réalistes (mini-WebVision, WebVision, Clothing1M, mini-ImageNet-Red), et obtenons des performances compétitives ou parmi les meilleures dans tous les cas.