Command Palette
Search for a command to run...
ScanMix : Apprendre à partir d’étiquettes sévèrement bruitées grâce au regroupement sémantique et à l’apprentissage semi-supervisé
ScanMix : Apprendre à partir d’étiquettes sévèrement bruitées grâce au regroupement sémantique et à l’apprentissage semi-supervisé
Ragav Sachdeva Filipe R Cordeiro Vasileios Belagiannis Ian Reid Gustavo Carneiro
Résumé
Nous proposons un nouvel algorithme d’entraînement, ScanMix, qui exploite le regroupement sémantique et l’apprentissage semi-supervisé (SSL) afin d’obtenir une robustesse supérieure aux bruits de label sévères, ainsi qu’une robustesse compétitive face aux bruits de label modérés, par rapport aux méthodes de l’état de l’art (SOTA). ScanMix repose sur le cadre d’optimisation par maximisation de l’espérance (EM), où l’étape E estime une variable latente pour regrouper les images d’entraînement selon leur apparence et leurs résultats de classification, tandis que l’étape M optimise la classification SSL et apprend des représentations fonctionnelles efficaces via le regroupement sémantique. Nous présentons un résultat théorique démontrant la correction et la convergence de ScanMix, ainsi qu’un résultat empirique montrant que ScanMix atteint des performances SOTA sur CIFAR-10/-100 (avec des bruits de label symétriques, asymétriques et sémantiques), Red Mini-ImageNet (issu des étiquettes bruyantes contrôlées du Web), Clothing1M et WebVision. Sur tous les benchmarks présentant des bruits de label sévères, nos résultats sont compétitifs avec l’état de l’art actuel.