Command Palette
Search for a command to run...
ScanMix: Lernen aus starker Label-Rausch durch semantische Clustering und semi-supervised Learning
ScanMix: Lernen aus starker Label-Rausch durch semantische Clustering und semi-supervised Learning
Ragav Sachdeva Filipe R Cordeiro Vasileios Belagiannis Ian Reid Gustavo Carneiro
Zusammenfassung
Wir schlagen einen neuen Trainingsalgorithmus, ScanMix, vor, der semantische Clusterbildung und semi-supervised Learning (SSL) nutzt, um eine überlegene Robustheit gegenüber starken Label-Rauschern sowie konkurrenzfähige Robustheit gegenüber schwächeren Label-Rauschern im Vergleich zu den aktuellen State-of-the-Art (SOTA)-Methoden zu erreichen. ScanMix basiert auf dem Erwartungswert-Maximierungs-Rahmenwerk (Expectation Maximization, EM), wobei der E-Schritt die latente Variable schätzt, um die Trainingsbilder basierend auf ihrem Erscheinungsbild und den Klassifikationsergebnissen zu clustern, und der M-Schritt das SSL-Klassifikationsmodell optimiert sowie effektive Merkmalsdarstellungen durch semantische Clusterbildung lernt. Wir präsentieren eine theoretische Resultat, das die Korrektheit und Konvergenz von ScanMix belegt, sowie eine empirische Studie, die zeigt, dass ScanMix SOTA-Ergebnisse auf CIFAR-10/-100 (mit symmetrischem, asymmetrischem und semantischem Label-Rauschen), Red Mini-ImageNet (aus den Controlled Noisy Web Labels), Clothing1M und WebVision erzielt. In allen Benchmarks mit starkem Label-Rauschen sind unsere Ergebnisse mit den aktuellen SOTA-Methode vergleichbar.