HyperAIHyperAI
vor 8 Tagen

Beispielvorlage-gesteuertes robustes Modelllernen zur Unterdrückung verrauschter Labels

Wenkai Chen, Chuang Zhu, Yi Chen, Mengting Li, Tiejun Huang
Beispielvorlage-gesteuertes robustes Modelllernen zur Unterdrückung verrauschter Labels
Abstract

Unvollkommene Etiketten sind in realen Datensätzen allgegenwärtig und beeinträchtigen die Modellleistung erheblich. Mehrere neuere effektive Ansätze zur Behandlung verrauschter Etiketten bestehen aus zwei zentralen Schritten: 1) Aufteilung der Samples in gut etikettierte und falsch etikettierte Mengen basierend auf der Trainingsverlustfunktion, 2) Verwendung semi-supervisierter Methoden zur Generierung von Pseudo-Etiketten für die in der falsch etikettierten Menge enthaltenen Samples. Allerdings schädigen aktuelle Methoden häufig informative schwierige (hard) Samples, da die Verlustverteilung dieser Samples der von verrauschten Samples sehr ähnlich ist. In diesem Artikel stellen wir PGDF (Prior Guided Denoising Framework), einen neuartigen Rahmen zur Lernung tiefer Modelle vor, der durch die Generierung vorheriger Wissensinformationen über die Samples Rauschen unterdrückt und sowohl im Schritt der Aufteilung der Samples als auch im semi-supervisierter Schritt integriert wird. Unser Framework ermöglicht es, mehr informative schwierige saubere Samples in die gut etikettierte Menge zu retten. Darüber hinaus verbessert unser Ansatz die Qualität der Pseudo-Etiketten im semi-supervisierten Schritt, indem er das Rauschen in der aktuellen Pseudo-Etikettengenerierungsmethode unterdrückt. Um die Leistung der schwierigen Samples weiter zu steigern, reweighten wir die Samples in der gut etikettierten Menge während des Trainings. Wir haben unsere Methode an synthetischen Datensätzen basierend auf CIFAR-10 und CIFAR-100 sowie an realen Datensätzen wie WebVision und Clothing1M evaluiert. Die Ergebnisse zeigen signifikante Verbesserungen gegenüber den aktuellen State-of-the-Art-Methoden.

Beispielvorlage-gesteuertes robustes Modelllernen zur Unterdrückung verrauschter Labels | Neueste Forschungsarbeiten | HyperAI