HyperAIHyperAI
vor 3 Monaten

Prototypenbasiertes Reinigungsverfahren für das Lernen mit fehlerhaften Etiketten

Jingjia Huang, Yuanqi Chen, Jiashi Feng, Xinglong Wu
Prototypenbasiertes Reinigungsverfahren für das Lernen mit fehlerhaften Etiketten
Abstract

Semi-supervised Learning-basierte Methoden stellen derzeit die State-of-the-Art-Lösungen für das Problem des Lernens mit verrauschten Etiketten dar. Diese Ansätze beruhen darauf, zunächst einen unsupervisierten Etikettensäuberer zu lernen, um die Trainingsbeispiele in eine mit Etiketten versehene Menge für saubere Daten und eine ungekennzeichnete Menge für verrauschte Daten zu unterteilen. Typischerweise wird der Säuberer durch Anpassung eines Mischmodells an die Verteilung der pro-Probe-Trainingsverluste ermittelt. Allerdings ist dieses Modellierungsverfahren klassenunabhängig und geht davon aus, dass die Verlustverteilungen sauberer und verrauschter Beispiele innerhalb aller Klassen identisch sind. In der Praxis trifft diese Annahme jedoch nicht immer zu, da die Lernschwierigkeiten verschiedener Klassen variieren können. Dies führt zu suboptimalen Kriterien zur Aufteilung von sauberen und verrauschten Etiketten. In dieser Arbeit bringen wir dieses lange übersehene Problem zur Geltung und stellen eine einfache, jedoch wirksame Lösung vor, die wir \textbf{C}lass \textbf{P}rototype-basierten Etikettensäuberer (\textbf{CPC}) nennen. Im Gegensatz zu früheren Ansätzen, die alle Klassen gleich behandeln, berücksichtigt CPC vollständig die Heterogenität der Verlustverteilungen und wendet klassenbewusste Modulation an, um saubere und verrauschte Daten zu partitionieren. CPC nutzt gleichzeitig die Modellierung der Verlustverteilung und die intra-klassische Konsistenz-Regularisierung im Merkmalsraum, wodurch eine bessere Unterscheidung zwischen sauberen und verrauschten Etiketten möglich wird. Theoretisch begründen wir die Wirksamkeit unserer Methode durch eine Erklärung im Rahmen des Erwartung-Maximierung (EM)-Frameworks. Umfassende Experimente werden auf den Benchmark-Datensätzen CIFAR-10, CIFAR-100, Clothing1M und WebVision durchgeführt. Die Ergebnisse zeigen, dass CPC konsistent eine Leistungssteigerung auf allen Benchmarks erzielt. Der Quellcode und vortrainierte Modelle werden unter \url{https://github.com/hjjpku/CPC.git} veröffentlicht.