HyperAIHyperAI
vor 2 Monaten

CleanNet: Transfer Learning für skalierbares Training von Bildklassifizierern mit Etikett-Rauschen

Kuang-Huei Lee; Xiaodong He; Lei Zhang; Linjun Yang
CleanNet: Transfer Learning für skalierbares Training von Bildklassifizierern mit Etikett-Rauschen
Abstract

In dieser Arbeit untersuchen wir das Problem des Lernens von Bildklassifikationsmodellen unter Berücksichtigung von Etikett-Rauschen (Label Noise). Bestehende Ansätze, die auf menschlicher Überwachung basieren, sind im Allgemeinen nicht skalierbar, da die manuelle Identifizierung korrekter oder fehlerhafter Etiketten zeitaufwendig ist. Ansätze, die nicht auf menschliche Überwachung angewiesen sind, sind zwar skalierbar, aber weniger effektiv. Um den Bedarf an menschlicher Überwachung für die Reinigung von Etikett-Rauschen zu reduzieren, stellen wir CleanNet vor, ein gemeinsames neuronales Einbettungsnetzwerk (Joint Neural Embedding Network), das nur einen Bruchteil der Klassen manuell verifiziert haben muss, um Wissen über Etikett-Rauschen bereitzustellen, das auf andere Klassen übertragen werden kann. Wir integrieren CleanNet und herkömmliche konvolutorische Neuronale Netze (CNN) in ein einheitliches Framework für das Lernen von Bildklassifikationen. Die Effektivität des vorgeschlagenen Algorithmus wird sowohl bei der Aufgabe der Erkennung von Etikett-Rauschen als auch bei der Bildklassifikation mit verrauschten Daten auf mehreren großen Datensätzen demonstriert. Experimentelle Ergebnisse zeigen, dass CleanNet den Fehlerquoten bei der Erkennung von Etikett-Rauschen in gehaltenen Klassen (held-out classes), wo keine menschliche Überwachung verfügbar ist, um 41,5 % im Vergleich zu aktuellen schwach überwachten Methoden reduzieren kann. Es erreicht zudem eine Leistungssteigerung von 47 % bei einer Bildklassifikationsaufgabe durch die Verifizierung nur 3,2 % aller Bilder im Vergleich zur Verifizierung aller Bilder. Der Quellcode und der Datensatz werden unter kuanghuei.github.io/CleanNetProject zur Verfügung gestellt.