Bootstrapping der Beziehung zwischen Bildern und ihren sauberen sowie verrauschten Labels

Viele aktuelle Methoden des Lernens mit verrauschten Etiketten stützen sich auf Lernmechanismen, die während des Trainings die sauberen Etiketten der Samples schätzen und die ursprünglichen verrauschten Etiketten verwerfen. Dieser Ansatz verhindert jedoch die Erfassung der Beziehung zwischen Bildern, verrauschten Etiketten und sauberen Etiketten, die sich als nützlich erwiesen hat, insbesondere bei Problemen mit instanzabhängigen Etikettierungsfehlern. Zudem erfordern Methoden, die explizit darauf abzielen, diese Beziehung zu lernen, sauber annotierte Datensubsets sowie komplexere Trainingsstrategien wie Distillation oder mehrfach strukturierte Modelle. In diesem Artikel stellen wir einen neuen Trainingsalgorithmus vor, der auf einem einfachen Modell basiert und die Beziehung zwischen sauberen und verrauschten Etiketten lernt, ohne ein sauber annotiertes Datensubset zu benötigen. Unser Algorithmus folgt einem dreistufigen Prozess: 1) Selbstüberwachtes Vortrainieren gefolgt von einem frühen Stopp beim Training des Klassifikators, um zuverlässig saubere Etiketten für eine Teilmenge des Trainingsdatensatzes vorherzusagen; 2) Nutzung der sauberen Teilmenge aus Schritt (1), um die Beziehung zwischen Bildern, verrauschten Etiketten und sauberen Etiketten zu schätzen, die anschließend zur effektiven Neubewertung des restlichen Trainingsdatensatzes mittels semi-supervised Learning genutzt wird; und 3) überwachtes Training des Klassifikators mit allen in Schritt (2) neu bewerteten Samples. Durch die Erfassung dieser Beziehung erreichen wir state-of-the-art Ergebnisse bei asymmetrischen und instanzabhängigen Etikettierungsfehlern.