Beweisbar end-to-end Lernverfahren für Label-Noise ohne Anchor-Punkte

Bei der Lernmethode mit fehlerhaften Etiketten spielt die Übergangsmatrix eine zentrale Rolle bei der Konstruktion statistisch konsistenter Klassifikatoren. Bestehende konsistente Schätzer für die Übergangsmatrix wurden durch Ausnutzung von Anchor-Punkten entwickelt. Doch die Annahme von Anchor-Punkten ist in realen Szenarien nicht immer erfüllt. In diesem Paper stellen wir einen end-to-end-Framework zur Lösung des Problems des Lernens mit fehlerhaften Etiketten ohne Anchor-Punkte vor, bei dem wir zwei Ziele gleichzeitig optimieren: die Kreuzentropie-Verlustfunktion zwischen der fehlerhaften Etikettierung und der vom neuronalen Netzwerk vorhergesagten Wahrscheinlichkeit sowie das Volumen des von den Spalten der Übergangsmatrix gebildeten Simplex. Unser vorgeschlagener Ansatz kann die Übergangsmatrix identifizieren, sofern die sauberen Klassen-A-posteriori-Wahrscheinlichkeiten hinreichend verteilt sind. Dies stellt bislang die schwächste Annahme dar, unter der die Übergangsmatrix beweisbar identifizierbar ist und der gelernte Klassifikator statistisch konsistent ist. Experimentelle Ergebnisse auf Benchmark-Datensätzen belegen die Wirksamkeit und Robustheit der vorgeschlagenen Methode.