Robuste zeitliche Verschmelzung für das Lernen mit verrauschten Etiketten

Die erfolgreiche Schulung tiefer neuronaler Netze mit verrauschten Etiketten ist eine entscheidende Fähigkeit, da die meisten realen Datensätze eine gewisse Menge an falsch etikettierten Daten enthalten. Unbehandelt führt Label-Rauschen zu einer erheblichen Verschlechterung typischer überwachter Lernansätze. In diesem Paper präsentieren wir robuste zeitliche Ensembling (RTE), das robuste Verlustfunktionen mit semi-superviseden Regularisierungsmethoden kombiniert, um lernstabil gegenüber Rauschen zu erreichen. Wir zeigen, dass RTE state-of-the-art-Leistung auf den Datensätzen CIFAR-10, CIFAR-100, ImageNet, WebVision und Food-101N erzielt, ohne dabei der jüngsten Tendenz zu folgen, Etiketten zu filtern und/oder zu korrigieren. Schließlich zeigen wir, dass RTE zudem eine konkurrenzfähige Robustheit gegenüber unerwartetem Eingaberauschen aufweist, wie anhand des CIFAR-10-C-Datensatzes demonstriert wird: Bei einer Rauschrate von 80 % erreicht RTE eine mittlere Verfälschungsfehlerquote (mCE) von 13,50 %, verglichen mit 26,9 % mCE bei herkömmlichen Methoden auf sauberen Daten.