HyperAIHyperAI
vor 9 Tagen

Langschwänzige Erkennung durch Routing vielfältiger verteilungsaware Experte

Xudong Wang, Long Lian, Zhongqi Miao, Ziwei Liu, Stella X. Yu
Langschwänzige Erkennung durch Routing vielfältiger verteilungsaware Experte
Abstract

Natürliche Daten sind oft langschwanzverteilt über semantische Klassen. Bestehende Erkennungsmethoden behandeln diese unbalancierte Klassifikation, indem sie den sogenannten „Tail“-Daten mehr Aufmerksamkeit schenken, beispielsweise durch Klassen-Neugewichtung oder -Ausgleich sowie durch Ensembles verschiedener Datengruppen. Dies führt zu einer Verbesserung der Tail-Accuracy, jedoch zu einer Verschlechterung der Head-Accuracy.Wir betrachten die Trainingsdaten dynamisch und führen eine fundierte Analyse von Modellverzerrung (bias) und -varianz durch, während sich die Trainingsdaten verändern: Bestehende Langschwanz-Klassifikatoren erhöhen zwangsläufig die Modellvarianz, und der Bias-Unterschied zwischen Head und Tail bleibt groß, da die Tail-Klassen mit schweren Negativen zunehmend verwechselt werden.Wir stellen einen neuen Langschwanz-Klassifikator namens RoutIng Diverse Experts (RIDE) vor. RIDE reduziert die Modellvarianz durch mehrere Experten, verringert die Modellverzerrung mittels eines verteilungsorientierten Diversitätsverlustes und senkt die Rechenkosten durch ein dynamisches Experten-Routing-Modul. RIDE erreicht auf den Benchmarks CIFAR100-LT, ImageNet-LT und iNaturalist 2018 eine Leistungssteigerung gegenüber dem Stand der Technik um 5 % bis 7 %. Zudem handelt es sich um ein universelles Framework, das mit verschiedenen Backbone-Netzwerken, Langschwanz-Algorithmen und Trainingsmechanismen kompatibel ist und konsistente Leistungsverbesserungen erzielt. Unser Code ist verfügbar unter: https://github.com/frank-xwang/RIDE-LongTailRecognition.