Langschwänzige Erkennung durch Routing vielfältiger verteilungsaware Experte

Natürliche Daten sind oft langschwanzverteilt über semantische Klassen. Bestehende Erkennungsmethoden behandeln diese unbalancierte Klassifikation, indem sie den sogenannten „Tail“-Daten mehr Aufmerksamkeit schenken, beispielsweise durch Klassen-Neugewichtung oder -Ausgleich sowie durch Ensembles verschiedener Datengruppen. Dies führt zu einer Verbesserung der Tail-Accuracy, jedoch zu einer Verschlechterung der Head-Accuracy.Wir betrachten die Trainingsdaten dynamisch und führen eine fundierte Analyse von Modellverzerrung (bias) und -varianz durch, während sich die Trainingsdaten verändern: Bestehende Langschwanz-Klassifikatoren erhöhen zwangsläufig die Modellvarianz, und der Bias-Unterschied zwischen Head und Tail bleibt groß, da die Tail-Klassen mit schweren Negativen zunehmend verwechselt werden.Wir stellen einen neuen Langschwanz-Klassifikator namens RoutIng Diverse Experts (RIDE) vor. RIDE reduziert die Modellvarianz durch mehrere Experten, verringert die Modellverzerrung mittels eines verteilungsorientierten Diversitätsverlustes und senkt die Rechenkosten durch ein dynamisches Experten-Routing-Modul. RIDE erreicht auf den Benchmarks CIFAR100-LT, ImageNet-LT und iNaturalist 2018 eine Leistungssteigerung gegenüber dem Stand der Technik um 5 % bis 7 %. Zudem handelt es sich um ein universelles Framework, das mit verschiedenen Backbone-Netzwerken, Langschwanz-Algorithmen und Trainingsmechanismen kompatibel ist und konsistente Leistungsverbesserungen erzielt. Unser Code ist verfügbar unter: https://github.com/frank-xwang/RIDE-LongTailRecognition.