Erkennung langgezogener Verteilungen unter Verwendung von klassenbalancierten Experte

Deep Learning ermöglicht beeindruckende Leistungen bei der Bilderkennung mithilfe großskaliger, künstlich ausgewogener Datensätze. In der Praxis weisen jedoch reale Datensätze eine stark klassenunbalanced Verteilung auf, was zwei zentrale Herausforderungen mit sich bringt: relative Ungleichgewichte zwischen den Klassen sowie Datenknappheit bei mittel- oder wenig frequenten Klassen (mediumshot oder fewshot). In dieser Arbeit behandeln wir das Problem der langen Schwanz-Erkennung (long-tailed recognition), bei dem der Trainingsdatensatz stark unbalanciert ist, während der Testdatensatz ausgewogen gehalten wird. Im Gegensatz zu bestehenden Ansätzen, die auf Daten-Resampling, kostenempfindliches Lernen, Online-Hard-Example-Mining, Umformung der Verlustfunktion oder speicherbasierte Modellierung setzen, schlagen wir einen Ensemble aus klassenbalancierten Experten vor, der die Stärken verschiedener Klassifikatoren kombiniert. Unser Ensemble aus klassenbalancierten Experten erreicht Ergebnisse nahe der State-of-the-Art-Leistung, und ein erweiterter Ensemble-Ansatz stellt eine neue State-of-the-Art-Leistung auf zwei Benchmarks für die lange Schwanz-Erkennung auf. Wir führen umfangreiche Experimente durch, um die Leistung der Ensembles zu analysieren, und entdecken, dass in modernen großskaligen Datensätzen das relative Ungleichgewicht ein schwierigeres Problem darstellt als die Datenknappheit. Der Trainings- und Evaluierungscode ist unter https://github.com/ssfootball04/class-balanced-experts verfügbar.