Wahrscheinlichkeitsgesteuerte Verlustfunktion für langschwänzige Mehrlabels-Bildklassifikation
Langtail-Verlernen hat in den letzten Jahren zunehmend Aufmerksamkeit erlangt. Die langtail-orientierte mehrfach-label-basierte Bildklassifikation stellt eine Untergruppe dar und bleibt weiterhin herausfordernd sowie wenig erforscht. In diesem Paper präsentieren wir einen neuen Ansatz aus der Perspektive der Wahrscheinlichkeit, um dieses Problem zu bewältigen. Genauer gesagt stellen wir fest, dass bestehende kostenempfindliche Lernmethoden für langtail-orientierte mehrfach-label-Klassifikationen während des Trainings die vorhergesagten Wahrscheinlichkeiten für positive und negative Labels unterschiedlich beeinflussen, und dass verschiedene Abläufe der Wahrscheinlichkeitsverteilung letztendlich die Gesamtleistung beeinflussen. Daher schlagen wir eine wahrscheinlichkeitsgeleitete Verlustfunktion vor, die aus zwei Komponenten besteht, um diesen Prozess zu steuern. Die erste Komponente ist die Wahrscheinlichkeits-Neuausgleichung, die es ermöglicht, den Ablauf des Trainings der Wahrscheinlichkeiten flexibel anzupassen. Die zweite Komponente ist die adaptive, wahrscheinlichkeitsbewusste Fokusfunktion, die zusätzlich die Wahrscheinlichkeitslücke zwischen positiven und negativen Labels reduzieren kann. Wir führen umfangreiche Experimente auf zwei langtail-orientierten mehrfach-label-basierten Bildklassifikationsdatensätzen durch: VOC-LT und COCO-LT. Die Ergebnisse belegen die Plausibilität und Überlegenheit unserer Strategie.