vor 2 Monaten

Balancierte Klassifizierung: Ein einheitliches Framework für die Detektion von Objekten mit langen Schweifen

Qi, Tianhao ; Xie, Hongtao ; Li, Pandeng ; Ge, Jiannan ; Zhang, Yongdong

Abstract

Konventionelle Detektoren leiden unter einer Leistungsverschlechterung bei der Verarbeitung von langschwänzigen Daten aufgrund einer Klassifikationsverzerrung zugunsten der überrepräsentierten Hauptkategorien. In dieser Arbeit argumentieren wir, dass die Lernverzerrung aus zwei Faktoren herrührt: 1) dem ungleichen Wettbewerb, der durch die ungleichmäßige Verteilung der Vordergrundkategorien entsteht, und 2) dem Mangel an Stichprobenvielfalt in den Schwanzkategorien. Um diese Probleme anzugehen, stellen wir ein einheitliches Framework vor, das BAlanced CLassification (BACL) genannt wird. Dieses Framework ermöglicht eine adaptive Korrektur von Ungleichheiten, die durch Unterschiede in der Kategorieverteilung verursacht werden, und eine dynamische Steigerung der Stichprobenvielfalt in einem synchronisierten Prozess.Speziell wurde ein neuer Verlust für die balancierte Vordergrundklassifikation (Foreground Classification Balance Loss, FCBL) entwickelt, um die Dominanz der Hauptkategorien zu mildern und die Aufmerksamkeit auf schwer zu differenzierende Kategorien zu lenken. Dies geschieht durch die Einführung paarweiser klassenbewusster Margen und automatisch angepasster Gewichtsterme. Dieser Verlust verhindert die Überunterdrückung von Schwanzkategorien im Kontext des ungleichen Wettbewerbs. Darüber hinaus schlagen wir ein Modul zur dynamischen Feature-Halluzination (Feature Hallucination Module, FHM) vor, das durch die Synthese halluzinierter Stichproben zusätzliche Datenvarianzen einführt und damit die Darstellung von Schwanzkategorien im Merkmalsraum verbessert.In diesem Teile-und-herrsche-Ansatz erreicht BACL einen neuen Stand der Technik auf dem anspruchsvollen LVIS-Benchmark mit einem dekoppelten Trainingspipeline. Es übertreffen vanilla Faster R-CNN mit ResNet-50-FPN um 5,8 % AP insgesamt und um 16,1 % AP für Schwanzkategorien. Ausführliche Experimente zeigen, dass BACL konsistent Leistungsverbesserungen auf verschiedenen Datensätzen mit unterschiedlichen Backbones und Architekturen erzielt. Der Code und die Modelle sind unter https://github.com/Tianhao-Qi/BACL verfügbar.