HyperAIHyperAI

Command Palette

Search for a command to run...

Balancierte Klassifizierung: Ein einheitliches Framework für die Detektion von Objekten mit langen Schweifen

Tianhao Qi Hongtao Xie* Pandeng Li Jiannan Ge Yongdong Zhang, Senior Member, IEEE

Zusammenfassung

Konventionelle Detektoren leiden unter einer Leistungsverschlechterung bei der Verarbeitung von langschwänzigen Daten aufgrund einer Klassifikationsverzerrung zugunsten der überrepräsentierten Hauptkategorien. In dieser Arbeit argumentieren wir, dass die Lernverzerrung aus zwei Faktoren herrührt: 1) dem ungleichen Wettbewerb, der durch die ungleichmäßige Verteilung der Vordergrundkategorien entsteht, und 2) dem Mangel an Stichprobenvielfalt in den Schwanzkategorien. Um diese Probleme anzugehen, stellen wir ein einheitliches Framework vor, das BAlanced CLassification (BACL) genannt wird. Dieses Framework ermöglicht eine adaptive Korrektur von Ungleichheiten, die durch Unterschiede in der Kategorieverteilung verursacht werden, und eine dynamische Steigerung der Stichprobenvielfalt in einem synchronisierten Prozess.Speziell wurde ein neuer Verlust für die balancierte Vordergrundklassifikation (Foreground Classification Balance Loss, FCBL) entwickelt, um die Dominanz der Hauptkategorien zu mildern und die Aufmerksamkeit auf schwer zu differenzierende Kategorien zu lenken. Dies geschieht durch die Einführung paarweiser klassenbewusster Margen und automatisch angepasster Gewichtsterme. Dieser Verlust verhindert die Überunterdrückung von Schwanzkategorien im Kontext des ungleichen Wettbewerbs. Darüber hinaus schlagen wir ein Modul zur dynamischen Feature-Halluzination (Feature Hallucination Module, FHM) vor, das durch die Synthese halluzinierter Stichproben zusätzliche Datenvarianzen einführt und damit die Darstellung von Schwanzkategorien im Merkmalsraum verbessert.In diesem Teile-und-herrsche-Ansatz erreicht BACL einen neuen Stand der Technik auf dem anspruchsvollen LVIS-Benchmark mit einem dekoppelten Trainingspipeline. Es übertreffen vanilla Faster R-CNN mit ResNet-50-FPN um 5,8 % AP insgesamt und um 16,1 % AP für Schwanzkategorien. Ausführliche Experimente zeigen, dass BACL konsistent Leistungsverbesserungen auf verschiedenen Datensätzen mit unterschiedlichen Backbones und Architekturen erzielt. Der Code und die Modelle sind unter https://github.com/Tianhao-Qi/BACL verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp