HyperAIHyperAI
vor 2 Monaten

Equalization Loss v2: Ein neuer Ansatz zur Gradientenbalancierung für die Erkennung von Objekten mit langen Schwänzen

Tan, Jingru ; Lu, Xin ; Zhang, Gang ; Yin, Changqing ; Li, Quanquan
Equalization Loss v2: Ein neuer Ansatz zur Gradientenbalancierung für die Erkennung von Objekten mit langen Schwänzen
Abstract

Kürzlich vorgeschlagene dekoppelte Trainingsmethoden etablieren sich als vorherrschendes Paradigma für die Erkennung von langschwänzigen Objekten. Allerdings erfordern sie eine zusätzliche Feinjustierungsphase, und die getrennte Optimierung von Repräsentation und Klassifikator kann zu suboptimalen Ergebnissen führen. End-to-end Trainingsmethoden wie der Equalization Loss (EQL) performieren jedoch weiterhin schlechter als dekoppelte Trainingsmethoden. In dieser Arbeit zeigen wir auf, dass das Hauptproblem bei der Erkennung von langschwänzigen Objekten die ungleichmäßige Verteilung der Gradienten zwischen Positiven und Negativen ist, und feststellen, dass EQL dieses Problem nicht gut löst. Um das Problem der ungleichmäßigen Gradienten zu bewältigen, stellen wir eine neue Version des Equalization Loss vor, den sogenannten Equalization Loss v2 (EQL v2). Dieser Mechanismus nutzt ein neuartiges gradientengesteuertes Neugewichtungsverfahren, das den Trainingsprozess für jede Kategorie unabhängig und gleichmäßig ausbalanciert. Ausführliche Experimente wurden am anspruchsvollen LVIS-Benchmark durchgeführt. EQL v2 übertrifft den ursprünglichen EQL um etwa 4 Punkte im gesamten AP-Wert und verbessert sich um 14-18 Punkte in seltenen Kategorien. Wichtiger noch, es übertrifft auch die dekuppelten Trainingsmethoden. Ohne weitere Anpassungen für den Open Images-Datensatz verbessert EQL v2 den EQL um 7,3 Punkte AP, was eine starke Generalisierungsfähigkeit zeigt. Der Code wurde unter https://github.com/tztztztz/eqlv2 veröffentlicht.

Equalization Loss v2: Ein neuer Ansatz zur Gradientenbalancierung für die Erkennung von Objekten mit langen Schwänzen | Neueste Forschungsarbeiten | HyperAI