Gewichtsgeleitete Klassenergänzung für die Long-Tailed-Bilderkennung
Realwelt-Daten sind oft langschwänzig verteilt und weisen eine große Anzahl an Klassen auf. Diese Eigenschaft führt zu einem erheblichen Leistungsabfall verschiedener Modelle. Ein Grund hierfür ist der Gradientenverschiebung, die durch nicht abgetastete Klassen in jeder Trainingsiteration verursacht wird. In diesem Paper stellen wir einen Weight-Guided Class Complementing (WGCC)-Rahmenwerk vor, um dieses Problem zu bewältigen. Konkret ergänzt dieser Rahmenwerk in jeder Trainingsiteration die nicht abgetasteten Klassen durch Nutzung eines dynamisch aktualisierten Datenslots. Um das Überanpassungsrisiko zu minimieren, das durch die Klassen-Ergänzung entstehen kann, nutzen wir die Klassifikator-Gewichte als gelerntes Wissen und fördern damit, dass das Modell weitere klassenspezifische Merkmale erkennt. Schließlich entwerfen wir eine Gewichtsverfeinerungsschema, um die langschwänzige Verzerrung, die in den Klassifikator-Gewichten besteht, zu behandeln. Experimentelle Ergebnisse zeigen, dass unser Rahmenwerk effektiv auf verschiedene bestehende Ansätze angewendet werden kann und konsistente Verbesserungen auf verschiedenen Benchmarks erzielt, wobei neue State-of-the-Art-Leistungen erreicht werden.