Feature Channel Adaptive Enhancement for Fine-Grained Visual Classification
Die feinkörnige Klassifikation stellt größere Herausforderungen dar als die grundlegende Bildklassifikation, da sich die Unterarten optisch stark ähneln. Um verwirrende Arten voneinander unterscheiden zu können, stellen wir einen neuartigen Ansatz vor, der auf der adaptiven Verbesserung von Merkmalskanälen und der Aufhebung von Aufmerksamkeit basiert. Auf der einen Seite wurde ein leichtgewichtiger Modul entwickelt, der sowohl Kanal- als auch räumliche Aufmerksamkeit nutzt, um die Merkmalsdarstellung wichtiger Bereiche adaptiv zu verstärken und damit differenziertere Merkmalsvektoren zu erzielen. Auf der anderen Seite integrieren wir Methoden zur Aufhebung von Aufmerksamkeit, die das Netzwerk dazu zwingen, sich auf weniger prominente Bereiche zu konzentrieren, wodurch die Robustheit des Netzwerks erhöht wird. Unser Verfahren lässt sich nahtlos in verschiedene Backbone-Netzwerke integrieren. Schließlich wird unsere Methode anhand verschiedener öffentlicher Datensätze evaluiert und mit aktuellen State-of-the-Art-Verfahren umfassend verglichen. Die experimentellen Ergebnisse bestätigen die Wirksamkeit und Praxistauglichkeit unseres Ansatzes in realen Anwendungsszenarien und demonstrieren bemerkenswerte Fortschritte bei anspruchsvollen Aufgaben der feinkörnigen Klassifikation.