HyperAIHyperAI
vor 19 Tagen

Lernen von klassenspezifischen Merkmalen in der feinkörnigen visuellen Klassifikation

Runkai Zheng, Zhijia Yu, Yinqi Zhang, Chris Ding, Hei Victor Cheng, Li Liu
Lernen von klassenspezifischen Merkmalen in der feinkörnigen visuellen Klassifikation
Abstract

Ein zentrales Herausforderung bei der feinkörnigen visuellen Klassifikation (Fine-Grained Visual Classification, FGVC) besteht darin, Kategorien mit hoher Inter-Klassen-Ähnlichkeit durch Lernen von Merkmalen, die feine Unterschiede erfassen, voneinander zu unterscheiden. Herkömmliche Cross-Entropy-gelernnte convolutionale Neuronale Netze (Convolutional Neural Networks, CNNs) versagen bei dieser Aufgabe, da sie unter Umständen invariant gegenüber Inter-Klassen-Unterschieden erzeugte Merkmale produzieren können. In dieser Arbeit schlagen wir innovativ vor, den Trainingsprozess von CNNs durch eine Regularisierung zu verbessern, die die Eindeutigkeit der Merkmale pro Kategorie aus einer informationstheoretischen Perspektive erzwingt. Um dieses Ziel zu erreichen, formulieren wir eine Minimax-Verlustfunktion basierend auf einem spieltheoretischen Rahmen, wobei bewiesen wird, dass ein Nash-Gleichgewicht mit diesem Regularisierungsziel konsistent ist. Darüber hinaus schlagen wir eine Feature-Redundanz-Verlustfunktion (Feature Redundancy Loss, FRL) vor, die auf dem normalisierten inneren Produkt jeweils ausgewählter Merkmalskarten basiert, um eine mögliche Lösung der Minimax-Verlustfunktion zu ergänzen, die redundanten Merkmale erzeugen könnte. Überzeugende experimentelle Ergebnisse auf mehreren etablierten Benchmarks sowie visuelle Analysen zeigen, dass unsere Methode das Leistungspotenzial des Baseline-Modells voll ausschöpft, ohne zusätzlichen Rechenaufwand zu erfordern, und Ergebnisse erzielt, die mit den besten aktuellen Modellen vergleichbar sind.

Lernen von klassenspezifischen Merkmalen in der feinkörnigen visuellen Klassifikation | Neueste Forschungsarbeiten | HyperAI