HyperAIHyperAI
vor 18 Tagen

Nach-Optimierung der groben Klassifikation mit lokalregionenverstärkten Merkmalen für die feinkörnige Bilderkennung

Shaokang Yang, Shuai Liu, Cheng Yang, Changhu Wang
Nach-Optimierung der groben Klassifikation mit lokalregionenverstärkten Merkmalen für die feinkörnige Bilderkennung
Abstract

Die Feinabstufung von Bildern ist aufgrund der Schwierigkeit, sowohl semantisch informative globale Merkmale als auch diskriminative lokale Merkmale zu erfassen, äußerst herausfordernd. Gleichzeitig ist die Integration dieser beiden Merkmalsarten nicht einfach und kann sogar konfliktär sein, wenn sie gleichzeitig genutzt werden. In diesem Artikel wird ein abrufbasiertes Grob-zu-Fein-Framework vorgestellt, bei dem die Top-N-Klassifikationsergebnisse durch die Verwendung von lokalregionenverstärkter Embedding-Merkmale neu bewertet werden, um die Top-1-Accuracy zu verbessern (aufgrund der Beobachtung, dass die korrekte Kategorie in der Regel unter den Top-N-Ergebnissen enthalten ist). Um diskriminative Regionen zur Unterscheidung feinabgestufter Bilder zu ermitteln, führen wir eine schwach überwachte Methode ein, um einen Box-Generierungs-Branch mit lediglich bildweisen Etiketten zu trainieren. Darüber hinaus entwerfen wir eine mehrstufige Verlustfunktion über eine automatisch aufgebaute hierarchische Kategoriestruktur, um effektivere semantische globale Merkmale zu lernen. Experimentelle Ergebnisse zeigen, dass unsere Methode auf drei Benchmark-Datensätzen – CUB-200-2011, Stanford Cars und FGVC Aircraft – die derzeit beste Leistung erzielt. Zudem werden visuelle Darstellungen und Analysen bereitgestellt, um das Verständnis zu vertiefen.