HyperAIHyperAI
vor 18 Tagen

Feinabgestimmte visuelle Klassifikation mit Batch Confusion Norm

{Tyng-Luh Liu, Ming-Sui Lee, Ding-Jie Chen, Cheng-Yao Hong, Yen-Chi Hsu, Davi Geiger}
Abstract

Wir führen ein Regularisierungskonzept basierend auf dem vorgeschlagenen Batch Confusion Norm (BCN) ein, um das Problem der feinabgestuften visuellen Klassifikation (Fine-Grained Visual Classification, FGVC) anzugehen. Das FGVC-Problem zeichnet sich durch zwei charakteristische Eigenschaften aus: erhebliche Ähnlichkeit zwischen Klassen sowie starke innerhalb-Klassen-Variationen, was die Entwicklung eines effektiven FGVC-Klassifikators zu einer herausfordernden Aufgabe macht. Inspiriert durch den Einsatz der Paarweisen Verwirrungsenergie als Regularisierungsmechanismus entwickeln wir die BCN-Technik, um das Lernen im FGVC durch die Einführung von Klassenvorhersage-Verwirrung innerhalb jeder Trainingsbatch zu verbessern und somit das mögliche Überanpassen infolge der Exploration feinster Bilddetails zu verringern. Zudem wird unsere Methode in einem Aufmerksamkeits-gesteuerten CNN-Modell umgesetzt, das durch die Integration des Atrous Spatial Pyramid Pooling (ASPP) zur Extraktion diskriminativer Merkmale und geeigneter Aufmerksamkeitsmuster verbessert wird. Um die Wirksamkeit unseres Ansatzes zu belegen, erzielen wir state-of-the-art-Ergebnisse auf mehreren Standard-Benchmark-Datensätzen für FGVC und führen umfassende Ablationsstudien durch.