HyperAIHyperAI
vor 17 Tagen

Feinabgestimmte visuelle Klassifikation durch fortschreitende Multi-Granularitäts-Trainingsstrategie von Jigsaw-Patches

Ruoyi Du, Dongliang Chang, Ayan Kumar Bhunia, Jiyang Xie, Zhanyu Ma, Yi-Zhe Song, Jun Guo
Feinabgestimmte visuelle Klassifikation durch fortschreitende Multi-Granularitäts-Trainingsstrategie von Jigsaw-Patches
Abstract

Feinabgestufte visuelle Klassifikation (Fine-grained Visual Classification, FGVC) ist aufgrund der inhärent subtilen innerhalb-klasse-Objektvariationen deutlich herausfordernder als traditionelle Klassifikationsaufgaben. Neuere Arbeiten konzentrieren sich hauptsächlich darauf, wie die diskriminativsten Teile, ergänzende Teile sowie Teile verschiedener Granularitäten lokalisiert werden können. Weniger Aufmerksamkeit wurde jedoch der Frage gewidmet, welche Granularitäten am diskriminativsten sind und wie Informationen über verschiedene Granularitäten effektiv fusioniert werden können. In dieser Arbeit stellen wir einen neuartigen Ansatz für die feinabgestufte visuelle Klassifikation vor, um diese Herausforderungen anzugehen. Insbesondere schlagen wir vor: (i) eine fortschreitende Trainingsstrategie, die Merkmale verschiedener Granularitäten effektiv fusioniert, und (ii) einen zufälligen Jigsaw-Teilgenerator, der das Netzwerk anregt, Merkmale auf spezifischen Granularitäten zu lernen. Wir erreichen state-of-the-art-Ergebnisse auf mehreren etablierten FGVC-Benchmark-Datensätzen, wobei die vorgeschlagene Methode stets bestehende Ansätze übertrifft oder wettbewerbsfähige Ergebnisse liefert. Der Quellcode wird unter https://github.com/PRIS-CV/PMG-Progressive-Multi-Granularity-Training verfügbar sein.