HyperAIHyperAI
vor 18 Tagen

Die Strafung des schwierigen Beispiels, aber nicht zu sehr: Eine starke Baseline für die feinkörnige visuelle Klassifikation

{Yi Yang, Xiaohan Wang, Linchao Zhu, Yuanzhi Liang}
Abstract

Obwohl erhebliche Fortschritte bei der feinabgestuften visuellen Klassifikation (Fine-Grained Visual Classification, FGVC) erzielt wurden, behindert weiterhin eine starke Überanpassung die Generalisierungsfähigkeit von Modellen. Eine kürzlich durchgeführte Studie zeigt, dass schwierige Beispiele im Trainingsset leicht angepasst werden können, doch die meisten bestehenden FGVC-Methoden versagen bei der Klassifikation bestimmter schwieriger Beispiele im Testset. Der Grund hierfür liegt darin, dass das Modell diese schwierigen Beispiele im Trainingsset überanpasst, jedoch nicht lernt, auf unerwartete Beispiele im Testset generalisieren zu können. In diesem Artikel stellen wir eine moderate Modulation schwieriger Beispiele (Moderate Hard Example Modulation, MHEM) vor, um diese schwierigen Beispiele angemessen zu beeinflussen. MHEM ermutigt das Modell, sich nicht übermäßig an schwierige Beispiele anzupassen, und fördert eine bessere Generalisierung und Diskriminierungsfähigkeit. Zunächst führen wir drei Bedingungen ein und formulieren eine allgemeine Form einer modulierten Verlustfunktion. Anschließend instanziieren wir diese Verlustfunktion und präsentieren eine starke Baseline für FGVC, bei der die Leistung eines einfachen Backbone-Modells deutlich gesteigert und mit jüngeren Methoden vergleichbar wird. Darüber hinaus zeigen wir, dass unsere Baseline problemlos in bestehende Methoden integriert werden kann und diese stärker diskriminierend macht. Mit unserer starken Baseline erzielen wir konsistente Verbesserungen auf drei typischen FGVC-Datensätzen: CUB-200-2011, Stanford Cars und FGVC-Aircraft. Wir hoffen, dass die Idee der moderaten Modulation schwieriger Beispiele zukünftige Forschungsarbeiten zur effektiveren feinabgestuften visuellen Erkennung anregen wird.

Die Strafung des schwierigen Beispiels, aber nicht zu sehr: Eine starke Baseline für die feinkörnige visuelle Klassifikation | Neueste Forschungsarbeiten | HyperAI