HyperAIHyperAI

Command Palette

Search for a command to run...

Die Strafung des schwierigen Beispiels, aber nicht zu sehr: Eine starke Baseline für die feinkörnige visuelle Klassifikation

Yi Yang Xiaohan Wang Linchao Zhu Yuanzhi Liang

Zusammenfassung

Obwohl erhebliche Fortschritte bei der feinabgestuften visuellen Klassifikation (Fine-Grained Visual Classification, FGVC) erzielt wurden, behindert weiterhin eine starke Überanpassung die Generalisierungsfähigkeit von Modellen. Eine kürzlich durchgeführte Studie zeigt, dass schwierige Beispiele im Trainingsset leicht angepasst werden können, doch die meisten bestehenden FGVC-Methoden versagen bei der Klassifikation bestimmter schwieriger Beispiele im Testset. Der Grund hierfür liegt darin, dass das Modell diese schwierigen Beispiele im Trainingsset überanpasst, jedoch nicht lernt, auf unerwartete Beispiele im Testset generalisieren zu können. In diesem Artikel stellen wir eine moderate Modulation schwieriger Beispiele (Moderate Hard Example Modulation, MHEM) vor, um diese schwierigen Beispiele angemessen zu beeinflussen. MHEM ermutigt das Modell, sich nicht übermäßig an schwierige Beispiele anzupassen, und fördert eine bessere Generalisierung und Diskriminierungsfähigkeit. Zunächst führen wir drei Bedingungen ein und formulieren eine allgemeine Form einer modulierten Verlustfunktion. Anschließend instanziieren wir diese Verlustfunktion und präsentieren eine starke Baseline für FGVC, bei der die Leistung eines einfachen Backbone-Modells deutlich gesteigert und mit jüngeren Methoden vergleichbar wird. Darüber hinaus zeigen wir, dass unsere Baseline problemlos in bestehende Methoden integriert werden kann und diese stärker diskriminierend macht. Mit unserer starken Baseline erzielen wir konsistente Verbesserungen auf drei typischen FGVC-Datensätzen: CUB-200-2011, Stanford Cars und FGVC-Aircraft. Wir hoffen, dass die Idee der moderaten Modulation schwieriger Beispiele zukünftige Forschungsarbeiten zur effektiveren feinabgestuften visuellen Erkennung anregen wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp