HyperAIHyperAI
vor 17 Tagen

Verbesserte Few-Shot visuelle Klassifikation

Peyman Bateni, Raghav Goyal, Vaden Masrani, Frank Wood, Leonid Sigal
Verbesserte Few-Shot visuelle Klassifikation
Abstract

Few-shot-Lernen ist eine zentrale Aufgabe im Bereich des Computersehens und verspricht, die Abhängigkeit von umfangreichen, manuell beschrifteten Datensätzen zu verringern. Bislang konzentrierten sich die meisten Ansätze im Few-shot-Lernen auf zunehmend komplexere neuronale Merkmalsextraktoren und Klassifikator-Anpassungsstrategien sowie die Verfeinerung der Aufgabenstellung selbst. In diesem Paper untersuchen wir die Hypothese, dass eine einfache, auf der Klassenkovarianz basierende Distanzmetrik – nämlich die Mahalanobis-Distanz –, wenn sie in einen state-of-the-art Few-shot-Lernansatz (CNAPS) integriert wird, bereits für eine signifikante Leistungssteigerung sorgt. Zudem zeigen wir, dass es möglich ist, adaptive Merkmalsextraktoren zu lernen, die eine nützliche Schätzung der hochdimensionalen Merkmalskovarianzen, wie sie für diese Metrik erforderlich sind, bereits aus überraschend wenigen Beispielen ermöglichen. Das Ergebnis unserer Arbeit ist eine neue Architektur namens „Simple CNAPS“, die bis zu 9,2 % weniger trainierbare Parameter als CNAPS aufweist und auf dem standardisierten Few-shot-Bildklassifizierungsdatensatz bis zu 6,1 % besser abschneidet als aktuelle State-of-the-Art-Methoden.