Fein granulare visuelle Kategorisierung unter Verwendung von Meta-Lernoptimierung mit Stichprobenauswahl von Hilfsdaten

Feinmaschige visuelle Kategorisierung (FGVC) ist herausfordernd, teilweise aufgrund der Schwierigkeit, eine ausreichende Anzahl von Trainingsbeispielen zu erlangen. Um große Modelle für FGVC einzusetzen, ohne an Überanpassung (Overfitting) zu leiden, verwenden bestehende Methoden in der Regel eine Strategie, bei der die Modelle mit einem reichhaltigen Satz an Hilfsdaten vortrainiert und dann an die Ziel-FGVC-Aufgabe angepasst werden. Das Ziel des Vortrainings berücksichtigt jedoch nicht die Zielaufgabe, wodurch die so erhaltenen Modelle für das Anpassen suboptimal sind. Um dieses Problem zu lösen, schlagen wir in diesem Artikel ein neues tiefes FGVC-Modell vor, das MetaFGNet genannt wird. Die Ausbildung von MetaFGNet basiert auf einem neuen regularisierten Meta-Lernziel, das darauf abzielt, den Lernprozess der Netzwerkparameter zu steuern, sodass diese optimal für die Anpassung an die Ziel-FGVC-Aufgabe sind. Basierend auf MetaFGNet schlagen wir zudem ein einfaches aber effektives Verfahren zur Auswahl nützlicherer Beispiele aus den Hilfsdaten vor. Experimente mit Standard-Datensätzen für FGVC zeigen die Effizienz unserer vorgeschlagenen Methode.