Variational Feature Disentangling für feinkörnige Few-Shot-Klassifikation

Feinabgestimmte Few-Shot-Erkennung leidet häufig unter dem Problem des Mangelns an Trainingsdaten für neue Kategorien. Aufgrund unzureichender Trainingsdaten neigt das Netzwerk dazu, überzufitten und generalisiert schlecht auf nicht gesehene Klassen. Zahlreiche Methoden wurden vorgeschlagen, um zusätzliche Daten zu synthetisieren und somit das Training zu unterstützen. In diesem Paper konzentrieren wir uns darauf, die intra-klassische Varianz der nicht gesehenen Klasse zu vergrößern, um die Leistung bei der Few-Shot-Klassifikation zu verbessern. Wir gehen davon aus, dass die Verteilung der intra-klassischen Varianz zwischen der Basis-Klasse und der neuen Klasse generalisierbar ist. Daher kann die intra-klassische Varianz der Basismenge zur Merkmalsvervollständigung der neuen Menge transferiert werden. Konkret modellieren wir zunächst die Verteilung der intra-klassischen Varianz auf der Basismenge mittels variationaler Inferenz. Anschließend wird die gelernte Verteilung auf die neue Menge übertragen, um zusätzliche Merkmale zu generieren, die zusammen mit den ursprünglichen Merkmalen zum Training eines Klassifikators verwendet werden. Experimentelle Ergebnisse zeigen eine signifikante Verbesserung gegenüber den aktuellen State-of-the-Art-Methoden auf anspruchsvollen Fine-Grained Few-Shot-Benchmark-Datensätzen für Bilder.