RelationNet2: Tiefen Vergleichskolonnen für Few-Shot-Lernen

Few-Shot Deep Learning ist ein aktuelles Herausforderungsgebiet bei der Skalierung der visuellen Erkennung auf offene, kontinuierliche Wachstumsprozesse von neuen, bisher nicht gesehenen Klassen mit begrenzt vielen annotierten Beispielen. Ein vielversprechender Ansatz basiert auf Metrik-Lernen (metric learning), das ein tiefes Einbettungsmodell trainiert, um die Ähnlichkeitsabgleichung von Bildern zu unterstützen. Unser Erkenntnis besteht darin, dass eine effektive allgemeine Abgleichung nicht-lineare Vergleiche von Merkmalen auf mehreren Abstraktionsebenen erfordert. Wir schlagen daher ein neues tiefes Vergleichsnetzwerk vor, das aus Einbettungs- und Relationmodulen besteht und gleichzeitig mehrere nicht-lineare Distanzmetriken basierend auf verschiedenen Merkmalebenen lernt. Darüber hinaus reduzieren wir Überanpassung (overfitting) und ermöglichen die Verwendung tieferer Einbettungen, indem wir Bilder als Verteilungen anstatt als Vektoren durch parametrisierte Gaußsche Rauschregularisierung darstellen. Das resultierende Netzwerk erzielt ausgezeichnete Ergebnisse sowohl in miniImageNet als auch in tieredImageNet.