Lernen, Etiketten zu verbreiten: Transduktives Verbreitungsnetzwerk für Few-Shot-Lernen

Das Ziel des Few-Shot-Learnings ist es, einen Klassifikator zu trainieren, der auch bei einer begrenzten Anzahl von Trainingsinstanzen pro Klasse gut verallgemeinert. Die kürzlich eingeführten Meta-Learning-Ansätze lösen dieses Problem, indem sie einen generischen Klassifikator über eine große Anzahl von Mehrklassen-Klassifizierungsaufgaben lernen und das Modell auf eine neue Aufgabe verallgemeinern. Dennoch bleibt das Problem der geringen Datenmenge in der neuen Klassifizierungsaufgabe auch mit solchen Meta-Learning-Methoden bestehen. In dieser Arbeit schlagen wir das Transductive Propagation Network (TPN) vor, ein neues Meta-Learning-Framework für transduktive Inferenz, das die gesamte Testmenge gleichzeitig klassifiziert, um das Problem der geringen Datenmenge zu lindern. Insbesondere schlagen wir vor, Labels von etikettierten Instanzen zu unetikettierten Testinstanzen zu propagieren, indem wir ein Graphenerzeugungsmodul lernen, das die Mannigfaltigkeitsstruktur in den Daten ausnutzt. Das TPN lernt sowohl die Parameter der Merkmalskodierung als auch die Graphenerzeugung in einem end-to-end-Prozess gemeinsam. Wir validieren das TPN auf mehreren Benchmark-Datensätzen, bei denen es erheblich bessere Ergebnisse als existierende Few-Shot-Learning-Ansätze erzielt und den Stand der Technik erreicht.