TapNet: Neuronales Netzwerk mit task-adaptiver Projektion für Few-Shot-Lernen

Das Bewältigen bisher unbekannter Aufgaben mit nur wenigen Trainingsbeispielen bleibt eine große Herausforderung im Maschinellen Lernen. Wir schlagen TapNets vor, neurale Netze, die durch eine aufgabenanpassbare Projektion (task-adaptive projection) erweitert sind, um das Few-Shot-Lernen zu verbessern. Dabei wird ein Netzwerk und eine Reihe von Klassenreferenzvektoren über eine Vielzahl von Aufgaben hinweg mittels einer metakognitiven Lernstrategie und episodenbasiertem Training gelernt. Gleichzeitig werden in jeder Episode die Merkmale im Einbettungsraum linear in einen neuen Raum projiziert, was als schnelle aufgabenbezogene Anpassung dient. Der Trainingsverlust wird anhand eines Distanzmaßes zwischen den Abfrage- und Referenzvektoren im Projektionsraum berechnet. Auf diese Weise werden ausgezeichnete Generalisierungsergebnisse erzielt. Bei Tests auf den Datensätzen Omniglot, miniImageNet und tieredImageNet erhalten wir unter verschiedenen Few-Shot-Szenarien Stand der Technik entsprechende Klassifikationsgenauigkeiten.