Prototypische Netze für Few-Shot-Lernen

Wir schlagen prototypische Netze für das Problem der Few-Shot-Klassifikation vor, bei dem ein Klassifizierer auf neue Klassen verallgemeinern muss, die im Trainingsdatensatz nicht vorkommen, und dabei nur über eine geringe Anzahl von Beispielen jeder neuen Klasse verfügt. Prototypische Netze lernen einen metrischen Raum, in dem die Klassifikation durch Berechnung der Distanzen zu den prototypischen Darstellungen jeder Klasse durchgeführt werden kann. Im Vergleich zu aktuellen Ansätzen für Few-Shot-Lernen spiegeln sie eine einfachere induktive Bias wider, die in diesem Datensatz mit begrenzten Daten von Vorteil ist, und erzielen ausgezeichnete Ergebnisse. Wir liefern eine Analyse, die zeigt, dass einige einfache Designentscheidungen erhebliche Verbesserungen gegenüber kürzlich veröffentlichten Ansätzen mit komplizierten architektonischen Entscheidungen und Meta-Lernen bringen können. Wir erweitern ferner prototypische Netze auf Zero-Shot-Lernen und erzielen Stand-of-the-Art-Ergebnisse am CU-Birds-Datensatz.