Geometrisches Mittel verbessert den Verlust für Few-Shot-Lernen

Few-Shot-Lernen (FSL) ist eine herausfordernde Aufgabe im Maschinenlernen, die von einem Modell verlangt, durch die Verwendung nur weniger annotierter Beispiele diskriminative Klassifikationen zu erzeugen. In der Literatur zum FSL werden tiefe Modelle in Form von Metrik-Lernen trainiert, um eine Metrik im Merkmalsraum bereitzustellen, die gut generalisierbar ist, um Beispiele neuer Klassen zu klassifizieren; in diesem Raum können sogar wenige annotierte Trainingsbeispiele einen effektiven Klassifikator aufbauen. In dieser Arbeit schlagen wir einen neuen FSL-Verlust vor, der auf dem \emph{geometrischen Mittel} basiert, um eine diskriminative Metrik in tiefen Merkmalen einzubetten. Im Gegensatz zu anderen Verlustfunktionen wie derjenigen, die das arithmetische Mittel in softmax-basierten Formulierungen nutzt, verwendet die vorgeschlagene Methode das geometrische Mittel zur Aggregation paarweiser Beziehungen zwischen den Beispielen, um die diskriminative Metrik über Klassenkategorien hinweg zu verbessern. Der vorgeschlagene Verlust wird nicht nur in einfacher Form formuliert, sondern auch gründlich theoretisch analysiert, um seine vorteilhaften Eigenschaften aufzudecken, die für das Lernen von Merkmalsmetriken im FSL günstig sind. In Experimenten zu Few-Shot-Bildklassifikationsaufgaben erzielt die Methode vergleichbare Leistungen gegenüber anderen Verlustfunktionen.