Graphbasierte Interpolation von Merkmalsvektoren für präzise Few-Shot-Klassifikation

Bei der Few-Shot-Klassifikation geht es darum, Modelle zu entwickeln, die in der Lage sind, Klassen anhand nur einer geringen Anzahl an gelabelten Beispielen zu unterscheiden. In diesem Kontext haben verschiedene Arbeiten Graph Neural Networks (GNNs) vorgeschlagen, die darauf abzielen, die in anderen gleichzeitig betrachteten Proben enthaltene Information auszunutzen – ein Ansatz, der in der Literatur allgemein als transduktiver Lernansatz bezeichnet wird. Diese GNNs werden gemeinsam mit einem Backbone-Feature-Extractor trainiert. In diesem Artikel stellen wir eine neue Methode vor, die ausschließlich auf Graphen basiert, um Feature-Vektoren zu interpolieren, wodurch ein transduktiver Lernansatz ohne zusätzliche zu trainierende Parameter entsteht. Unser vorgeschlagener Ansatz nutzt somit zwei Ebenen von Information: a) übertragbare Features, die auf generischen Datensätzen erzielt wurden, sowie b) transduktive Informationen, die aus anderen zu klassifizierenden Proben gewonnen werden. Anhand standardisierter Few-Shot-Vision-Klassifikationsdatensätze zeigen wir, dass unsere Methode im Vergleich zu anderen Ansätzen signifikante Verbesserungen erzielt.