HyperAIHyperAI
vor 3 Monaten

Maximierung der offenen Mengen-Wahrscheinlichkeit für Few-Shot-Lernen

Malik Boudiaf, Etienne Bennequin, Myriam Tami, Antoine Toubhans, Pablo Piantanida, Céline Hudelot, Ismail Ben Ayed
Maximierung der offenen Mengen-Wahrscheinlichkeit für Few-Shot-Lernen
Abstract

Wir behandeln das Few-Shot Open-Set Recognition (FSOSR)-Problem, d.h. die Klassifizierung von Instanzen innerhalb einer Menge von Klassen, für die nur wenige beschriftete Beispiele zur Verfügung stehen, gleichzeitig jedoch auch die Erkennung von Instanzen, die keiner bekannten Klasse zuzuordnen sind. Wir untersuchen die gängige transduktive Einstellung, bei der unbeschriftete Abfrage-Instanzen während der Inferenz genutzt werden. Ausgehend von der Beobachtung, dass bestehende transduktive Methoden in Open-Set-Szenarien schlecht abschneiden, schlagen wir eine Verallgemeinerung des Maximum-Likelihood-Prinzips vor, bei der latente Scores eingeführt werden, die den Einfluss potenzieller Ausreißer abschwächen, zusätzlich zu dem üblichen parametrischen Modell. Unsere Formulierung integriert Supervisionsbedingungen aus dem Support-Satz sowie zusätzliche Strafterme, die übermäßige Selbstsicherheit bei Vorhersagen auf dem Query-Satz verhindern. Wir setzen ein Block-Coordinate-Descent-Verfahren ein, bei dem die latente Scores und das parametrische Modell abwechselnd ko-optimiert werden, wodurch sich gegenseitige Vorteile ergeben. Die resultierende Methode nennen wir \textit{Open-Set Likelihood Optimization} (OSLO). OSLO ist interpretierbar und vollständig modular; sie lässt sich nahtlos auf beliebige vortrainierte Modelle anwenden. In umfangreichen Experimenten zeigen wir, dass unsere Methode sowohl bei der Inlier-Klassifizierung als auch bei der Ausreißer-Erkennung – den beiden zentralen Aspekten des Open-Set Recognition – bestehende induktive und transduktive Ansätze übertrifft.