HyperAIHyperAI
vor 2 Monaten

Die erneute Betrachtung des unüberwachten Meta-Learnings durch die Charakteristika von Few-Shot-Aufgaben

Han-Jia Ye; Lu Han; De-Chuan Zhan
Die erneute Betrachtung des unüberwachten Meta-Learnings durch die Charakteristika von Few-Shot-Aufgaben
Abstract

Meta-Lernen ist zu einem praktischen Ansatz für die Few-Shot-Bildklassifizierung geworden, bei dem eine „Strategie zum Lernen eines Klassifikators“ auf etikettierten Basisklassen meta-gelernt wird und auf Aufgaben mit neuen Klassen angewendet werden kann. Wir eliminieren die Notwendigkeit von Etiketten für Basisklassen und lernen verallgemeinerbare Einbettungen durch Unsupervised Meta-Learning (UML). Insbesondere werden während des Meta-Trainings Episoden von Aufgaben mit Datenverstärkungen aus unetikettierten Basisklassen konstruiert, und wir wenden einbettungsbasierte Klassifikatoren auf neue Aufgaben mit wenigen etikettierten Beispielen während des Meta-Tests an. Wir beobachten, dass zwei Elemente in UML wichtige Rollen spielen, nämlich die Art der Aufgabenauswahl und die Messung der Ähnlichkeiten zwischen Instanzen. Daher erhalten wir eine starke Baseline durch zwei einfache Modifikationen – eine ausreichende Auswahlstategie, die effizient mehrere Aufgaben pro Episode konstruiert, zusammen mit einer halbnormalisierten Ähnlichkeit. Anschließend nutzen wir die Eigenschaften der Aufgaben in zwei Richtungen, um weitere Verbesserungen zu erzielen. Erstens werden synthetische verwirrende Instanzen integriert, um das Extrahieren diskriminierender Einbettungen zu unterstützen. Zweitens verwenden wir während des Meta-Trainings eine zusätzliche aufgabenbezogene Einbettungstransformation als Hilfskomponente, um die Verallgemeinerungsfähigkeit der vorgeformten Einbettungen zu fördern. Experimente an Few-Shot-Lernbenchmarks bestätigen, dass unsere Ansätze frühere UML-Methoden übertrumpfen und vergleichbare oder sogar bessere Leistungen als ihre überwachten Varianten erzielen.

Die erneute Betrachtung des unüberwachten Meta-Learnings durch die Charakteristika von Few-Shot-Aufgaben | Neueste Forschungsarbeiten | HyperAI