Few-Shot-Lernen mit Teilerkennung und Erweiterung aus unbeschrifteten Bildern

Few-Shot-Lernen ist eine herausfordernde Aufgabe, da nur wenige Beispiele zur Verfügung stehen, um eine bisher unbekannte Klasse zu erkennen. Ein Ansatz, dieses Problem zu lindern, besteht darin, durch Meta-Lernen auf ähnlichen Aufgaben einen starken induktiven Bias zu erwerben. In dieser Arbeit zeigen wir, dass ein solcher induktiver Bias aus einer flachen Sammlung von nicht annotierten Bildern gelernt werden kann und als übertragbare Repräsentationen zwischen bekannten und unbekannten Klassen instanziiert werden kann. Insbesondere schlagen wir ein neues, teilstückbasiertes selbstüberwachtes Lernschema vor, um übertragbare Repräsentationen durch die Maximierung der Ähnlichkeit eines Bildes zu seinen diskriminierenden Teilen zu lernen. Um das Überfitting in Few-Shot-Klassifikationen aufgrund der Datenknappheit zu reduzieren, schlagen wir außerdem eine Strategie zur Teilaugmentierung vor, indem zusätzliche Bilder aus einem Basissatz abgerufen werden. Wir führen systematische Studien an den Benchmarks miniImageNet und tieredImageNet durch. Bemerkenswerterweise erzielt unsere Methode beeindruckende Ergebnisse und übertreffen die bisher besten unüberwachten Methoden bei den Einstellungen 5-Wege 1-Schuss (5-way 1-shot) und 5-Wege 5-Schuss (5-way 5-shot) um 7,74 % und 9,24 %, was mit den besten überwachten Methoden vergleichbar ist.