Ein Baseline für Few-Shot-Bildklassifikation

Die Feinabstimmung eines tiefen Netzwerks, das mit dem herkömmlichen Kreuzentropieverlust trainiert wurde, stellt eine starke Baseline für Few-Shot-Lernen dar. Wenn diese Feinabstimmung transduktiv durchgeführt wird, übertrifft sie auf Standarddatensätzen wie Mini-ImageNet, Tiered-ImageNet, CIFAR-FS und FC-100 die derzeitige State-of-the-Art-Methode, selbst bei Verwendung identischer Hyperparameter. Die Einfachheit dieses Ansatzes ermöglicht es uns, erstmals Few-Shot-Lernergebnisse auf dem ImageNet-21k-Datensatz zu demonstrieren. Wir beobachten, dass eine große Anzahl von Meta-Trainingsklassen bereits zu hohen Few-Shot-Accuracies führt, selbst wenn eine große Anzahl von Few-Shot-Klassen betrachtet wird. Wir befürworten unseren Ansatz nicht als Lösung für das Few-Shot-Lernen, sondern nutzen die Ergebnisse lediglich, um die Grenzen der aktuellen Benchmarks und Few-Shot-Protokolle aufzuzeigen. Durch umfassende Studien auf Benchmark-Datensätzen schlagen wir eine Metrik vor, die die „Schwierigkeit“ eines Few-Shot-Episoden quantifiziert. Diese Metrik kann genutzt werden, um die Leistung von Few-Shot-Algorithmen systematischer zu berichten.