Eine umfassendere Untersuchung des Few-Shot-Lernens über Domänen hinweg

Neuere Fortschritte im Few-Shot-Lernen beruhen weitgehend auf annotierten Daten für Meta-Lernen: Basisklassen werden aus dem gleichen Domänenbereich wie die neuen Klassen entnommen. In vielen Anwendungen ist die Sammlung von Daten für das Meta-Lernen jedoch nicht möglich oder praktikabel. Dies führt zum Problem des cross-domain Few-Shot-Lernens, bei dem eine erhebliche Domänenverschiebung zwischen Basisklassen und neuen Klassen besteht. Obwohl erste Untersuchungen zum cross-domain Few-Shot-Szenario existieren, beschränken sich diese auf natürliche Bilder, die nach wie vor eine hohe visuelle Ähnlichkeit aufweisen. Bisher existiert kein Ansatz, der Few-Shot-Lernen über unterschiedliche Bildaufnahmetechniken im realen Kontext untersucht – beispielsweise zwischen Luftbildern und medizinischen Bildern. In diesem Artikel präsentieren wir den Broader Study of Cross-Domain Few-Shot Learning (BSCD-FSL)-Benchmark, der Bilddaten aus einer vielfältigen Auswahl an Bildaufnahmetechniken umfasst. Dazu gehören natürliche Bilder wie Pflanzenkrankheitsbilder, aber auch solche, die zunehmend von natürlichen Bildern abweichen, wie Satellitenbilder, Dermatologiebilder und Radiologiebilder. Umfassende Experimente auf dem vorgeschlagenen Benchmark dienen der Evaluation von State-of-the-Art-Meta-Lernverfahren, Transfer-Lernansätzen sowie neuer Methoden für das cross-domain Few-Shot-Lernen. Die Ergebnisse zeigen, dass State-of-the-Art-Meta-Lernverfahren überraschenderweise von älteren Meta-Lernansätzen übertroffen werden und alle Meta-Lernmethoden im Vergleich zur einfachen Fine-Tuning-Methode im Durchschnitt um 12,8 Prozentpunkte an Genauigkeit verlieren. Bisher beobachtete Leistungsverbesserungen durch spezialisierte Methoden für das cross-domain Few-Shot-Lernen verschwinden in diesem anspruchsvolleren Benchmark. Schließlich zeigt sich eine signifikante Korrelation zwischen der Genauigkeit aller Methoden und der Ähnlichkeit der Datensätze zu natürlichen Bildern, was die Relevanz des Benchmarks zur besseren Abbildung der Vielfalt realer Daten unterstreicht und zukünftige Forschungsrichtungen leitet.