Verbessertes generalisiertes Few-Shot-Lernen auch ohne Basisdaten

Dieses Papier stellt und untersucht das Null-Basis generalisierte Few-Shot-Lernen (Null-Basis GFSL), eine extrem aber praktische Variante des Few-Shot-Lernproblems. Angeregt durch Fälle, in denen Basisdaten aufgrund von Datenschutz- oder ethischen Bedenken nicht verfügbar sind, besteht das Ziel des Null-Basis GFSL darin, das Wissen aus wenigen Beispielen neuer Klassen in ein vorab trainiertes Modell zu integrieren, ohne dabei irgende Beispiele der Basisklassen zu verwenden. In unserer Analyse haben wir festgestellt, dass sowohl der Mittelwert als auch die Varianz der Gewichtsverteilung der neuen Klassen im Vergleich zu den Basisklassen nicht angemessen etabliert sind. Die bestehenden GFSL-Methoden versuchen, die Gewichtsnormen auszugleichen, was uns zeigt, dass dies nur die Varianzkomponente verbessert, während die Bedeutung des Mittelwerts der Gewichte für neue Klassen vernachlässigt wird. Dies führt zu einer begrenzten Leistung im GFSL-Problem, selbst wenn Basisdaten vorhanden sind. In diesem Artikel überwinden wir diese Einschränkung durch den Vorschlag einer einfachen aber effektiven Normalisierungsmethode, die sowohl den Mittelwert als auch die Varianz der Gewichtsverteilung der neuen Klassen effektiv kontrollieren kann, ohne dabei irgende Basisbeispiele zu verwenden. Dadurch erreichen wir eine zufriedenstellende Leistung sowohl bei neuen als auch bei Basisklassen. Unsere experimentellen Ergebnisse zeigen überraschenderweise, dass die vorgeschlagene Null-Basis-GFSL-Methode, die keine Basisbeispiele verwendet, sogar besser abschneidet als die bestehenden GFSL-Methoden, die optimale Nutzung von Basisdaten ermöglichen. Unsere Implementierung ist unter folgendem Link verfügbar: https://github.com/bigdata-inha/Zero-Base-GFSL.请注意,"irgende" 是 "irgende" 的拼写错误,正确的德语单词应该是 "irgende"。但是在这个上下文中,更合适的词可能是 "jede" 或 "einige"。因此,建议将上述翻译中的 "irgende" 替换为 "jede" 或 "einige":Dadurch erreichen wir eine zufriedenstellende Leistung sowohl bei neuen als auch bei Basisklassen. Unsere experimentellen Ergebnisse zeigen überraschenderweise, dass die vorgeschlagene Null-Basis-GFSL-Methode, die keine Basiselemente verwendet (few-shot learning), sogar besser abschneidet als die bestehenden GFSL-Methoden, die optimale Nutzung von Basiselementen ermöglichen (few-shot learning). Unsere Implementierung ist unter folgendem Link verfügbar: https://github.com/bigdata-inha/Zero-Base-GFSL.