HyperAIHyperAI
vor 17 Tagen

Constellation Nets für Few-Shot-Lernen

{Zhuowen Tu, Huaijin Wang, Yifan Xu, Weijian Xu}
Constellation Nets für Few-Shot-Lernen
Abstract

Der Erfolg tiefer konvolutioneller neuronalen Netze beruht auf der Lernfähigkeit effektiver Konvolutionen, die über Filterung, Aktivierung und Pooling eine Hierarchie strukturierter Merkmale erfassen. Allerdings sind explizit strukturierte Merkmale, wie beispielsweise Objektteile, in den bestehenden CNN-Architekturen nicht ausreichend ausdrucksstark. In diesem Artikel behandeln wir das Few-Shot-Lernproblem und setzen uns dafür ein, strukturierte Merkmale durch die Erweiterung von CNNs mit einem Sternbildmodell (constellation model) zu verbessern. Dieses Modell führt eine Clustering- und Kodierung von Zellenmerkmalen mit einer dichten Teilrepräsentation durch; die Beziehungen zwischen den Zellenmerkmalen werden anschließend durch eine Aufmerksamkeitsmechanik modelliert. Durch den zusätzlichen Sternbildzweig, der die Aufmerksamkeit auf Objektteile erhöht, kann unsere Methode die Vorteile von CNNs nutzen, während gleichzeitig die gesamte interne Repräsentation im Few-Shot-Lernsetting robuster wird. Unser Ansatz erreicht eine signifikante Verbesserung gegenüber bestehenden Methoden im Few-Shot-Lernansatz auf den Benchmarks CIFAR-FS, FC100 und mini-ImageNet.