Unüberwachte Few-Shot-Bildklassifikation durch Lernen von Merkmalen im Clustering-Raum

Die meisten Few-Shot-Bildklassifikationsmethoden werden auf der Basis von Aufgaben trainiert. Typischerweise werden diese Aufgaben auf Basis-Klassen mit einer großen Anzahl an gelabelten Bildern aufgebaut, was erheblichen Aufwand erfordert. Unüberwachte Few-Shot-Bildklassifikationsmethoden benötigen hingegen keine gelabelten Bilder, da sie Aufgaben auf unlabeleden Bildern aufbauen. Um Aufgaben effizient auf unlabeleden Bildern zu generieren, schlagen wir eine neuartige einstufige Clustering-Methode vor: Learning Features into Clustering Space (LF2CS). Diese Methode definiert zunächst einen trennbaren Clustering-Raum durch Fixierung der Clustering-Zentren und nutzt anschließend ein lernbares Modell, um Merkmale in diesen Clustering-Raum zu lernen. Auf Basis unserer LF2CS entwickeln wir eine Methode zur Bild-Sampling und zur Aufgabenkonstruktion für c-Wege k-Shot-Aufgaben. Mit dieser Grundlage stellen wir eine neuartige, unüberwachte Few-Shot-Bildklassifikationsmethode vor, die das lernbare Modell, das Clustering sowie die Few-Shot-Bildklassifikation gemeinsam optimiert. Experimente und Visualisierungen zeigen, dass unsere LF2CS eine starke Generalisierungsfähigkeit für neue Kategorien aufweist. Aus Sicht des Bild-Sampling implementieren wir vier Baselines, die sich in der Art und Weise unterscheiden, wie Aufgaben konstruiert werden. Wir führen Experimente auf den Datensätzen Omniglot, miniImageNet, tieredImageNet und CIFARFS durch, jeweils mit den Backbone-Architekturen Conv-4 und ResNet-12. Die experimentellen Ergebnisse belegen, dass unsere Methode die der State-of-the-Art-Methoden übertrifft.