MSI: Maximierung der Informationsmenge des Support-Sets für Few-Shot-Segmentierung

Few-Shot-Segmentation (FSS) zielt darauf ab, eine Zielklasse mit einer geringen Anzahl an beschrifteten Bildern (Support-Set) zu segmentieren. Um informationsrelevante Merkmale der Zielklasse zu extrahieren, entfernen beste leistungsstarke FSS-Methoden im Allgemeinen Hintergrundmerkmale mittels eines Support-Masks. Wir beobachten, dass diese Merkmalsauslöschung durch eine beschränkende Support-Maske in mehreren anspruchsvollen FSS-Szenarien – beispielsweise bei kleinen Objekten und/oder ungenauen Objekträndern – eine Informationsbremse verursacht. Um dies zu überwinden, präsentieren wir eine neuartige Methode (MSI), die die Information im Support-Set maximiert, indem zwei ergänzende Quellen von Merkmalen genutzt werden, um superkorrelierte Karten zu generieren. Die Wirksamkeit unseres Ansatzes wird durch die Implementierung in drei aktuelle und leistungsstarke FSS-Methoden validiert. Experimentelle Ergebnisse auf mehreren öffentlich verfügbaren FSS-Benchmarks zeigen, dass unsere Methode konsistent eine sichtbare Leistungssteigerung erzielt und eine schnellere Konvergenz ermöglicht. Unser Code und die trainierten Modelle sind unter folgender Adresse verfügbar: https://github.com/moonsh/MSI-Maximize-Support-Set-Information