HM: Hybrid Masking für Few-Shot-Segmentation

Wir untersuchen das Few-Shot-Semantische Segmentieren, das darauf abzielt, ein Zielobjekt aus einem Abfragebild zu segmentieren, wenn wenige annotierte Unterstützungsabbildungen der Zielklasse bereitgestellt werden. Mehrere neuere Methoden setzen auf eine Feature-Masking-(FM)-Technik zurück, um irrelevante Merkmalsaktivierungen zu unterdrücken, was letztlich eine zuverlässige Vorhersage der Segmentierungsmaske ermöglicht. Ein grundlegender Nachteil von FM liegt in der Unfähigkeit, feinkörnige räumliche Details zu bewahren, die insbesondere bei kleinen Zielobjekten die Genauigkeit der Segmentierungsmaske beeinflussen. In diesem Paper entwickeln wir einen einfachen, wirksamen und effizienten Ansatz zur Verbesserung des Feature-Masking (FM). Wir bezeichnen das verbesserte FM als Hybrid-Masking (HM). Konkret kompensieren wir den Verlust feinkörniger räumlicher Details in der FM-Technik, indem wir eine ergänzende grundlegende Eingabemaskierungsmethode untersuchen und ausnutzen. Experimente wurden auf drei öffentlich verfügbaren Benchmarks mit starken Few-Shot-Segmentierung (FSS)-Baselines durchgeführt. Wir zeigen empirisch eine verbesserte Leistung gegenüber den derzeitigen State-of-the-Art-Methoden mit deutlichen Vorteilen über verschiedene Benchmarks hinweg. Unser Code und die trainierten Modelle sind verfügbar unter: https://github.com/moonsh/HM-Hybrid-Masking