FECANet: Steigerung der Few-Shot-Semantischen Segmentierung durch ein featureverstärktes kontextbewusstes Netzwerk

Few-shot semantische Segmentierung ist die Aufgabe, jedes Pixel der neuen Kategorie in einem Abfragebild nur anhand einiger annotierter Unterstützungsbilder zu lokalisieren. Aktuelle korrelationsbasierte Methoden konstruieren paarweise Merkmalskorrelationen, um eine Viel-zu-Viel-Zuordnung herzustellen, da herkömmliche prototypenbasierte Ansätze keine feinabgestimmten Korrespondenzbeziehungen lernen können. Dennoch leiden bestehende Methoden weiterhin an Rauschen in den einfachen Korrelationen sowie an dem Mangel an kontextueller semantischer Information innerhalb der Korrelationen. Um diese Probleme zu mindern, schlagen wir ein Feature-Enhanced Context-Aware Network (FECANet) vor. Konkret wird ein Merkmalsverbesserungsmodul eingeführt, das das durch interklassliche lokale Ähnlichkeit verursachte Zuordnungsrauschen unterdrückt und die intraklassische Relevanz in den ursprünglichen Korrelationen verstärkt. Darüber hinaus stellen wir ein neuartiges Korrelationsrekonstruktionsmodul vor, das zusätzliche Korrespondenzbeziehungen zwischen Vordergrund und Hintergrund sowie mehrskalige kontextuelle semantische Merkmale kodiert und die Fähigkeit des Encoders erheblich verbessert, zuverlässige Zuordnungsmuster zu erfassen. Experimente auf den Datensätzen PASCAL-$5^i$ und COCO-$20^i$ zeigen, dass unser vorgeschlagenes FECANet im Vergleich zu vorherigen State-of-the-Art-Methoden eine bemerkenswerte Verbesserung erzielt und somit seine Wirksamkeit belegt.