Camouflageobjekterkennung durch kontextsensible Kreuz-Level-Fusion

Die Erkennung getarnter Objekte (Camouflaged Object Detection, COD) hat das Ziel, Objekte zu identifizieren, die sich in natürlichen Szenen verbergen. Eine genaue COD steht vor einer Reihe von Herausforderungen, die mit geringem Kantenkontrast und der großen Variation von Objektmerkmalen wie Größe und Form verbunden sind. Um diesen Herausforderungen entgegenzutreten, schlagen wir ein neues Kontextbewusstes Kreuz-Level-Fusionsnetzwerk (Context-aware Cross-level Fusion Network, C2F-Net) vor, das kontextsensible Merkmale verschiedener Ebenen für eine präzise Identifikation getarnter Objekte fusioniert.Speziell berechnen wir informative Aufmerksamkeitskoeffizienten aus mehrstufigen Merkmalen mit unserem Aufmerksamkeit-induzierten Kreuz-Level-Fusionsmodul (Attention-induced Cross-level Fusion Module, ACFM), das die Merkmale unter der Anleitung dieser Koeffizienten weiter integriert. Anschließend schlagen wir ein Doppelflanken-Globales-Kontextmodul (Dual-branch Global Context Module, DGCM) vor, um durch die Nutzung reichhaltiger globaler Kontextinformationen die gefusionierten Merkmale zu verfeinern und informative Merkmalsrepräsentationen zu erzeugen. Mehrere ACFMs und DGCMs werden in kaskadierter Weise integriert, um eine grobe Vorhersage auf Basis hochstufiger Merkmale zu generieren. Diese grobe Vorhersage dient als Aufmerksamkeitskarte zur Verfeinerung der niedrigstufigen Merkmale, bevor sie an unser Tarierungsinferenzmodul (Camouflage Inference Module, CIM) übergeben werden, um die endgültige Vorhersage zu erstellen.Wir führen umfangreiche Experimente auf drei weit verbreiteten Benchmark-Datensätzen durch und vergleichen C2F-Net mit den besten aktuellen Modellen (state-of-the-art models). Die Ergebnisse zeigen, dass C2F-Net ein effektives COD-Modell ist und die besten aktuellen Modelle deutlich übertreffen kann. Darüber hinaus demonstriert eine Evaluation auf Polypensegmentierungsdatensätzen das vielversprechende Potenzial unseres C2F-Net in nachgeschalteten Anwendungen des COD. Unser Code ist öffentlich verfügbar unter: https://github.com/Ben57882/C2FNet-TSCVT.