Schnelle Tarnobjekterkennung durch kantenbasiertes reversibles Rekalibrierungsnetzwerk

Die Erkennung getarnter Objekte (Camouflaged Object Detection, COD) hat das Ziel, Objekte zu erkennen, die ähnliche Muster (z.B. Textur, Intensität, Farbe usw.) wie ihre Umgebung aufweisen, und hat in letzter Zeit zunehmendes Forschungsinteresse geweckt. Da getarnte Objekte oft sehr unscharfe Grenzen aufweisen, stellt die Bestimmung der Objektstandorte sowie ihrer schwachen Konturen eine Herausforderung dar und ist gleichzeitig der Schlüssel zu dieser Aufgabe. Inspiriert durch den biologischen Sehwahrnehmungsprozess beim Entdecken von getarnten Objekten durch einen menschlichen Beobachter, schlägt dieser Artikel ein neuartiges kantenbasiertes reversibles Neukalibrierungsnetzwerk vor, das ERRNet genannt wird. Unser Modell zeichnet sich durch zwei innovative Designmerkmale aus: Selektive Kantenassemblierung (Selective Edge Aggregation, SEA) und reversibles Neukalibrierungsmodul (Reversible Re-calibration Unit, RRU). Diese Merkmale zielen darauf ab, das visuelle Wahrnehmungsverhalten zu modellieren und effektive Kanteninformationen sowie Vergleiche zwischen potenziellen getarnten Bereichen und dem Hintergrund zu ermöglichen. Von besonderer Bedeutung ist dabei, dass das RRU verschiedene Priorinformationen mit umfassenderen Informationen integriert im Vergleich zu bestehenden COD-Modellen. Experimentelle Ergebnisse zeigen, dass ERRNet drei COD-Datensätze und fünf medizinische Bildsegmentierungsdatensätze gegenüber bestehenden state-of-the-art-Baselines überlegen ist. Insbesondere verbessert ERRNet im Vergleich zum bisher besten Modell SINet die Leistung um etwa 6 % (mittleres E-Maß) bei erheblich höherer Geschwindigkeit (79,3 FPS), was darauf hinweist, dass ERRNet eine allgemeine und robuste Lösung für die COD-Aufgabe sein könnte.