Réseau de fusion inter-niveaux contextuel pour la détection d'objets camouflés

La détection d'objets camouflés (COD) est une tâche complexe en raison du faible contraste de contours entre l'objet et son environnement. De plus, l'apparence des objets camouflés varie considérablement, par exemple en termes de taille et de forme, ce qui aggrave les difficultés d'une détection précise. Dans cet article, nous proposons un nouveau réseau de fusion inter-niveaux contextualisé (C2F-Net) pour répondre au défi que représente la tâche COD. Plus précisément, nous introduisons un module de fusion inter-niveaux induit par l'attention (ACFM) afin d'intégrer les caractéristiques multi-niveaux avec des coefficients d'attention informatifs. Les caractéristiques fusionnées sont ensuite transmises au module de contexte global à double branche (DGCM) proposé, qui génère des représentations de caractéristiques multi-échelles pour exploiter des informations contextuelles globales riches. Dans le C2F-Net, ces deux modules sont appliqués aux caractéristiques de haut niveau selon une méthode en cascade. Des expériences approfondies sur trois jeux de données de référence largement utilisés montrent que notre C2F-Net est un modèle COD efficace et surpassent remarquablement les modèles les plus avancés actuellement disponibles. Notre code est librement accessible à l'adresse suivante : https://github.com/thograce/C2FNet.