문맥 인식 크로스 레벨 융합을 통한 위장 객체 검출

위장 객체 검출(COD)은 자연 환경에서 자신을 숨기는 객체를 식별하는 것을 목표로 합니다. 정확한 COD는 경계 대비가 낮고 객체의 다양한 외관(예: 크기와 형태)으로 인해 여러 도전 과제에 직면해 있습니다. 이러한 문제를 해결하기 위해, 우리는 새로운 맥락 인식 교차 수준 융합 네트워크(Context-aware Cross-level Fusion Network, C2F-Net)를 제안합니다. 이 네트워크는 위장된 객체를 정확히 식별하기 위해 맥락 인식 교차 수준 특성을 융합합니다.특히, 우리는 다수준 특성에서 정보가 풍부한 주의력 계수를 계산하는 주의력 유도 교차 수준 융합 모듈(Attention-induced Cross-level Fusion Module, ACFM)을 설계하였습니다. 이 모듈은 주의력 계수의 지침 하에 특성을 통합합니다. 또한, 풍부한 전역 맥락 정보를 활용하여 융합된 특성을 정보화된 특성 표현으로 세밀하게 조정하는 듀얼 브랜치 전역 맥락 모듈(Dual-branch Global Context Module, DGCM)을 제안하였습니다. 여러 개의 ACFM과 DGCM이 캐스케이드 방식으로 통합되어 고수준 특성에서 대략적인 예측을 생성합니다.대략적인 예측은 주의력 맵 역할을 하여 저수준 특성을 CIM(Camouflage Inference Module)으로 전달하기 전에 세밀하게 조정합니다. 우리는 세 가지 널리 사용되는 벤치마크 데이터셋에서 광범위한 실험을 수행하고 C2F-Net을 최신 기술(SOTA) 모델들과 비교하였습니다. 결과는 C2F-Net이 효과적인 COD 모델이며 SOTA 모델들보다 크게 우월함을 보여주었습니다. 또한, 폴립 분할 데이터셋에서의 평가는 우리의 C2F-Net이 COD 후속 응용 분야에서 큰 잠재력을 가지고 있음을 입증하였습니다.우리의 코드는 공개적으로 이용 가능하며 다음 주소에서 확인할 수 있습니다: https://github.com/Ben57882/C2FNet-TSCVT.