2달 전

문맥 인식 크로스 레벨 융합을 통한 위장 객체 검출

Chen, Geng ; Liu, Si-Jie ; Sun, Yu-Jia ; Ji, Ge-Peng ; Wu, Ya-Feng ; Zhou, Tao
문맥 인식 크로스 레벨 융합을 통한 위장 객체 검출
초록

위장 객체 검출(COD)은 자연 환경에서 자신을 숨기는 객체를 식별하는 것을 목표로 합니다. 정확한 COD는 경계 대비가 낮고 객체의 다양한 외관(예: 크기와 형태)으로 인해 여러 도전 과제에 직면해 있습니다. 이러한 문제를 해결하기 위해, 우리는 새로운 맥락 인식 교차 수준 융합 네트워크(Context-aware Cross-level Fusion Network, C2F-Net)를 제안합니다. 이 네트워크는 위장된 객체를 정확히 식별하기 위해 맥락 인식 교차 수준 특성을 융합합니다.특히, 우리는 다수준 특성에서 정보가 풍부한 주의력 계수를 계산하는 주의력 유도 교차 수준 융합 모듈(Attention-induced Cross-level Fusion Module, ACFM)을 설계하였습니다. 이 모듈은 주의력 계수의 지침 하에 특성을 통합합니다. 또한, 풍부한 전역 맥락 정보를 활용하여 융합된 특성을 정보화된 특성 표현으로 세밀하게 조정하는 듀얼 브랜치 전역 맥락 모듈(Dual-branch Global Context Module, DGCM)을 제안하였습니다. 여러 개의 ACFM과 DGCM이 캐스케이드 방식으로 통합되어 고수준 특성에서 대략적인 예측을 생성합니다.대략적인 예측은 주의력 맵 역할을 하여 저수준 특성을 CIM(Camouflage Inference Module)으로 전달하기 전에 세밀하게 조정합니다. 우리는 세 가지 널리 사용되는 벤치마크 데이터셋에서 광범위한 실험을 수행하고 C2F-Net을 최신 기술(SOTA) 모델들과 비교하였습니다. 결과는 C2F-Net이 효과적인 COD 모델이며 SOTA 모델들보다 크게 우월함을 보여주었습니다. 또한, 폴립 분할 데이터셋에서의 평가는 우리의 C2F-Net이 COD 후속 응용 분야에서 큰 잠재력을 가지고 있음을 입증하였습니다.우리의 코드는 공개적으로 이용 가능하며 다음 주소에서 확인할 수 있습니다: https://github.com/Ben57882/C2FNet-TSCVT.

문맥 인식 크로스 레벨 융합을 통한 위장 객체 검출 | 최신 연구 논문 | HyperAI초신경