
초록
현재의 대부분의 주요 객체 검출 접근 방식은 더 정확한 예측을 생성하기 위해 큰 백본을 가진 깊은 네트워크를 사용하는데, 이는 계산 복잡도의 상당한 증가를 초래합니다. 많은 네트워크 설계들이 특징 추출 및 집합 능력이 제한적인 순수 UNet과 Feature Pyramid Network (FPN) 구조를 따르고 있어, 이를 개선하기 위해 표준 FPN 또는 U-Net 프레임워크의 특징 표현을 강화하는 경량 후 디코더 정제 모듈인 교차 후 디코더 정제(CPDR)를 설계하였습니다. 구체적으로, 고차원 표현으로 생성된 주의 맵을 활용하여 저차원 특징을 정제하는 Attention Down Sample Fusion (ADF)와 공간적 주의를 통해 저차원 정보를 이용해 고차원 특징을 안내하는 Attention Up Sample Fusion (AUF)를 도입하였습니다. 또한, ADF와 AUF 기반으로 Dual Attention Cross Fusion (DACF)를 제안하였는데, 이는 매개변수 수를 줄이면서 성능을 유지할 수 있도록 설계되었습니다. 다섯 개의 벤치마크 데이터셋에서 수행된 실험 결과, 우리의 방법이 이전 최신 연구보다 우수함을 입증하였습니다.