
초록
기존의 최첨단 주요 객체 검출 네트워크는 사전 훈련된 합성곱 신경망(CNNs)의 다중 수준 특징을 집계하는 데 의존하고 있습니다. 고수준 특징에 비해 저수준 특징은 성능에 대한 기여도가 낮지만, 더 큰 공간 해상도로 인해 계산 비용이 더 많이 드는 경향이 있습니다. 본 논문에서는 빠르고 정확한 주요 객체 검출을 위한 새로운 단계적 부분 디코더(CPD) 프레임워크를 제안합니다. 한편으로 이 프레임워크는 가속화를 위해 얕은 층의 더 큰 해상도 특징을 버리는 부분 디코더를 구성합니다. 다른 한편으로, 깊은 층의 특징들을 통합하면 상대적으로 정밀한 주목도 맵(saliency map)을 얻을 수 있다는 점을 관찰하였습니다. 따라서 우리는 생성된 주목도 맵을 직접 사용하여 백본 네트워크의 특징을 개선합니다. 이 전략은 효과적으로 방해 요소(distractors)를 억제하고, 특징들의 표현 능력을 크게 향상시킵니다. 5개 벤치마크 데이터셋에서 수행된 실험 결과, 제안된 모델이 기존 모델들보다 뛰어난 성능뿐만 아니라 훨씬 빠른 실행 속도를 보였습니다. 또한, 제안된 프레임워크는 기존의 다중 수준 특징 집계 모델들을 개선하는 데 활용되어 그 효율성과 정확성을 크게 향상시키는 것으로 나타났습니다.