
선명한 객체 탐지는 기초적인 컴퓨터 비전 과제이다. 기존 알고리즘의 대부분은 사전 훈련된 합성곱 신경망의 다중 수준 특징을 집계하는 데 집중하고 있다. 또한 일부 연구자들은 보조 훈련을 위해 윤곽 정보를 활용하려는 시도를 하고 있다. 그러나 기존의 윤곽 인식 모델들은 단방향 프레임워크를 설계하여 윤곽 특징을 사용해 세그멘테이션 특징을 향상시키는 데 그친다. 이에 비해 이 논문에서는 이진 세그멘테이션과 윤곽 지도 사이의 논리적 상호관계를 고려하여, 선명한 객체 탐지를 위한 새로운 스택형 크로스 리파인먼트 네트워크(Staked Cross Refinement Network, SCR N)를 제안한다. 본 프레임워크는 크로스 리파인먼트 유닛(Cross Refinement Unit, CRU)을 스택하여 선명한 객체 탐지와 윤곽 탐지의 다중 수준 특징을 동시에 개선하는 것을 목표로 한다. 논리적 상호관계를 기반으로, CRU는 두 방향에 특화된 통합 연산을 설계하고, 두 작업 간에 양방향으로 메시지를 전달한다. 전처리된 윤곽 보존 특징을 전형적인 U-Net 아키텍처와 결합함으로써, 본 모델은 선명한 객체를 정확하게 탐지할 수 있다. 여섯 개의 벤치마크 데이터셋에서 수행된 광범위한 실험 결과, 본 방법은 정확성과 효율성 측면에서 기존 최첨단 알고리즘을 모두 초월함을 입증하였다. 또한 SOC 데이터셋에서의 속성 기반 성능 평가 결과, 제안된 모델은 다수의 도전적인 시나리오에서 최고 성능을 기록하였다. 코드는 https://github.com/wuzhe71/SCAN 에서 확인할 수 있다.