11일 전
RGB-D 색상 객체 탐지를 위한 분기형 백본 전략
Yingjie Zhai, Deng-Ping Fan, Jufeng Yang, Ali Borji, Ling Shao, Junwei Han, Liang Wang

초록
다중 수준 특징 융합은 컴퓨터 비전 분야에서 핵심적인 주제로, 다양한 척도에서 객체 탐지, 분할 및 분류에 활용되어 왔다. 다중 수준 특징이 다중 모달 정보와 결합될 때, 최적의 특징 집계 및 다중 모달 학습 전략이 여전히 해결해야 할 난제로 남아 있다. 본 논문에서는 RGB-D 선명한 객체 탐지의 고유한 다중 모달성과 다중 수준 특징 구조를 활용하여, 새로운 계단식 정밀화 네트워크를 제안한다. 구체적으로, 먼저 이중 분기형 백본 전략(BBS)을 통해 다중 수준 특징을 교사 특징과 학습자 특징으로 재구성하는 방안을 제안한다. 다음으로, 채널 및 공간적 관점에서 정보성 있는 깊이 정보를 효과적으로 탐색하기 위해 깊이 강화 모듈(DEM)을 도입한다. 이후 RGB와 깊이 모달 간의 융합을 보완적 방식으로 수행한다. 제안한 아키텍처인 이중 분기형 백본 전략 네트워크(BBS-Net)는 간단하고 효율적이며 백본 네트워크에 종속되지 않다. 광범위한 실험을 통해 BBS-Net은 다섯 가지 평가 지표를 기준으로 여덟 개의 도전적인 데이터셋에서 18개의 최신 기술(SOTA) 모델을 상회하며, 제안된 접근법의 우수성을 입증한다(최고 성능 모델인 DMRA-iccv2019 대비 S-측도에서 약 4%의 개선). 또한, 다양한 RGB-D 데이터셋의 일반화 능력에 대한 체계적인 분석을 제공하며, 향후 연구를 위한 강력한 학습 데이터셋을 제시한다.