11일 전

RGB-D 색상 객체 탐지용 양방향 주의망

Zhao Zhang, Zheng Lin, Jun Xu, Wenda Jin, Shao-Ping Lu, Deng-Ping Fan
RGB-D 색상 객체 탐지용 양방향 주의망
초록

기존의 RGB-D 선명 객체 탐지(SOD) 방법들은 깊이 이미지를 활용할 때 주로 전경 영역에 초점을 맞추고 있다. 그러나 기존의 SOD 방법에서 배경 영역 역시 우수한 성능을 달성하기 위해 중요한 정보를 제공한다. 전경과 배경 영역 모두에서 선명한 정보를 더 효과적으로 탐색하기 위해, 본 논문에서는 RGB-D SOD 작업을 위한 이중 주의망(BiANet)을 제안한다. 구체적으로, 전경 우선(FF) 주의와 배경 우선(BF) 주의를 결합한 상호보완적 주의 메커니즘을 갖춘 이중 주의 모듈(BAM)을 도입한다. FF 주의는 점진적인 정제 방식으로 전경 영역에 집중하는 반면, BF 주의는 배경 영역 내에서 유용할 수 있는 선명한 정보를 복원하는 데 초점을 맞춘다. 제안된 BAM 모듈의 이점을 활용함으로써, BiANet은 더 의미 있는 전경 및 배경 신호를 포착할 수 있으며, 전경과 배경 영역 간의 불확실한 세부 정보를 보다 정교하게 보정하는 데 더 많은 주의를 기울일 수 있다. 또한, 다중 해상도 기법을 활용하여 BAM 모듈을 확장함으로써 더욱 우수한 SOD 성능을 달성하였다. 여섯 개의 기준 데이터셋에서 실시한 광범위한 실험 결과, BiANet은 주관적 시각적 비교 및 객관적 평가 지표 모두에서 기존 최첨단 RGB-D SOD 방법들을 능가함을 입증하였다. NVIDIA GeForce RTX 2080Ti GPU를 사용할 경우, BiANet은 $224\times224$ 크기의 RGB-D 이미지에서 최대 80fps의 실시간 처리 속도를 달성할 수 있다. 또한 포괄적인 제거 실험을 통해 본 연구의 기여도가 효과적으로 검증되었다.

RGB-D 색상 객체 탐지용 양방향 주의망 | 최신 연구 논문 | HyperAI초신경