11일 전

BTS-Net: RGB-D 주목할 만한 객체 탐지용 양방향 전이 및 선택 네트워크

Wenbo Zhang, Yao Jiang, Keren Fu, Qijun Zhao
BTS-Net: RGB-D 주목할 만한 객체 탐지용 양방향 전이 및 선택 네트워크
초록

RGB-D 주목할 만한 객체 탐지(SOD)에서 깊이 정보는 유용함이 입증되었다. 그러나 일반적으로 얻어지는 깊이 맵은 품질이 낮고 정확도가 떨어지는 문제가 있다. 기존의 대부분의 RGB-D SOD 모델은 인코더 단계에서 다중 모달 간의 상호작용을 하지 않거나, 깊이에서 RGB로의 단방향 상호작용만을 수행한다. 이는 저품질의 깊이 정보를 처리할 경우 인코더 특징이 정확하지 않게 되는 원인이 될 수 있다. 이러한 한계를 해결하기 위해, 우리는 인코더 단계의 초기 단계부터 점진적인 양방향 상호작용을 수행하는 방식을 제안하며, 새로운 양방향 전이-선택 네트워크(BTS-Net)를 도입한다. BTS-Net은 인코딩 과정 중 특징을 정제하기 위해 일련의 양방향 전이-선택(BTS) 모듈을 채택한다. 이러한 강력한 인코더 특징을 기반으로, 정확한 최종 주목 객체 예측을 달성하기 위한 효율적인 경량 그룹 디코더도 설계하였다. 네트워크는 6개의 대표적인 데이터셋에서 수행된 종합적인 실험을 통해, 네 가지 주요 평가 지표에서 16개의 최신 SOTA(Sota) 방법들을 모두 초과하는 성능을 보였다.

BTS-Net: RGB-D 주목할 만한 객체 탐지용 양방향 전이 및 선택 네트워크 | 최신 연구 논문 | HyperAI초신경