12일 전

비대칭 이중 스트림 아키텍처를 통한 정확한 RGB-D 샐런시 탐지

{Jie Liu, Yongri Piao, Miao Zhang, Huchuan Lu, Sun Xiao Fei, Shuang Xu}
비대칭 이중 스트림 아키텍처를 통한 정확한 RGB-D 샐런시 탐지
초록

기존의 RGB-D 색인성 탐지 방법들은 구분 가능한 RGB 및 깊이 표현을 학습하기 위해 대칭적인 이중 스트림 아키텍처를 주로 채택하고 있다. 그러나 이와 더불어 자주 간과되는 또 다른 차원의 모호성이 존재한다. 즉, RGB와 깊이 데이터가 동일한 네트워크에 적합해야 하는지 여부이다. 본 논문에서는 RGB와 깊이 데이터 간 내재된 차이를 고려한 비대칭 이중 스트림 아키텍처를 제안한다. 먼저, RGB 스트림에 대해 전역적이고 국소적인 정보를 충분히 추출하면서도 색인성 세부 정보를 유지할 수 있도록 흐름 사다리 모듈(Flow Ladder Module, FLM)을 설계하였다. 이는 네 개의 세부 정보 전이 브랜치를 구성함으로써 달성되며, 각 브랜치는 세부 정보를 보존하면서 수직적으로 병렬로 구성된 다른 브랜치의 표현으로부터 전역적인 위치 정보를 진화적인 방식으로 수신한다. 둘째, 도전적인 환경에서 RGB 특징과 결합될 때 깊이 특징이 위치 및 공간 구조 측면에서 높은 구분 능력을 가지도록 효과적으로 활용할 수 있도록 새로운 깊이 주의 모듈(Deep Attention Module, DAM)을 제안한다. 또한 본 DAM을 통해 깊이 특징은 RGB 특징을 정밀하게 지도하여 색인성 객체의 위치를 정확히 파악할 수 있도록 한다. 광범위한 실험을 통해 제안한 방법이 7개 데이터셋에서 13개 최첨단 RGB-D 접근법보다 우수한 성능을 달성함을 입증하였다. 본 논문의 코드는 공개될 예정이다.

비대칭 이중 스트림 아키텍처를 통한 정확한 RGB-D 샐런시 탐지 | 최신 연구 논문 | HyperAI초신경