16일 전

RGB-D 색상 객체 탐지를 위한 커스케이드 그래프 신경망

Ao Luo, Xin Li, Fan Yang, Zhicheng Jiao, Hong Cheng, Siwei Lyu
RGB-D 색상 객체 탐지를 위한 커스케이드 그래프 신경망
초록

이 논문에서는 색상 및 깊이 정보를 모두 활용하여 RGB-D 이미지에 대한 주목할 만한 객체 탐지(Salient Object Detection, SOD) 문제를 연구한다. RGB-D 이미지로부터 주목할 만한 객체를 탐지하는 데 있어 주요 기술적 과제는 두 가지 보완적인 데이터 소스를 효과적으로 활용하는 것이다. 기존의 연구들은 일반적으로 RGB 이미지 처리를 위해 깊이 맵에서 사전 지식을 단순히 추출하거나, 색상 정보와 기하학적 정보를 맹목적으로 융합하여 대략적인 깊이 인식 표현을 생성함으로써 RGB-D 색채 탐지 성능을 저해하고 있다. 본 연구에서는 이러한 두 데이터 소스 간의 상호 보완적 이점을 종합적으로 추출하고 추론할 수 있는 통합적 프레임워크인 Cascade Graph Neural Networks(Cas-Gnn)을 제안한다. Cas-Gnn는 두 데이터 소스를 별도로 처리하며, 새로운 Cascade Graph Reasoning(CGR) 모듈을 도입하여 강력한 밀집 특징 임베딩을 학습한다. 이 특징 임베딩은 주목도 맵을 간편하게 추론할 수 있도록 한다. 기존의 접근 방식과 달리, 보완적인 데이터 소스 간의 고차원 관계를 명시적으로 모델링하고 추론함으로써, 가림 현상 및 모호성과 같은 도전 과제를 보다 효과적으로 극복할 수 있다. 광범위한 실험 결과는 Cas-Gnn가 여러 널리 사용되는 벤치마크에서 기존의 모든 RGB-D SOD 기법보다 유의미하게 뛰어난 성능을 달성함을 입증한다.

RGB-D 색상 객체 탐지를 위한 커스케이드 그래프 신경망 | 최신 연구 논문 | HyperAI초신경