11일 전

DPANet: RGB-D 색맹 객체 탐지를 위한 깊이 가능성 인지 게이트형 어텐션 네트워크

Zuyao Chen, Runmin Cong, Qianqian Xu, Qingming Huang
DPANet: RGB-D 색맹 객체 탐지를 위한 깊이 가능성 인지 게이트형 어텐션 네트워크
초록

RGB-D 주목할 만한 객체 탐지에서 두 가지 주요한 문제점이 존재한다: (1) 교차 모달 데이터인 RGB-D 데이터 간의 보완성을 효과적으로 통합하는 방법; (2) 신뢰할 수 없는 깊이 맵으로 인한 오염 효과를 방지하는 방법이다. 실제로 이 두 문제는 서로 연결되어 있으며, 복합적으로 작용하지만, 기존의 방법들은 주로 첫 번째 문제에만 초점을 맞추고 깊이 맵의 품질을 고려하지 않아 모델이 부분 최적 상태에 빠질 수 있다는 점을 간과하고 있다. 본 논문에서는 이러한 두 문제를 통합적인 모델 체계를 통해 함께 해결하고, 깊이 맵의 잠재력을 명시적으로 모델링하며 교차 모달 보완성을 효과적으로 통합할 수 있는 새로운 네트워크인 DPANet을 제안한다. 깊이 잠재성 인지(depth potentiality perception)를 도입함으로써, 네트워크는 학습 기반 방식으로 깊이 정보의 잠재력을 인지하고, 두 모달 데이터의 융합 과정을 안내하여 오염 현상을 방지할 수 있다. 융합 과정에 포함된 게이트 다모달 주의 메커니즘(gated multi-modality attention module)은 게이트 컨트롤러를 갖춘 주의 메커니즘을 활용하여 교차 모달 관점에서 장거리 의존성을 효과적으로 포착한다. 제안된 방법을 8개 데이터셋에서 15개 최첨단 기법과 비교한 실험 결과는 제안 방법이 정량적·정성적으로 모두 타당함을 입증한다.

DPANet: RGB-D 색맹 객체 탐지를 위한 깊이 가능성 인지 게이트형 어텐션 네트워크 | 최신 연구 논문 | HyperAI초신경