11일 전

명암은 명백한 객체 탐지에 반드시 필요한가?

Jiawei Zhao, Yifan Zhao, Jia Li, Xiaowu Chen
명암은 명백한 객체 탐지에 반드시 필요한가?
초록

주목할 만한 객체 탐지(Salient Object Detection, SOD)는 여러 컴퓨터 비전 응용 분야에서 핵심적이고 전처리적인 역할을 하며, 깊은 신경망(CNN)의 발전으로 인해 상당한 진전을 이루었다. 기존 대부분의 방법은 주로 RGB 정보에 의존하여 주목할 만한 객체를 구분하나, 복잡한 환경에서는 한계에 부딪힌다. 이를 해결하기 위해 최근에는 깊이 맵(depth map)을 독립적인 입력으로 채택하고 RGB 정보와 특징을 융합하는 RGBD 기반의 네트워크들이 제안되고 있다. RGB와 RGBD 방법의 장점을 결합하여, 본 연구에서는 새로운 깊이 인지형 주목할 만한 객체 탐지 프레임워크를 제안한다. 제안된 프레임워크는 다음과 같은 우수한 설계를 갖추고 있다: 1) 학습 단계에서는 깊이 정보만을 사용하지만, 테스트 단계에서는 오직 RGB 정보에 의존한다. 2) 다수준의 깊이 인지형 정규화를 통해 SOD 특징을 종합적으로 최적화한다. 3) 깊이 정보는 오류 가중 맵으로도 활용되어 세그멘테이션 과정을 보정한다. 이러한 통찰력 있는 설계를 통합함으로써, 추론 시 오직 RGB 정보만을 입력으로 사용하는 통합형 깊이 인지 프레임워크를 최초로 구현하였다. 이는 다섯 개의 공개된 RGB SOD 벤치마크에서 최첨단 성능을 초월할 뿐만 아니라, 깊이 정보를 포함하는 RGBD 기반 방법들 또한 다섯 개의 벤치마크에서 크게 앞서는 성능을 기록하였다. 또한, 사용 정보량이 적고 구현이 경량화된 점에서 뛰어난 효율성을 갖추고 있다. 코드와 모델은 공개될 예정이다.

명암은 명백한 객체 탐지에 반드시 필요한가? | 최신 연구 논문 | HyperAI초신경