11일 전
정확한 RGB-D 주목할 만한 객체 탐지: 공동 학습을 통한 접근
Wei Ji, Jingjing Li, Miao Zhang, Yongri Piao, Huchuan Lu

초록
심도 이미지에 내장된 공간적 정보를 활용함으로써, 최근 RGB-D 색인성 탐지 기술은 일부 도전적인 시나리오에서 뛰어난 성능을 보이고 있다. 그러나 여전히 두 가지 한계가 존재한다. 하나는 FCN에서 사용되는 풀링 및 업샘플링 연산이 객체 경계를 흐리게 만들 수 있다는 점이고, 다른 하나는 심도 특징을 추출하기 위해 별도의 심도 네트워크를 사용할 경우 계산 및 저장 비용이 증가한다는 점이다. 또한 현재의 RGB-D 모델은 테스트 시 심도 입력에 의존하기 때문에 실제 응용 가능성이 제한된다. 본 논문에서는 엣지, 심도, 색인성 정보를 보다 효율적으로 협업적으로 활용하는 새로운 학습 프레임워크를 제안한다. 이 프레임워크는 명시적으로 추출된 엣지 정보를 색인성 정보와 결합하여 주목할 만한 영역과 객체 경계에 더 큰 주목을 기울인다. 심도와 색인성 학습은 상호 보완적인 방식으로 고수준 특징 학습 과정에 혁신적으로 통합된다. 이러한 전략을 통해 네트워크는 별도의 심도 네트워크나 심도 입력 없이 추론을 수행할 수 있게 되어, 모델이 더욱 가볍고 빠르며 다양한 환경에 유연하게 적용 가능하게 된다. 일곱 개의 벤치마크 데이터셋에서 수행된 실험 결과는 본 모델이 우수한 성능을 발휘함을 보여준다.