2달 전

RGB-D 주요 객체 검출을 위한 일반적인 타겟 인식

Yifan Zhao; Jiawei Zhao; Jia Li; Xiaowu Chen
RGB-D 주요 객체 검출을 위한 일반적인 타겟 인식
초록

기존의 RGB-D 주요 객체 검출 방법은 깊이 정보를 보완적인 정보로 활용하여 두 모달에서 주요 영역을 찾는 것을 목표로 합니다. 그러나, 주요 객체 검출 결과는 종종 사용할 수 없는 경우가 있는 캡처된 깊이 데이터의 품질에 크게 의존합니다. 본 연구에서는 새로운 깊이 인식 프레임워크를 통해 RGB-D 주요 객체 검출 문제를 해결하기 위한 첫 시도를 합니다. 이 프레임워크는 테스트 단계에서는 RGB 데이터만을 이용하며, 캡처된 깊이 데이터를 표현 학습을 위한 감독으로 활용합니다.우리의 프레임워크 구축 및 정확한 주요 영역 검출 결과 달성을 위해, RGB-D SOD 작업에서 세 가지 중요한 과제를 해결하기 위한 유비쿼터스 타겟 인식(UTA) 네트워크를 제안합니다: 1) 적응형 깊이 오류 가중치를 통해 깊이 정보를 발굴하고 애매한 영역을 추출하는 깊이 인식 모듈, 2) 공간 인식 크로스모달 상호작용과 채널 인식 크로스레벨 상호작용, 저수준 경계 큐를 활용하고 고수준 주요 채널을 증폭시키며, 3) 다양한 문맥 스케일에서 객체의 주요성을 인식하는 게이티드 멀티스케일 예측 모듈입니다.우리가 제안한 UTA 네트워크는 높은 성능뿐만 아니라 추론 시에는 깊이 정보가 필요하지 않으며, 43 FPS의 실시간 처리 속도로 작동합니다. 실험적 증거는 우리가 제안한 네트워크가 다섯 개의 공개 RGB-D SOD 벤치마크에서 기존 최고 수준의 방법들을 크게 능가하며, 다섯 개의 공개 RGB SOD 벤치마크에서도 그 확장성과 성능을 입증함을 보여줍니다.

RGB-D 주요 객체 검출을 위한 일반적인 타겟 인식 | 최신 연구 논문 | HyperAI초신경