16일 전

RGB-D 색상 객체 탐지를 위한 계층적 동적 필터링 네트워크

Youwei Pang, Lihe Zhang, Xiaoqi Zhao, Huchuan Lu
RGB-D 색상 객체 탐지를 위한 계층적 동적 필터링 네트워크
초록

RGB-D 선명 객체 탐지(SOD)의 주요 목적은 다양한 모달 간 융합 정보를 보다 효과적으로 통합하고 활용하는 것이다. 본 논문에서는 이러한 문제를 새로운 관점에서 탐구한다. 우리는 밀집 연결 구조를 통해 다양한 모달의 특징을 통합하고, 이 혼합된 특징을 활용하여 다양한 크기의 수용 영역을 가진 동적 필터를 생성한다. 최종적으로, 보다 유연하고 효율적인 다중 스케일의 크로스 모달 특징 처리 방식인 동적 확장 피라미드 모듈(dynamic dilated pyramid module)을 제안한다. 예측 결과의 경계를 더욱 선명하게 하고, 선명도 영역이 일관되게 유지되도록 하기 위해 하이브리드 강화 손실 함수를 설계하여 결과를 추가로 최적화한다. 이 손실 함수는 단일 모달 RGB SOD 작업에서도 효과적임이 검증되었다. 여섯 가지 평가 지표에서 제안하는 방법은 여덟 개의 도전적인 벤치마크 데이터셋에서 기존의 12가지 방법보다 우수한 성능을 보였다. 대규모 실험을 통해 제안된 모듈과 손실 함수의 효과성이 입증되었다. 코드, 모델 및 결과는 \url{https://github.com/lartpang/HDFNet}에서 확인할 수 있다.

RGB-D 색상 객체 탐지를 위한 계층적 동적 필터링 네트워크 | 최신 연구 논문 | HyperAI초신경