12일 전

H2FA R-CNN: 도메인 간 약한 감독 객체 탐지를 위한 포괄적이고 계층적인 특징 정렬

{Yi Yang, Jiaxu Miao, Zongxin Yang, Yifan Sun, Yunqiu Xu}
H2FA R-CNN: 도메인 간 약한 감독 객체 탐지를 위한 포괄적이고 계층적인 특징 정렬
초록

크로스도메인 약한 감독 객체 탐지(CDWSOD)는 쉽게 확보할 수 있는 이미지 수준의 레이블을 이용하여 탐지 모델을 새로운 타겟 도메인에 적응시키는 것을 목표로 한다. 소스 도메인과 타겟 도메인을 어떻게 정렬할 것인지가 CDWSOD 정확도에 핵심적인 영향을 미친다. 기존의 방법들은 도메인 정렬을 위해 탐지 구성 요소 중 일부에만 초점을 맞추는 경향이 있다. 반면 본 논문에서는 모든 탐지 구성 요소가 중요하다는 점을 고려하여, 종합적이고 계층적인 특징 정렬(Holistic and Hierarchical Feature Alignment, H²FA) R-CNN을 제안한다. H²FA R-CNN은 백본 특징에 대해 두 가지 이미지 수준의 정렬을, RPN과 탐지 헤드에 대해 각각 두 가지 인스턴스 수준의 정렬을 강제한다. 이러한 거시적에서 미시적인 정렬 계층은 탐지 파이프라인과 일치하며, 하위에서 상위로 이미지 수준 특징과 인스턴스 수준 특징을 처리하는 방식으로 진행된다. 특히, 두 가지 인스턴스 수준 정렬을 학습하기 위해 새로운 하이브리드 감독 방식을 개발하였다. 이는 RPN과 탐지 헤드가 동시에 타겟 도메인의 약한 레이블과 소스 도메인의 완전한 레이블로부터 동시에 학습할 수 있도록 한다. 이러한 모든 특징 정렬을 통합함으로써 H²FA R-CNN은 소스 도메인과 타겟 도메인 간의 차이를 효과적으로 완화한다. 실험 결과, H²FA R-CNN은 크로스도메인 객체 탐지 정확도를 크게 향상시키며, 대표적인 벤치마크에서 새로운 최고 성능을 달성하였다. 코드 및 사전 학습된 모델은 https://github.com/XuYunqiu/H2FA_R-CNN 에서 제공된다.

H2FA R-CNN: 도메인 간 약한 감독 객체 탐지를 위한 포괄적이고 계층적인 특징 정렬 | 최신 연구 논문 | HyperAI초신경