차이보다 유사성 탐색하기: 적응형 객체 탐지를 위한 유사성 기반 도메인 정렬

다양한 시나리오에 걸쳐 객체 탐지기의 견고한 배포를 위해서는 새로운 데이터를 지속적으로 레이블링할 필요 없이 입력 분포의 변화에 적응할 수 있어야 한다. 이에 따라 객체 탐지에 대한 비감독적 도메인 적응(UDA: Unsupervised Domain Adaptation) 알고리즘에 대한 연구가 활발히 진행되고 있다. UDA 방법은 레이블이 붙은 소스 도메인에서 레이블이 없는 타겟 도메인으로의 적응을 학습하며, 소스 도메인과 타겟 도메인의 탐지기 특징 간의 일치를 유도함으로써 이를 달성한다. 그러나 어떤 특징을 일치시켜야 하는지, 그리고 어떻게 일치시켜야 하는지에 대한 합의는 아직 존재하지 않는다. 본 연구에서는 UDA 방법에서 일반적으로 사용되는 다양한 구성 요소들을 포괄하는 프레임워크를 제안함으로써, UDA 설계 공간에 대한 심층적인 분석의 기반을 마련한다. 구체적으로, 본 프레임워크의 직접적인 구현으로 새로운 UDA 알고리즘 ViSGA를 제안한다. ViSGA는 최적의 설계 선택을 활용하며, 적대적 학습을 통해 그룹 일치를 유도하기 전에 시각적 유사도 기반으로 인스턴스 수준에서 특징을 집계하는 간단하면서도 효과적인 방법을 도입한다. 우리는 유사도 기반의 그룹화와 적대적 학습이 모두, 느슨하게 일치된 도메인 간에 모든 인스턴스를 정확히 매칭하도록 강제하지 않고도, 특징 그룹을 대체적으로 일치시키는 데 모델의 주의를 집중시킬 수 있음을 보여준다. 마지막으로, 레이블 데이터가 다양한 소스로부터 수집되는 상황에서 ViSGA의 적용 가능성을 탐색한다. 실험 결과, 기존의 단일 소스 접근법에 비해 Sim2Real 및 악기상 환경 설정에서 본 방법이 우수한 성능을 보이며, 다중 소스 환경에서도 잘 일반화됨을 확인할 수 있었다.