LEAD: 소스 프리 유니버설 도메인 적응을 위한 학습 분해

일반화된 도메인 적응(Generalized Domain Adaptation, UniDA)은 공변량 이동(covariate shift)과 레이블 이동(label shift)이 동시에 존재하는 환경에서 지식 전이를 목표로 한다. 최근에는 원천 데이터에 접근할 수 없더라도 UniDA를 달성할 수 있는 '원천 데이터 없음 일반화 도메인 적응(Source-free Universal Domain Adaptation, SF-UniDA)'이 등장하여, 데이터 보호 정책으로 인해 원천 데이터 접근이 어려운 현실 상황에서 더 실용적인 접근법으로 주목받고 있다. 그러나 주요 과제는 공변량 이동을 겪은 샘플이 타겟 도메인 고유의 미지 카테고리에 속하는지 여부를 정확히 판단하는 것이다. 기존의 방법들은 수작업 기반의 임계값 설정 또는 시간이 오래 걸리는 반복적 클러스터링 전략을 통해 이 문제를 해결하려 했다. 본 논문에서는 이러한 문제를 해결하기 위한 새로운 아이디어인 LEArning Decomposition(LEAD)을 제안한다. LEAD는 특징을 '원천 데이터에 알려진(known)' 및 '미지의(unknown)' 성분으로 분해함으로써 타겟 고유의 데이터를 식별한다. 기술적으로 LEAD는 특징 분해를 위해 직교 분해 분석(orthogonal decomposition analysis)을 활용하고, 개별 샘플 수준의 결정 경계를 구축하여 타겟 고유 데이터를 적응적으로 식별한다. 다양한 UniDA 시나리오에서 실시한 광범위한 실험을 통해 LEAD의 효과성과 우수성을 입증하였다. 특히 VisDA 데이터셋의 OPDA 시나리오에서 LEAD는 기존의 GLC 방법 대비 전반적인 H-스코어에서 3.5% 향상시키며, 의사 레이블링 결정 경계를 도출하는 데 소요되는 시간을 75% 감소시켰다. 또한 LEAD는 기존 대부분의 방법들과 상호 보완적인 특성을 지니고 있어, 기존 기법들과의 융합 가능성도 높다는 점에서 매력적인 특징을 갖는다. 코드는 https://github.com/ispc-lab/LEAD 에서 공개되어 있다.