
초록
비지도 도메인 적응(UDA)은 레이블이 붙은 소스 데이터셋에서 학습한 지식을 새로운 레이블이 없는 도메인에서 유사한 작업을 해결하는 데 활용하려는 것을 목표로 한다. 기존의 UDA 방법들은 모델 적응을 학습할 때 소스 데이터에 접근이 필요하기 때문에, 분산된 사적 데이터에 대해 위험하고 비효율적인 문제를 야기한다. 본 연구는 소스 데이터에 접근할 수 없고 오직 훈련된 소스 모델만 존재하는 실용적인 환경을 고려하며, 소스 데이터 없이 이러한 모델을 효과적으로 활용하여 UDA 문제를 해결하는 방법을 탐구한다. 우리는 간단하면서도 일반적인 표현 학습 프레임워크인 \emph{Source HypOthesis Transfer}(SHOT)을 제안한다. SHOT은 소스 모델의 분류기 모듈(가설)을 고정하고, 타겟 도메인에 특화된 특징 추출 모듈을 정보 최대화와 자기지도적 가짜 레이블링(self-supervised pseudo-labeling)을 활용하여 학습함으로써, 타겟 도메인의 표현을 소스 가설에 암묵적으로 정렬한다. 그 유연성을 검증하기 위해, 폐쇄 집합(closed-set), 부분 집합(partial-set), 개방 집합(open-set) 도메인 적응을 포함한 다양한 적응 케이스에서 SHOT을 평가하였다. 실험 결과, SHOT은 다양한 도메인 적응 벤치마크에서 최신 기술 수준(SOTA)의 성능을 달성함을 보여주었다.