
비지도 도메인 적응(unsupervised domain adaptation)은 소스 도메인에서만 레이블이 제공되는 상황에서, 타겟 도메인의 레이블이 없는 샘플들을 분류하는 문제를 해결하는 것을 목표로 한다. 그러나 두 도메인 간의 데이터 분포가 다를 경우, 소스 도메인의 레이블 데이터로 학습된 분류기는 타겟 도메인의 샘플에 직접 적용했을 때 성능이 크게 저하된다. 이 문제를 해결하기 위해, 도메인 불변 특징(domain-invariant features)을 학습하거나 도메인 특화 분류기(domain-specific classifiers)를 설계하는 다양한 방법이 제안되어 왔다. 그러나 이러한 방법들은 타겟 도메인에 레이블이 없는 점이 문제로 작용할 수 있으며, 이는 일반적으로 의사 레이블링(pseudo-labeling)을 통해 해결된다. 그러나 정확하지 않은 의사 레이블링은 학습 과정 중에 치명적인 오류 누적(catastrophic error accumulation)을 초래할 수 있다. 본 논문에서는 구조적 예측(structured prediction) 기반의 새로운 선택적 의사 레이블링 전략을 제안한다. 구조적 예측의 아이디어는 타겟 도메인의 샘플들이 심층 특징 공간 내에서 잘 군집되어 있다는 사실에서 영감을 얻었다. 이로 인해 비지도 군집 분석을 활용하여 정확한 의사 레이블링을 지원할 수 있다. Office-Caltech, Office31, ImageCLEF-DA, Office-Home 등 네 가지 데이터셋에서 수행한 실험 결과를 통해, 제안한 방법이 현재 최첨단 기법들을 능가함을 입증하였다.