소스 데이터 부재 환경에서 가설 전이와 레이블 전이를 통한 비지도 도메인 적응

비감독 도메인 적응(UDA)은 관련되지만 서로 다른 잘 레이블링된 소스 도메인에서 새로운 레이블이 없는 타겟 도메인으로 지식을 전이하는 것을 목표로 한다. 기존 대부분의 UDA 방법은 소스 데이터에 접근이 필요하므로, 개인정보 보호 문제로 인해 데이터를 공유할 수 없는 경우 적용이 불가능하다. 본 논문은 소스 데이터에 접근할 수 없고, 대신 소스 데이터를 기반으로 학습된 분류 모델만 제공되는 현실적인 환경을 해결하는 데 초점을 맞춘다. 타겟 도메인에 대한 특징 추출 모듈을 효과적으로 학습하기 위해, 동결된 소스 분류 모듈(분류 가설을 나타냄)에 타겟 데이터의 특징을 맞추는 방식으로 타겟 도메인의 특징 추출 모듈을 학습하는 새로운 접근법인 소스 가설 전이(Source HypOthesis Transfer, SHOT)를 제안한다. 구체적으로 SHOT은 타겟 특징이 동일한 가설을 통해 미지의 소스 데이터 특징과 암묵적으로 정렬되도록 보장하기 위해 정보 최대화와 자기지도 학습(self-supervised learning)을 함께 활용한다. 또한, 타겟 데이터를 예측의 신뢰도(레이블 정보)에 따라 두 개의 부분으로 분할하고, 반지도 학습을 활용하여 신뢰도가 낮은 예측의 정확도를 향상시키는 새로운 레이블 전이 전략을 제안한다. SHOT으로 얻은 예측을 기반으로 레이블 전이를 수행할 경우 이를 SHOT++로 표기한다. 숫자 분류 및 객체 인식 작업에 대한 광범위한 실험 결과를 통해 SHOT 및 SHOT++가 기존 최고 성능(SOTA)과 비교하여 우수하거나 유사한 성능을 달성함을 확인하였으며, 다양한 시각적 도메인 적응 문제에 대한 본 연구의 접근법의 효과성을 입증하였다. 코드는 \url{https://github.com/tim-learn/SHOT-plus}에서 공개되어 있다.