7일 전

소스 데이터에 접근할 필요가 정말 있는가? 비지도 도메인 적응을 위한 소스 가설 전이

Jian Liang, Dapeng Hu, Jiashi Feng
소스 데이터에 접근할 필요가 정말 있는가? 비지도 도메인 적응을 위한 소스 가설 전이
초록

비지도 도메인 적응(UDA)은 레이블이 붙은 소스 데이터셋에서 학습한 지식을 새로운 레이블이 없는 도메인에서 유사한 작업을 해결하는 데 활용하려는 것을 목표로 한다. 기존의 UDA 방법들은 모델 적응을 학습할 때 소스 데이터에 접근이 필요하기 때문에, 분산된 사적 데이터에 대해 위험하고 비효율적인 문제를 야기한다. 본 연구는 소스 데이터에 접근할 수 없고 오직 훈련된 소스 모델만 존재하는 실용적인 환경을 고려하며, 소스 데이터 없이 이러한 모델을 효과적으로 활용하여 UDA 문제를 해결하는 방법을 탐구한다. 우리는 간단하면서도 일반적인 표현 학습 프레임워크인 \emph{Source HypOthesis Transfer}(SHOT)을 제안한다. SHOT은 소스 모델의 분류기 모듈(가설)을 고정하고, 타겟 도메인에 특화된 특징 추출 모듈을 정보 최대화와 자기지도적 가짜 레이블링(self-supervised pseudo-labeling)을 활용하여 학습함으로써, 타겟 도메인의 표현을 소스 가설에 암묵적으로 정렬한다. 그 유연성을 검증하기 위해, 폐쇄 집합(closed-set), 부분 집합(partial-set), 개방 집합(open-set) 도메인 적응을 포함한 다양한 적응 케이스에서 SHOT을 평가하였다. 실험 결과, SHOT은 다양한 도메인 적응 벤치마크에서 최신 기술 수준(SOTA)의 성능을 달성함을 보여주었다.

소스 데이터에 접근할 필요가 정말 있는가? 비지도 도메인 적응을 위한 소스 가설 전이 | 최신 연구 논문 | HyperAI초신경