텍스트 표현을 통한 타겟 의미 클러스터링을 통한 강건한 유니버설 도메인 적응
일반화된 도메인 적응(Universal Domain Adaptation, UniDA)은 도메인 차이와 알 수 없는 클래스 차이가 동시에 존재하는 상황에서 소스 도메인의 지식을 타겟 도메인으로 전이하는 것을 목표로 한다. 이 문제의 주요 과제는 공통 클래스 샘플을 식별하고 이를 정렬하는 것이다. 기존의 방법들은 제약 없는 연속적인 이미지 표현 공간에서 타겟 도메인의 의미 중심을 추출하는 방식을 사용한다. 그러나 도메인 차이와 클러스터 수의 불확실성으로 인해 이러한 중심은 복잡하고 낮은 내구성을 가진 정렬 알고리즘을 초래한다. 본 논문에서는 비전-언어 모델을 기반으로 의미적으로 의미 있는 이산적인 텍스트 표현 공간에서 의미 중심을 탐색한다. 제약된 표현 공간은 거의 도메인 편향이 없으며, 적절한 의미 세분화 수준을 제공함으로써 단순하고 강건한 적응 알고리즘을 가능하게 한다. 구체적으로, 텍스트 표현을 활용한 TArget Semantics Clustering (TASC)을 제안하며, 정보 최대화를 통합 목적함수로 사용하고 두 단계로 구성된다. 첫 번째 단계에서는 고정된 인코더를 이용해 탐욕적 탐색 기반 프레임워크를 통해 타겟 의미를 대표할 최적의 텍스트 임베딩 집합을 탐색한다. 두 번째 단계에서는 탐색 결과를 고정한 상태에서 그래디언트 하강을 기반으로 인코더를 개선함으로써, 강건한 도메인 정렬과 개별 클래스 클러스터링을 동시에 달성한다. 또한, UniDA 환경에서 오픈셋 샘플을 탐지하기 위해 특화된 스코어링 함수인 Universal Maximum Similarity (UniMS)를 제안한다. 실험적으로 네 가지 클래스 이동 시나리오 하에서 UniDA 알고리즘의 일반화 성능을 평가하였다. 네 가지 벤치마크에서 실시한 광범위한 실험 결과는 제안한 방법이 효과적이고 강건함을 입증하였으며, 기존 최고 성능(SOTA)을 달성하였다.