지오메트릭 앵커 대응 마이닝과 불확실성 모델링을 통한 유니버설 도메인 적응

일반화된 도메인 적응(Universal Domain Adaptation, UniDA)은 레이블이 풍부한 소스 도메인에서 학습된 지식을 레이블이 부족한 타겟 도메인으로 전이하되, 레이블 공간에 대한 제약 없이 수행하는 것을 목표로 한다. 그러나 도메인 이동(domain shift)과 카테고리 이동(category shift)으로 인해 UniDA는 매우 도전적인 과제가 되며, 주요 과제는 공통적인 "알려진(known)" 샘플과 독립적인 "알 수 없는(unknown)" 샘플을 모두 정확히 식별하는 것이다. 기존의 연구들은 두 도메인 간 내재적인 기하학적 관계를 거의 탐구하지 않았으며, 과도하게 자신감이 높은 폐쇄 세계(classifier)가 "알 수 없는" 샘플을 거부하기 위해 수동적으로 임계값(threshold)을 설정하는 방식을 사용해왔다. 따라서 본 논문에서는 기하학적 앵커를 기반으로 한 적대적 및 대조적 학습 프레임워크와 불확실성 모델링을 결합한 GATE(Geometric anchor-guided Adversarial and conTrastive learning framework with uncErtainty modeling)를 제안한다. 구체적으로, 먼저 무작위 보행(random walk)-기반 앵커 마이닝 전략과 고차원 주의 메커니즘(high-order attention mechanism)을 활용하여 도메인 간의 대응 관계를 구축한다. 이후 전역적 분포 보정을 위한 기하학적 적대적 학습과 지역적 구역 집합을 위한 하위 그래프 수준의 대조적 학습을 통합한 전역-지역 도메인 정렬 프레임워크를 설계한다. 타겟 도메인의 독립적인 샘플을 정확히 탐지하기 위해, GATE는 에너지 기반 불확실성 모델링을 통해 보편적인 증분 분류기(universal incremental classifier)를 도입한다. 또한, 다양체 믹스업(manifold mixup)을 효율적으로 활용하여 새로운 카테고리를 생성하고, 오픈셋 엔트로피(open-set entropy)를 최소화함으로써 "알 수 없는" 임계값을 적응적으로 학습한다. 세 가지 벤치마크에서 실시한 광범위한 실험 결과는 GATE가 기존 최고 수준의 UniDA 방법들을 상당히 능가함을 입증한다.