열린 클래스 탐지 학습을 통한 보편적 도메인 적응

일반화된 도메인 적응(UDA, Universal Domain Adaptation)은 레이블 집합에 대한 제약 없이 도메인 간 지식을 전이하는 기법으로, 실제 환경에서의 도메인 적응 적용 가능성을 확장한다. UDA에서는 소스 도메인과 타겟 도메인의 레이블 집합이 서로 공유하지 않는 고유한 레이블을 포함할 수 있다. UDA의 대표적인 과제 중 하나는 도메인 편차에 대비하여 공통 클래스에 속하는 타겟 예제를 정확히 분류하는 것이다. 또 다른 더 두드러진 과제는 타겟 도메인 고유의 레이블(오픈 클래스)을 가진 타겟 예제를 "알 수 없음(unknown)"으로 식별하는 것이다. 이 두 가지 복합적인 과제는 UDA를 매우 탐색되지 않은 문제로 만들고 있다. 기존의 UDA 연구는 주로 공통 클래스 내 데이터의 분류에 집중하며, 평가 지표로 각 클래스의 정확도(per-class accuracy)를 사용한다. 그러나 이는 공통 클래스의 정확도에 치우친 편향된 평가를 초래한다. 반면, 오픈 클래스를 정확히 탐지하는 것은 실제 일반화된 도메인 적응을 가능하게 하는 핵심 과제이다. 이는 UDA 문제를 기존의 닫힌 집합 도메인 적응(close-set domain adaptation) 문제로 재정의하게 된다. 오픈 클래스 정확한 탐지에 기여하기 위해, 우리는 다중 분류기 앙상블 모델에 의해 보정된 조건부 확률 기반으로 정의된 엔트로피, 신뢰도, 일관성이라는 다양한 불확실성 측정값의 혼합을 통해 추정된 새로운 전이 가능성(transferability) 측정법을 활용한 보정된 다중 불확실성(Calibrated Multiple Uncertainties, CMU)을 제안한다. 이 새로운 전이 가능성 측정법은 타겟 예제가 오픈 클래스에 속할 가능성을 정밀하게 정량화한다. 또한, 공통 클래스의 정확도와 "알 수 없음" 클래스의 정확도 모두의 중요성을 강조하는 새로운 평가 지표인 H-score를 제안한다. UDA 설정 하에서의 실험 결과에 따르면, CMU는 모든 평가 지표에서 최신 기술(SOTA) 도메인 적응 방법들을 상회하며, 특히 H-score에서 큰 성능 차이를 보였다.