
초록
도메인 일반화는 기계 학습 모델이 다양한 새로운 도메인에서도 안정적으로 성능을 발휘할 수 있도록 훈련하는 것을 목표로 한다. 최근 몇몇 기법들은 여러 데이터셋을 활용하여 도메인에 무관한 특징을 추출하도록 모델을 훈련함으로써, 미지의 도메인으로의 일반화를 기대하고 있다. 본 연구에서는 이를 반대로 접근한다. 먼저, 각 도메인의 통계 정보를 독립적으로 수집하기 위해 특수 설계된 배치 정규화(Batch Normalization) 레이어를 사용하여 도메인에 의존적인 표현을 명시적으로 학습한다. 그 후, 이러한 통계 정보를 활용해 다양한 도메인을 공유되는 잠재 공간(Shared Latent Space)에 매핑하는 전략을 제안한다. 이 잠재 공간 내에서는 도메인 소속 관계를 거리 함수(distance function)를 통해 측정할 수 있다. 테스트 시점에는 미지 도메인의 샘플을 동일한 공간으로 투영하고, 기존 도메인들의 선형 조합을 통해 그 도메인의 특성을 추론한다. 본 연구는 훈련 및 테스트 시 동일한 매핑 전략을 적용함으로써, 잠재 표현을 학습하고 동시에 강력하면서도 경량화된 앙상블 모델을 구축한다. 제안한 방법은 대표적인 도메인 일반화 벤치마크인 PACS, Office-31, Office-Caltech에서 현재 최고 수준의 기법들에 비해 분류 정확도가 크게 향상됨을 실험을 통해 입증하였다.