
딥러닝의 발전에 따라 객체 인식 분야에서 많은 진전이 이루어졌지만, 여전히 딥러닝 모델의 성능에 부정적인 영향을 미치는 여러 요인이 존재한다. 그 중 하나가 도메인 전이(domain shift)로, 훈련 데이터와 테스트 데이터의 분포 간 불일치에서 기인한다. 본 논문에서는 다중 도메인 데이터로부터 임베딩 공간을 최적화하기 위해 도메인 일반화(domain generalization)에서의 컴팩트한 특징 클러스터링 문제에 초점을 맞춘다. 유사한 의미적 특징을 클러스터링할 뿐만 아니라, 도메인에 기인한 특징을 분산시키는 데 기여할 수 있도록 도메인 인지형 트리플릿 손실(domain-aware triplet loss)을 제안한다. 기존의 분포 정합(distribution alignment)에 집중한 방법들과 달리, 본 알고리즘은 임베딩 공간 내에서 도메인 정보를 분산시키는 것을 목표로 한다. 이 아이디어는 임베딩 특징이 도메인 정보를 기준으로 클러스터링될 수 있다는 가정에 기반하며, 본 논문에서는 이 가정이 수학적으로 및 실험적으로도 타당함을 입증한다. 또한 도메인 일반화에서 특징 클러스터링을 탐구하면서, 미리 정의된 도메인보다 메트릭 학습 손실의 수렴에 영향을 미치는 요인이 더 중요함을 인지하게 되었다. 이를 해결하기 위해, 임베딩 공간의 내부 공변량 이동(internal covariate shift)을 줄이기 위해 두 가지 방법을 활용하여 임베딩 공간을 정규화한다. 제거 실험(ablation study)을 통해 본 알고리즘의 효과성을 입증하였으며, PACS, VLCS, Office-Home과 같은 벤치마크 데이터셋에서의 실험 결과도, 도메인 간 차이에 초점을 맞춘 기존 방법들을 능가함을 보였다. 특히 RegnetY-16에 대한 실험 결과는 벤치마크 데이터셋에서 최신 기법들보다 뚜렷하게 우수한 성능을 기록하였다. 본 연구의 코드는 https://github.com/workerbcd/DCT 에서 공개될 예정이다.