
부분 도메인 적응(Partial Domain Adaptation, PDA)은 타겟 도메인의 레이블 공간이 소스 도메인의 레이블 공간의 부분집합임을 전제로 하는 접근 방식으로, 최근 몇 년간 많은 주목을 받고 있다. 이러한 두 도메인 간의 레이블 공간 차이로 인해 PDA에서는 두 도메인을 직접적으로 정렬하는 것이 어렵다. 이 문제를 해결하기 위해, 본 연구에서는 타겟 도메인에 적응하기 위해 유용한 데이터를 선택하는 선택적 부분 도메인 적응(Selective Partial Domain Adaptation, SPDA) 방법을 제안한다. 구체적으로, PDA에 특화된 최대 코사인(Maximum of Cosine, MoC) 유사도 함수를 설계하여 소스 도메인 내에서 유용한 데이터를 선별함으로써 도메인 간 차이를 감소시킨다. MoC 유사도 함수에서는 각 타겟 샘플에 대해 코사인 유사도가 가장 높은 소스 샘플을 선택하여 적응에 활용한다. 또한, 유용한 타겟 데이터를 소스 도메인에 추가하기 위한 선택적 학습 방식을 제안한다. 구체적으로, 선택적 학습 방식은 자기학습(self-training) 전략을 통해 타겟 샘플에 의사 레이블(pseudo-label)을 할당한 후, 의사 레이블에 대한 신뢰도가 높은 타겟 샘플을 소스 도메인에 추가한다. 이러한 두 가지 선택 기반의 운영을 바탕으로 제안된 SPDA 방법은 도메인 적응에 유용한 데이터를 효과적으로 선별할 수 있다. 여러 데이터셋에서 수행된 실험을 통해 제안된 SPDA 방법의 효과성이 입증되었다.