도메인 분리 네트워크

대규모 데이터 수집 및 주석화의 비용은 새로운 작업이나 데이터셋에 기계 학습 알고리즘을 적용하는 것을 매우 비싸게 만듭니다. 이 비용을 회피하는 한 가지 방법은 주석이 자동으로 제공되는 합성 데이터에서 모델을 훈련시키는 것입니다. 그러나 이러한 모델은 합성 이미지에서 실제 이미지로 일반화하는 데 종종 실패하여, 성공적으로 적용하기 전에 도메인 적응 알고리즘이 필요합니다. 기존 접근 방식은 두 도메인 간의 표현을 매핑하거나, 도메인에 관계없이 일관된 특징을 추출하는 것에 초점을 맞추고 있습니다. 하지만 두 도메인 간의 매핑이나 공유 표현만을 만들기 위해 집중함으로써 각 도메인의 개별적 특성을 무시하고 있습니다. 우리는 각 도메인이 고유하게 가진 부분을 명시적으로 모델링하면 모델이 도메인 간 일관된 특징을 추출하는 능력이 향상될 수 있다고 제안합니다. 개인-공유 구성 요소 분석(private-shared component analysis) 연구를 바탕으로, 우리는 이미지 표현을 두 하위 공간으로 나누어 명시적으로 학습하도록 설계하였습니다: 하나는 각 도메인에 고유한 부분이고, 다른 하나는 모든 도메인에서 공유되는 부분입니다. 우리의 모델은 소스 도메인에서 우리가 관심 있는 작업을 수행할 뿐 아니라, 파티셔닝된 표현을 사용하여 두 도메인 모두의 이미지를 재구성하도록 훈련됩니다. 이 새로운 아키텍처는 다양한 비지도 도메인 적응 시나리오에서 최신 기술(state-of-the-art)보다 우수한 성능을 내며, 또한 개인적 및 공유 표현의 시각화를 생성하여 도메인 적응 과정을 해석할 수 있게 합니다.