
대규모 라벨링된 샘플로 훈련된 깊은 계층 모델은 많은 작업의 정확도를 향상시킵니다. 다양한 도메인에서 많은 라벨링된 샘플을 수집하는 것이 비용이 많이 들기 때문에 이러한 모델을 다른 도메인에 적용하는 것이 중요합니다. 비지도 도메인 적응에서, 라벨링된 소스 샘플과 라벨이 없는 대상 샘플을 제공받아 대상 도메인에서 잘 작동하는 분류기를 훈련시키는 것이 필요합니다. 많은 방법들이 소스와 대상 샘플의 분포를 일치시키는 것을 목표로 하지만, 단순히 분포를 일치시키는 것만으로는 대상 도메인에서의 정확도를 보장할 수 없습니다. 대상 도메인에서 차별적인 표현을 학습하기 위해 우리는 인공적으로 대상 샘플에 라벨을 부여하면 좋은 표현이 될 수 있다고 가정합니다. 트라이-트레이닝(Tri-training)은 세 개의 분류기를 동등하게 활용하여 라벨이 없는 샘플에 의사라벨(pseudo-label)을 부여하지만, 이 방법은 다른 도메인에서 생성된 샘플에 라벨을 부여하는 것을 가정하지 않습니다. 본 논문에서는 비지도 도메인 적응을 위한 비대칭 트라이-트레이닝 방법을 제안합니다. 이 방법에서는 라벨이 없는 샘플에 의사라벨을 할당하고 이를 실제 라벨처럼 신경망을 훈련시킵니다. 우리의 연구에서는 세 개의 네트워크를 비대칭적으로 사용합니다. 비대칭이라는 것은 두 개의 네트워크가 라벨이 없는 대상 샘플에 라벨을 부여하고, 하나의 네트워크가 이러한 샘플로 훈련되어 대상 차별적 표현(target-discriminative representations)을 얻는다는 것을 의미합니다. 우리는 숫자 인식 및 감성 분석 데이터셋에서 제안한 방법의 성능을 평가했습니다. 제안한 방법은 도메인 적응 벤치마크 숫자 인식 데이터셋에서 최신 성능(state-of-the-art performance)을 달성하였습니다.