한 달 전
도메인 대립 훈련 신경망
Yaroslav Ganin; Evgeniya Ustinova; Hana Ajakan; Pascal Germain; Hugo Larochelle; François Laviolette; Mario Marchand; Victor Lempitsky

초록
우리는 훈련 시와 테스트 시에 유사하지만 다른 분포에서 데이터가 도출되는 도메인 적응을 위한 새로운 표현 학습 접근법을 소개합니다. 우리의 접근법은 효과적인 도메인 전이를 달성하기 위해서는 예측이 훈련(소스) 도메인과 테스트(타겟) 도메인 사이의 차이를 구분할 수 없는 특징들에 기반해야 한다는 도메인 적응 이론에서 직접적으로 영감을 받았습니다. 이 접근법은 소스 도메인의 라벨된 데이터와 타겟 도메인의 비라벨된 데이터로 훈련되는 신경망 아키텍처의 맥락에서 이러한 아이디어를 구현합니다(라벨된 타겟 도메인 데이터는 필요하지 않습니다). 훈련이 진행됨에 따라, 이 접근법은 (i) 소스 도메인에서 주요 학습 작업에 대해 구별력 있는 특징들과 (ii) 도메인 간 변화에 대해 무차별적인 특징들의 발생을 촉진합니다. 우리는 이 적응 행동이 거의 모든 순방향 모델에 몇 개의 표준 레이어와 새로운 그래디언트 역전 레이어를 추가함으로써 달성될 수 있음을 보여줍니다. 결과적으로 얻어진 확장된 아키텍처는 표준 역전파와 확률적 경사 하강법을 사용하여 훈련될 수 있으며, 따라서 깊은 학습 패키지 중 어느 것이라도 약간의 노력으로 구현할 수 있습니다. 우리는 문서 감정 분석과 이미지 분류라는 두 가지 서로 다른 분류 문제에서 표준 벤치마크에서 최고 성능을 달성하는 것으로 우리 접근법의 성공을 입증하였습니다. 또한 사람 재식별 응용 프로그램의 맥락에서 설명자 학습 작업에서도 접근법을 검증하였습니다.