
초록
기계학습 시스템은 센서 네트워크 및 자율주행 차량의 인식 모듈에서 뇌-기계 인터페이스에 이르기까지 다양한 응용 분야에서 시간에 따라 변화하는 데이터 분포에 적응해야 한다. 본 연구에서는 소스 도메인에서 학습된 초기 분류기의 성능을, 타겟 도메인으로 점진적으로 분포가 변화하는 unlabeled 데이터만을 이용해 적응시키는 점진적 도메인 적응(Gradual Domain Adaptation)을 고려한다. 직접 타겟 도메인에 적응하는 것이 무한대의 오차를 초래할 수 있는 설정 하에서, 점진적 변화를 고려한 자기학습(Self-training)에 대한 최초의 비자명한 오차 상한을 증명한다. 이 이론적 분석은 알고리즘적 통찰을 제공하며, 무한한 데이터가 존재하더라도 정규화와 레이블 샤프닝(Label Sharpening)이 필수적임을 강조하며, 와서슈타인-무한 거리(Wasserstein-infinity distance)가 작은 변화에 대해 자기학습이 특히 효과적임을 시사한다. 점진적 변화 구조를 활용함으로써, 회전하는 MNIST 데이터셋과 현실적인 Portraits 데이터셋에서 더 높은 정확도를 달성할 수 있었다.