2달 전
분포 이동 하에서 일반화를 위한 테스트 시간 학습과 자기 지도 학습
Yu Sun; Xiaolong Wang; Zhuang Liu; John Miller; Alexei A. Efros; Moritz Hardt

초록
본 논문에서 우리는 테스트 시간 학습(Test-Time Training)이라는 일반적인 접근법을 제안합니다. 이 방법은 훈련 데이터와 테스트 데이터가 서로 다른 분포를 가질 때 예측 모델의 성능을 개선하기 위해 사용됩니다. 우리는 단일 라벨이 없는 테스트 샘플을 자기 지도 학습(self-supervised learning) 문제로 변환하고, 예측을 수행하기 전에 모델 매개변수를 업데이트합니다. 이 접근법은 자연스럽게 온라인 스트림 데이터에도 확장될 수 있습니다. 우리의 간단한 방법은 다양한 이미지 분류 벤치마크에서 분포 변화에 대한 강건성을 평가하는 데 있어 성능 개선을 가져옵니다.