11일 전
ReMixMatch: 분포 정렬과 증강 고정을 활용한 반감독 학습
David Berthelot, Nicholas Carlini, Ekin D. Cubuk, Alex Kurakin, Kihyuk Sohn, Han Zhang, Colin Raffel

초록
최근 제안된 'MixMatch' 반감독 학습 알고리즘을 개선하기 위해 두 가지 새로운 기술, 즉 분포 일치(distribution alignment)와 증강 고정(augmentation anchoring)을 도입하였다. 분포 일치 기법은 레이블이 없는 데이터에 대한 예측의 주변 분포가 진정한 레이블의 주변 분포와 유사하도록 유도한다. 증강 고정 기법은 입력 데이터의 여러 강한 증강 버전을 모델에 입력하고, 각 출력이 동일한 입력에 대한 약한 증강 버전의 예측과 가까워지도록 유도한다. 강한 증강을 생성하기 위해, 모델 학습 과정 중에 증강 정책을 학습하는 AutoAugment의 변형을 제안한다. 본 연구에서 제안한 새로운 알고리즘인 ReMixMatch는 기존 방법에 비해 훨씬 더 데이터 효율적이며, 동일한 정확도에 도달하기 위해 최소 5배에서 최대 16배의 데이터가 필요하다. 예를 들어, CIFAR-10 데이터셋에서 레이블이 250개만 있는 경우 ReMixMatch는 93.73%의 정확도를 달성하였으며, 이는 MixMatch가 4,000개의 레이블을 사용했을 때 달성한 93.58%의 정확도에 비해 뛰어난 성능이다. 또한 클래스당 단 4개의 레이블만으로도 중앙 정확도가 84.92%에 달한다. 본 연구의 코드와 데이터는 https://github.com/google-research/remixmatch 에서 오픈소스로 공개된다.