2달 전
시각적 표현의 대조 학습을 위한 간단한 프레임워크
Ting Chen; Simon Kornblith; Mohammad Norouzi; Geoffrey Hinton

초록
본 논문은 시각적 표현의 대조적 학습을 위한 간단한 프레임워크인 SimCLR을 소개합니다. 우리는 특수한 아키텍처나 메모리 뱅크를 요구하지 않는 최근 제안된 대조적 자기지도 학습 알고리즘들을 단순화하였습니다. 대조적 예측 작업이 유용한 표현을 학습할 수 있게 하는 요소를 이해하기 위해, 본 프레임워크의 주요 구성 요소들을 체계적으로 연구하였습니다. 연구 결과, (1) 데이터 증강의 조합이 효과적인 예측 작업을 정의하는 데 중요한 역할을 하며, (2) 표현과 대조 손실 사이에 학습 가능한 비선형 변환을 도입하면 학습된 표현의 품질이 크게 향상되며, (3) 대조적 학습은 감독학습보다 더 큰 배치 크기와 더 많은 학습 단계에서 이점을 얻는다는 것을 보여주었습니다. 이러한 발견들을 결합함으로써, 우리는 ImageNet에서 자기지도 및 준감독 학습에 대한 기존 방법론을 크게 능가할 수 있었습니다. SimCLR로 학습된 자기지도 표현 위에서 훈련된 선형 분류기는 76.5%의 Top-1 정확도를 달성하였으며, 이는 기존 최고 성능보다 7% 상대적으로 개선된 결과로 감독된 ResNet-50의 성능과 일치합니다. 단 1%의 라벨만으로 미세 조정(fine-tuning)되었을 때, 우리는 85.8%의 Top-5 정확도를 달성하여 AlexNet보다 100배 적은 라벨로도 우수한 성능을 보였습니다.