
초록
이 논문은 인스턴스 수준의 대조 학습의 근본적인 한계를 해결하는 비지도 표현 학습 방법인 프로토타입 대조 학습(Prototypical Contrastive Learning, PCL)을 제안한다. PCL은 인스턴스 식별 작업을 위한 저수준 특징을 학습하는 것뿐만 아니라, 더 중요한 점은 학습된 임베딩 공간에 데이터의 의미 구조를 암묵적으로 인코딩한다는 점이다. 구체적으로, 기대값 최대화(Expectation-Maximization, EM) 프레임워크 내에서 네트워크 파라미터의 최대우도 추정을 돕기 위해 프로토타입을 잠재 변수로 도입한다. 우리는 E단계를 클러스터링을 통해 프로토타입의 분포를 찾는 것으로, M단계를 대조 학습을 통해 네트워크를 최적화하는 것으로 반복 수행한다. 또한, 대조 학습을 위한 InfoNCE 손실의 일반화된 형태인 ProtoNCE 손실을 제안하며, 이는 표현이 할당된 프로토타입에 더 가까워지도록 유도한다. PCL은 다양한 벤치마크에서 최신의 인스턴스 수준 대조 학습 방법들을 상회하며, 자원이 제한된 전이 학습에서 뚜렷한 성능 향상을 보였다. 코드와 사전 학습된 모델은 https://github.com/salesforce/PCL에서 제공된다.