2달 전
대규모 비지도 이미지 클러스터링을 위한 자기 감독 학습
Evgenii Zheltonozhskii; Chaim Baskin; Alex M. Bronstein; Avi Mendelson

초록
비지도 학습은 항상 기계 학습 연구자와 실무자들에게 매력적이었는데, 이는 데이터 라벨링의 비용이 많이 들고 복잡한 과정을 피할 수 있기 때문입니다. 그러나 복잡한 데이터의 비지도 학습은 도전적이고, 가장 우수한 접근 방식조차도 지도 학습 대응 방식보다 훨씬 약한 성능을 보여줍니다. 자기 지도 딥러닝(self-supervised deep learning)은 컴퓨터 비전에서 표현 학습(representation learning)을 위한 강력한 도구가 되었습니다. 그러나 이러한 방법들은 완전히 비지도 설정에서 평가되지 않았습니다. 본 논문에서는 자기 지도 표현에 기반한 비지도 분류를 위한 간단한 체계를 제안합니다. 우리는 제안된 접근 방식을 여러 최근의 자기 지도 방법들과 함께 평가하여, ImageNet 분류에서 경쟁력 있는 결과를 달성함을 보였습니다(1000개 클러스터에서 39% 정확도, 오버클러스터링(overclustering) 시 46% 정확도). 우리는 비지도 평가를 자기 지도 학습의 표준 벤치마크 세트에 추가할 것을 제안합니다. 코드는 https://github.com/Randl/kmeans_selfsuper 에서 제공됩니다.