
초록
신경망에서의 비지도 학습 접근법은 인공지능의 발전을 위해 상당한 관심을 받고 있습니다. 이는 많은 비용이 드는 주석이 필요하지 않기 때문이며, 인간이 사용하는 일반적인 학습 모델에 더 가깝기 때문입니다. 그러나 비지도 네트워크는 특히 대규모 시각 인식 영역에서 지도 네트워크의 성능을 따라잡지 못해 오랜 시간 동안 뒤처져 왔습니다. 최근에는 비파라미터적 인스턴스 분리 및 클러스터링 목표를 최대화하기 위해 깊은 컨볼루션 임베딩을 훈련시키는 방법들이 이 간극을 좁히는데 유망한 결과를 보여주었습니다. 여기서 우리는 로컬 집합화 지표를 최대화하여 유사한 데이터 인스턴스가 임베딩 공간에서 함께 움직이는 반면, 비유사한 인스턴스가 분리되도록 하는 임베딩 함수를 훈련시키는 방법을 설명합니다. 이 집합화 지표는 동적이어서 서로 다른 규모의 부드러운 클러스터가 형성될 수 있도록 합니다. 우리는 여러 대규모 시각 인식 데이터셋에서 우리의 절차를 평가하였으며, ImageNet의 객체 인식, Places 205의 장면 인식, 그리고 PASCAL VOC의 객체 검출에서 최상의 비지도 전이 학습 성능을 달성하였습니다.