2달 전

불변 정보 클러스터링을 이용한 비지도 이미지 분류 및 세그멘테이션

Xu Ji; João F. Henriques; Andrea Vedaldi
불변 정보 클러스터링을 이용한 비지도 이미지 분류 및 세그멘테이션
초록

우리는 라벨이 부착되지 않은 데이터 샘플만 주어진 상태에서 신경망 분류기를 처음부터 학습시키는 새로운 클러스터링 목적함수를 제시합니다. 이 모델은 정확하게 의미 클래스와 일치하는 클러스터를 발견하며, 이미지 분류 및 세그멘테이션을 포함하는 여덟 개의 비지도 클러스터링 벤치마크에서 최고 수준의 결과를 달성했습니다. 여기에는 STL10, 비지도 버전의 ImageNet, 그리고 CIFAR10이 포함되며, 각각 6.6%와 9.5% 절대적인 정확도 차이로 가장 가까운 경쟁자들을 크게 능가했습니다. 이 방법은 컴퓨터 비전에 특화되어 있지 않으며 어떤 짝을 이루는 데이터셋 샘플에도 적용할 수 있습니다. 실험에서는 각 이미지에서 쌍을 얻기 위해 무작위 변환을 사용했습니다. 훈련된 네트워크는 외부 처리 없이 의미 클러스터링에 사용할 수 있는 고차원 표현 대신 직접 의미 레이블을 출력합니다. 목적함수는 단순히 각 쌍의 클래스 할당 간의 상호 정보량을 최대화하는 것입니다. 이는 정보 이론에 엄격히 기반하여 구현하기 쉽고, 다른 클러스터링 방법들이 취약한 부족한 해법을 쉽게 피할 수 있습니다. 완전 비지도 모드 외에도 두 가지 반비지도 설정에서도 테스트를 수행했습니다. 첫 번째 설정은 STL10 분류에서 88.8%의 정확도를 달성하여 기존 모든 방법(감독, 반비지도 또는 비지도)보다 새로운 전 세계적인 최고 수준을 세웠습니다. 두 번째 설정은 라벨 커버리지가 90% 감소해도 견디는 강건성을 보여주며, 소량의 라벨을 활용하고자 하는 응용 프로그램에 관련성이 있습니다. github.com/xu-ji/IIC

불변 정보 클러스터링을 이용한 비지도 이미지 분류 및 세그멘테이션 | 최신 연구 논문 | HyperAI초신경