11일 전

MutexMatch: Mutex 기반 일관성 정규화를 통한 반감독 학습

Yue Duan, Zhen Zhao, Lei Qi, Lei Wang, Luping Zhou, Yinghuan Shi, Yang Gao
MutexMatch: Mutex 기반 일관성 정규화를 통한 반감독 학습
초록

반감독 학습(semi-supervised learning, SSL)의 핵심 과제는 미라벨 데이터를 어떻게 효과적으로 활용할 것인지에 있다. 그러나 기존의 대부분의 방법들은 고신뢰도 샘플의 활용에 큰 중점을 두는 반면, 저신뢰도 샘플의 잠재적 활용 가능성은 거의 탐구하지 못하고 있다. 본 논문에서는 저신뢰도 샘플을 새로운 방식으로 활용하기 위한 새로운 일관성 정규화 기법인 MutexMatch를 제안한다. 구체적으로, 고신뢰도 샘플은 기존의 진정 양성 분류기(True-Positive Classifier)를 통해 정확히 "무엇인지"를 예측하도록 요구하며, 반면 저신뢰도 샘플은 더 단순한 목표를 달성하도록 활용된다. 즉, 진정 음성 분류기(True-Negative Classifier)를 통해 "무엇이 아닌지"를 쉽게 예측하는 것이다. 이러한 접근은 의사라벨링 오류를 완화하는 동시에, 비유사도의 일관성(conistency of dissimilarity degree)을 통해 저신뢰도 미라벨 데이터를 극대한 활용할 수 있게 한다. MutexMatch는 CIFAR-10, CIFAR-100, SVHN, STL-10, mini-ImageNet 및 Tiny-ImageNet 등 여러 벤치마크 데이터셋에서 뛰어난 성능을 달성하였다. 더욱 중요한 점은, 라벨링된 데이터가 극히 적은 상황에서도 본 방법이 우수한 성능을 보인다는 점이다. 예를 들어, CIFAR-10에서는 단 20개의 라벨 데이터만으로도 92.23%의 정확도를 달성하였다. 본 연구의 코드와 모델 가중치는 https://github.com/NJUyued/MutexMatch4SSL 에 공개되어 있다.

MutexMatch: Mutex 기반 일관성 정규화를 통한 반감독 학습 | 최신 연구 논문 | HyperAI초신경