
초록
우리는 반감독 학습 프레임워크인 UnMixMatch를 제안한다. 이 방법은 제약 없이 확보된 레이블 없는 데이터로부터 효과적인 표현을 학습함으로써 성능을 확장할 수 있도록 한다. 기존의 대부분의 반감독 학습 방법은 레이블이 부여된 샘플과 레이블이 없는 샘플이 동일한 분포에서 추출된다는 가정에 의존하는데, 이는 무료로 확보 가능한 레이블 없는 데이터를 활용한 성능 향상의 잠재력을 제한한다. 결과적으로, 이 가정은 반감독 학습의 일반화 능력과 확장성에 종종 장애가 된다. 본 연구에서 제안하는 방법은 이러한 제약을 극복하고, 제약 없이 확보된 레이블 없는 데이터를 효과적으로 활용할 수 있도록 한다. UnMixMatch는 세 가지 주요 구성 요소로 이루어져 있다. 첫째, 강한 증강 기법을 사용하는 감독 학습자로서 강한 정규화를 제공한다. 둘째, 레이블 없는 데이터로부터 근본적인 표현을 학습하기 위한 대조 일관성 정규화 기법이다. 셋째, 레이블 없는 데이터로부터 학습된 표현을 더욱 강화하는 자기지도 학습 손실이다. 우리는 네 가지 일반적으로 사용되는 데이터셋에서 광범위한 실험을 수행하여, 기존 반감독 학습 방법 대비 4.79%의 성능 향상을 입증하였다. 또한 광범위한 제거 실험과 민감도 분석을 통해 제안된 각 구성 요소의 효과성과 영향력을 입증하였다.