반감소 학습 공간을 통한 반감독 학습의 확신도 향상

반감독 학습은 레이블이 없는 데이터를 효과적으로 활용한 성공 사례로 인해 주목받고 있다. 최근의 대부분의 프레임워크는 신뢰도가 낮은 가짜 레이블(퍼지 레이블)을 줄이기 위해 고정된 신뢰도 임계값을 설정하여 불확실한 샘플을 제거하는 방식을 채택하고 있다. 이 방법은 고품질의 가짜 레이블을 보장하지만, 전체 레이블 없는 데이터셋의 활용도가 상대적으로 낮다는 단점이 있다. 본 연구에서의 핵심 통찰은, 상위 1위 클래스와 혼동되는 클래스를 탐지하고 제거할 경우, 불확실한 샘플을 확실한 샘플로 전환할 수 있다는 점이다. 이러한 통찰을 바탕으로, 불확실한 샘플을 효과적으로 학습하기 위한 새로운 방법인 ShrinkMatch를 제안한다. 각 불확실한 샘플에 대해, 기존의 상위 1위 클래스와 신뢰도가 낮은 나머지 클래스들만 포함하는 축소된 클래스 공간을 적응적으로 탐색한다. 이 축소된 공간에서는 혼동 클래스가 제거되므로, 재계산된 상위 1위 클래스에 대한 신뢰도가 미리 정의된 임계값을 충족하게 된다. 이후, 이 축소된 공간 내에서 강한 증강과 약한 증강을 적용한 샘플 쌍 간에 일관성 정규화를 적용하여 구분 능력이 뛰어난 표현을 학습한다. 더불어, 불확실한 샘플들 간의 신뢰도 차이와 학습 과정 중 모델의 점진적 향상 특성을 고려하여, 불확실한 손실에 대해 두 가지 재가중 원칙을 설계하였다. 제안한 방법은 널리 사용되는 벤치마크에서 뛰어난 성능을 보였다. 코드는 https://github.com/LiheYoung/ShrinkMatch 에서 공개되어 있다.