11일 전
RealMix: 현실적인 반감독 심층 학습 알고리즘을 향하여
Varun Nair, Javier Fuentes Alonso, Tony Beltramelli

초록
반감독 학습(Semi-Supervised Learning, SSL) 알고리즘은 레이블이 부족하지만 레이블 없는 데이터는 풍부한 환경에서 학습을 수행할 때 큰 잠재력을 보여주었다. 그러나 우리의 실험을 통해 기존 SSL 알고리즘이 겪는 몇 가지 한계를 확인할 수 있었다. 특히 레이블이 붙은 데이터와 레이블이 없는 데이터의 분포가 다를 경우 성능이 저하되는 문제이다. 이러한 문제를 해결하기 위해 우리는 다양한 레이블 데이터와 비레이블 데이터 크기에서 표준 벤치마크 데이터셋에서 최신 기준을 달성하는 RealMix를 개발하였다. 특히, CIFAR10에서 250개의 레이블만을 사용할 경우 9.79%의 오류율을 기록하며, 레이블 데이터와 비레이블 데이터의 분포가 크게 다를 때에도 기준 성능을 초과할 수 있는 유일한 SSL 방법으로서 두드러진 성과를 보였다. RealMix는 데이터와 계산 자원이 제한된 실제 환경에서도 SSL을 효과적으로 활용할 수 있음을 보여주며, 실용적인 적용 가능성을 고려한 향후 SSL 연구를 이끌어갈 방향을 제시한다.