10일 전

표현 학습을 위한 균형 잡힌 특징 공간 탐색

{Jiashi Feng, Zehuan Yuan, Sa Xie, Yu Li, Bingyi Kang}
표현 학습을 위한 균형 잡힌 특징 공간 탐색
초록

기존의 자기지도 학습(self-supervised learning, SSL) 방법들은 주로 인위적으로 균형 잡힌 데이터셋(예: ImageNet)에서 표현 모델을 학습하는 데 주로 사용되어 왔다. 그러나 클래스 간에 데이터 분포가 불균형한 실제 환경에서는 이러한 방법이 얼마나 잘 작동할지 명확하지 않다. 이 질문에 착안하여, 학습 샘플의 분포가 균형 잡힌 경우에서부터 긴 꼬리(long-tailed) 형태로 변화하는 다양한 데이터셋에서 자기지도 대비 학습(self-supervised contrastive learning) 및 감독 학습 방법의 성능을 체계적으로 조사하였다. 그 결과는 매우 흥미롭다. 감독 학습 방법은 클래스 불균형 시 성능이 크게 저하되는 반면, 자기지도 대비 학습 방법은 데이터 분포가 심각하게 불균형한 경우에도 안정적으로 뛰어난 성능을 보였다. 이는 대비 학습이 학습된 특징 공간이 클래스 간에 균형 잡힌 특징 표현을 형성한다는 점에 주목하게 만들었다. 즉, 모든 클래스에 대해 유사한 선형 가분성(linear separability)을 갖는 특징 표현이 나타난다. 추가 실험을 통해 균형 잡힌 특징 공간을 생성하는 표현 모델이 다양한 설정에서 불균형한 특징 공간을 생성하는 모델보다 더 우수한 일반화 성능을 보임을 확인하였다. 이러한 통찰을 바탕으로, 감독 학습 방법과 대비 학습 방법의 장점을 효과적으로 결합하여 구분 능력과 균형 잡힘을 동시에 갖춘 표현을 학습할 수 있는 새로운 표현 학습 방법인 $k$-positive 대비 학습을 제안한다. 광범위한 실험을 통해 다양한 인식 작업에서 본 방법의 우수성을 입증하였으며, 특히 도전적인 긴 꼬리 인식 벤치마크에서 새로운 최고 성능(state-of-the-art)을 달성하였다. 코드와 모델은 공개될 예정이다.