9일 전

긴 꼬리 시각 인식을 위한 균형 잡힌 대조 학습

Jianggang Zhu, Zheng Wang, Jingjing Chen, Yi-Ping Phoebe Chen, Yu-Gang Jiang
긴 꼬리 시각 인식을 위한 균형 잡힌 대조 학습
초록

실제 데이터는 일반적으로 긴 꼬리 분포(long-tailed distribution)를 따르며, 소수의 주요 클래스가 대부분의 데이터를 차지하는 반면, 대부분의 소수 클래스는 제한된 수의 샘플을 포함한다. 교차 엔트로피를 최소화하는 분류 모델은 꼬리 클래스를 표현하고 분류하는 데 어려움을 겪는다. 비편향 분류기 학습 문제는 이미 광범위하게 연구되었지만, 불균형 데이터를 표현하는 방법에 대한 연구는 여전히 부족하다. 본 논문에서는 불균형 데이터에 대한 표현 학습에 초점을 맞춘다. 최근, 감독형 대비 학습(supervised contrastive learning, SCL)은 균형 잡힌 데이터에서 뛰어난 성능을 보여주고 있다. 그러나 본 연구의 이론적 분석을 통해, 긴 꼬리 데이터에 대해 SCL이 표현 학습에 이상적인 기하학적 구조인 정사면체(regular simplex)를 형성하지 못함을 발견하였다. SCL의 최적화 행동을 보정하고 긴 꼬리 시각 인식 성능을 추가로 향상시키기 위해, 균형 잡힌 대비 학습(balanced contrastive learning, BCL)을 위한 새로운 손실 함수를 제안한다. SCL에 비해 BCL은 두 가지 개선점을 제공한다: 클래스 평균화(class-averaging)는 부정적 클래스들의 기울기 기여를 균형 있게 만든다; 클래스 보완(class-complement)는 모든 클래스가 각 미니배치에 포함되도록 보장한다. 제안된 균형 잡힌 대비 학습(BCL) 방법은 정사면체를 형성할 조건을 만족하며, 교차 엔트로피 최적화를 보조한다. BCL을 활용한 이중 분기 프레임워크는 더 강력한 특징 표현을 얻을 수 있으며, CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, iNaturalist2018와 같은 긴 꼬리 기준 데이터셋에서 경쟁적인 성능을 달성한다. 코드는 https://github.com/FlamieZhu/BCL 에서 공개되어 있다.