9일 전
RSG: 불균형 데이터셋 학습을 위한 간단하지만 효과적인 모듈
Jianfeng Wang, Thomas Lukasiewicz, Xiaolin Hu, Jianfei Cai, Zhenghua Xu

초록
실제 응용 분야에서는 불균형 데이터셋이 널리 존재하며, 희귀 클래스에 대해 좋은 일반화 성능을 갖는 딥 신경망 모델을 훈련하는 데 큰 도전 과제를 안겨준다. 본 연구에서는 이러한 문제를 해결하기 위해 희귀 클래스 샘플 생성기(Rare-class Sample Generator, RSG)를 제안한다. RSG는 훈련 과정 중에 희귀 클래스에 해당하는 새로운 샘플을 생성함으로써 문제를 해결하는 데 목적이 있으며, 특히 다음과 같은 장점이 있다: (1) 사용이 간편하고 매우 유연하며, 어떤 종류의 합성곱 신경망(Convolutional Neural Network)에도 쉽게 통합 가능하며, 다양한 손실 함수와도 잘 작동함; (2) 훈련 단계에서만 사용되므로, 테스트 단계에서 딥 신경망에 추가적인 부담을 주지 않는다. 광범위한 실험 평가를 통해 RSG의 효과성을 검증하였으며, RSG를 활용함으로써 Imbalanced CIFAR에서 경쟁적인 성능을 달성하고, Places-LT, ImageNet-LT, iNaturalist 2018에서는 새로운 최고 성능(SOTA)을 기록하였다. 소스 코드는 https://github.com/Jianf-Wang/RSG 에서 제공된다.