순수한 노이즈가 부족한 데이터의 구원이 되다: 무작위 노이즈 이미지에서의 훈련을 통한 불균형 분류 개선

시각 인식 과제에서 놀라운 진전이 이루어졌음에도 불구하고, 깊은 신경망은 훈련 데이터가 부족하거나 극도로 불균형할 경우 일반화 성능이 여전히 낮아 실제 환경에서 매우 취약한 경향이 있다. 본 논문에서는 이러한 한계를 완화하기 위한 놀라울 정도로 간단하면서도 매우 효과적인 방법을 제안한다. 즉, 순수한 노이즈 이미지를 추가적인 훈련 데이터로 활용하는 것이다. 기존의 데이터 증강 기법에서 흔히 사용되는 덧셈 노이즈나 적대적 노이즈와 달리, 우리는 순수한 랜덤 노이즈 이미지에 직접 훈련하는 완전히 새로운 관점을 제시한다. 이를 위해 우리는 자연 이미지와 함께 순수한 노이즈 이미지에서도 훈련이 가능한 새로운 분포 인식 경로 배치 정규화 층(Distribution-Aware Routing Batch Normalization, DAR-BN)를 제안한다. 이 층은 일반화 능력을 촉진하고 과적합을 억제하는 데 기여한다. 제안된 방법은 다양한 긴 꼬리(long-tailed) 이미지 분류 데이터셋(CIFAR-10-LT, CIFAR-100-LT, ImageNet-LT, Places-LT, CelebA-5)에서 불균형 분류 성능을 크게 향상시켜 최신 기준(SOTA) 성과를 달성한다. 또한 본 방법은 기존의 데이터 증강 기법 위에 추가할 수 있는 일반적인 새로운 증강 도구로서 매우 간단하고 사용하기 쉬우며, 어떤 훈련 방식에도 손쉽게 통합할 수 있다. 특별한 데이터 생성 또는 훈련 절차가 필요 없기 때문에 훈련 속도와 효율성을 유지할 수 있다.