
실제 데이터는 일반적으로 각 클래스의 빈도가 상이하기 때문에 긴 꼬리 분포(long-tailed distribution)를 따르는 경우가 많다. 예를 들어, 일부 클래스는 데이터가 부족한 반면, 다른 일부 클래스는 충분한 데이터를 보유하고 있을 수 있다. 그러나 데이터셋을 대표하는 모델은 각 클래스 간에 비교적 균일한 성능을 보이기를 기대한다. 데이터 불균형 문제를 완화하기 위한 최선의 실천 방법으로는 클래스 균형 손실(class-balanced loss) 도입과 데이터 재샘플링, 증강 기법의 고도화가 있다. 그러나 부족하게 표본화된 클래스에 대한 문제 해결은 추가적인 지식을 활용하여 누락된 정보를 복원해야 하는 경우가 많다.본 연구에서는 풍부한 샘플을 가진 클래스로부터 학습된 특징을 활용하여 부족한 클래스의 특징 공간에서 증강을 수행함으로써 긴 꼬리 문제를 해결하는 새로운 접근법을 제안한다. 구체적으로, 클래스 활성화 맵(class activation maps)을 이용해 각 클래스의 특징을 클래스 일반성 구성요소(class-generic component)와 클래스 특수성 구성요소(class-specific component)로 분해한다. 이후 학습 과정 중 실시간으로, 부족한 클래스의 클래스 특수성 특징과 혼동되는 클래스들로부터 추출한 클래스 일반성 특징을 융합하여 새로운 샘플을 생성한다. iNaturalist, ImageNet-LT, Places-LT, 그리고 긴 꼬리 형태의 CIFAR 데이터셋을 대상으로 수행한 실험 결과, 기존의 최고 성능 기법들을 초월하는 우수한 성능을 입증하였다.