
초록
실제 데이터는 일반적으로 긴 꼬리 분포(long-tailed distribution)를 가지며, 학습 클래스 간 각 클래스의 샘플 수가 균형을 이루지 않는다. 불균형한 데이터는 편향된 특징 공간을 형성하게 되어 인식 모델의 성능을 저하시킨다. 본 논문에서는 잠재 특징 공간을 균형 잡는 새로운 긴 꼬리 인식 방법을 제안한다. 먼저, 긴 꼬리 데이터의 편향을 줄이기 위해 MixUp 기반의 데이터 증강 기법을 도입한다. 더불어, 혼합 이미지를 위한 새로운 지도형 대비 학습 방법인 '혼합 클래스 기반의 지도형 대비 학습(Supervised contrastive learning on Mixed Classes, SMC)'을 제안한다. SMC는 원본 이미지의 클래스 레이블을 기반으로 긍정 샘플의 집합을 생성하며, 긍정 샘플의 조합 비율은 학습 손실에서 긍정 샘플의 가중치를 조절한다. 클래스 혼합 기반의 손실을 활용한 SMC는 더 다양한 데이터 공간을 탐색함으로써 모델의 일반화 능력을 향상시킨다. 다양한 벤치마크에서 실시한 광범위한 실험을 통해 제안하는 단계별 학습 방법의 효과성을 입증하였다.