
최근 긴 꼬리 분포(long-tailed distribution) 학습에 대한 관심이 높아지고 있으며, 특히 꼬리 계열(tail classes)에 대한 일반화 성능 향상이 주요 목표로 여겨지고 있다. 기존 대부분의 연구들은 학습 데이터셋 내에서 널리 퍼져 있는 레이블 노이즈를 고려하지 않고 감독 학습을 사용하고 있다. 더 현실적인 시나리오로 나아가기 위해 본 연구는 긴 꼬리 레이블 분포 하에서의 레이블 노이즈 문제를 탐구한다. 먼저, 기존 방법의 성능에 대해 노이즈 레이블이 미치는 부정적 영향을 관찰하며, 이 문제의 내재적 난이도를 밝혀냈다. 기존 문헌에서 가장 널리 사용되는 노이즈 레이블 대응 기법인 '작은 손실 기법(small-loss trick)'이 긴 꼬리 분포 하에서는 실패함을 발견하였다. 그 이유는 심층 신경망이 꼬리 계열에 대해 올바르게 레이블링된 예제와 잘못 레이블링된 예제를 구분하지 못하기 때문이다. 이러한 한계를 극복하기 위해, 레이블 노이즈에 강건한 거리 기반 메트릭을 설계함으로써 새로운 프로토타입 기반 노이즈 탐지 방법을 제안한다. 위의 발견을 바탕으로, 노이즈 탐지와 함께 레이블 스무딩(label smoothing)과 다양한 레이블 추측(diverse label guessing)을 통한 소프트 의사 레이블링(soft pseudo-labeling)을 수행하는 강건한 프레임워크인 ~\algo 를 제안한다. 또한 본 프레임워크는 반감독 학습(semi-supervised learning) 알고리즘을 자연스럽게 활용하여 일반화 성능을 추가로 향상시킬 수 있다. 기준 데이터셋 및 실제 세계 데이터셋에서 실시한 광범위한 실험을 통해 제안한 방법이 기존 벤치마크 대비 우수한 성능을 보임을 입증하였다. 특히, 테스트 정확도에서 기존의 DivideMix 대비 3% 향상을 달성하였다. 소스 코드는 곧 공개될 예정이다.