긴 꼬리 인식을 위한 다채로운 분포 인식 전문가 라우팅

자연스러운 데이터는 일반적으로 의미적 클래스에 대해 길 꼬리(long-tail) 분포를 보인다. 기존의 인식 방법은 클래스 재균형화/가중치 조정 또는 다양한 데이터 그룹에 대한 앙상블을 통해 꼬리 쪽 데이터에 더 많은 주목을 기울여 불균형 분류 문제를 해결하지만, 이로 인해 꼬리 부분의 정확도는 증가하지만 헤드 부분의 정확도는 감소하는 경향이 있다.본 연구에서는 학습 데이터에 대해 동적인 관점을 제안하고, 학습 데이터의 변동이 모델의 편향(bias)과 분산(variance)에 미치는 영향을 체계적으로 분석한다. 기존의 길 꼬리 분류기들은 꼬리 클래스에 대해 더 많은 어려운 음성(negative) 예시와 혼동이 발생함에 따라 모델의 분산이 항상 증가하며, 헤드와 꼬리 간의 모델 편향 차이가 여전히 크다는 문제를 안고 있다.이에 우리는 새로운 길 꼬리 분류기인 RoutIng Diverse Experts(RIDE)를 제안한다. RIDE는 다수의 전문가(experts)를 활용하여 모델의 분산을 감소시키고, 분포 인지(distribution-aware) 다각성 손실을 통해 모델 편향을 줄이며, 동적 전문가 라우팅 모듈을 도입하여 계산 비용을 효율적으로 낮춘다. RIDE는 CIFAR100-LT, ImageNet-LT, iNaturalist 2018 등의 기준 평가에서 최신 기술 대비 5%~7%의 성능 향상을 달성한다. 또한 다양한 백본 네트워크, 길 꼬리 알고리즘, 학습 메커니즘에 적용 가능한 보편적인 프레임워크로서 일관된 성능 향상을 제공한다. 코드는 다음과 같은 주소에서 공개되어 있다: https://github.com/frank-xwang/RIDE-LongTailRecognition.