10일 전
긴꼬리 이미지 분류 재검토: 조사 및 새로운 평가 지표를 활용한 벤치마크
Chaowei Fang, Dingwen Zhang, Wen Zheng, Xue Li, Le Yang, Lechao Cheng, Junwei Han

초록
최근 들어, 많은 실제 상황에서 데이터 분포가 길꼬리(long-tailed) 형태를 띠기 때문에, 길꼬리 이미지 분류에 대한 연구 관심이 급증하고 있다. 이러한 데이터 불균형 문제를 해결하기 위해, 희귀 클래스에 대한 훈련 과정을 편향시키는 다양한 알고리즘이 제안되어 왔다. 그러나 기존의 대부분의 연구들은 균형 잡힌 테스트 세트 또는 훈련 데이터와 다른 분포를 가진 별개의 여러 테스트 세트에서 성능을 평가한다. 그러나 테스트 데이터가 임의의 분포를 가질 수 있다는 점을 고려할 때, 기존의 평가 전략은 실제 분류 성능을 객관적으로 반영하지 못한다는 한계가 있다. 본 연구에서는 분포가 변화하는 일련의 테스트 세트를 기반으로 새로운 평가 벤치마크를 제안한다. 또한, 길꼬리 분포 학습을 위한 알고리즘의 정확도, 강건성, 그리고 성능 한계를 측정할 수 있는 종합적인 메트릭 컬렉션을 설계하였다. 제안된 벤치마크를 바탕으로 CIFAR10 및 CIFAR100 데이터셋에서 기존 방법들의 성능을 재평가하였으며, 이는 데이터 재균형 기법의 선택을 안내하는 데 있어 중요한 가치를 지닌다. 더불어 기존의 방법들을 훈련 파이프라인 상에서 주로 집중하는 절차에 따라 네 가지 유형—데이터 균형화, 특징 균형화, 손실 균형화, 예측 균형화—로 분류하여 체계적으로 재검토하였다.