10일 전

긴 꼬리 시각 인식을 위한 밸런스된 메타-소프트맥스

Jiawei Ren, Cunjun Yu, Shunan Sheng, Xiao Ma, Haiyu Zhao, Shuai Yi, Hongsheng Li
긴 꼬리 시각 인식을 위한 밸런스된 메타-소프트맥스
초록

딥 분류기는 시각 인식 분야에서 큰 성공을 거두었다. 그러나 실세계 데이터는 본질적으로 긴 꼬리(long-tailed) 분포를 가지며, 이로 인해 학습 데이터와 테스트 데이터 간의 분포 불일치가 발생한다. 본 논문에서는, 대부분의 분류 작업에서 사용되는 소프트맥스(softmax) 함수가 긴 꼬리 환경 하에서 편향된 기울기 추정을 제공함을 보여준다. 이에 본 논문은 학습과 테스트 간 레이블 분포의 변화를 적절히 수용하기 위해, 소프트맥스의 정확한 비편향 확장인 '밸런스드 소프트맥스(Balanced Softmax)'를 제안한다. 이론적으로, 다중 클래스 소프트맥스 회귀에 대한 일반화 경계(generalization bound)를 도출하고, 제안하는 손실 함수가 이 경계를 최소화함을 입증한다. 또한, 최적의 클래스 샘플 비율을 추정하기 위해 보완적인 메타 샘플러(Meta Sampler)를 적용한 '밸런스드 메타-소프트맥스(Balanced Meta-Softmax)'를 도입하여 긴 꼬리 학습 성능을 추가로 향상시킨다. 실험을 통해, 밸런스드 메타-소프트맥스가 시각 인식 및 인스턴스 세그멘테이션 작업 모두에서 최신 기술 대비 뛰어난 성능을 보임을 입증한다.