10일 전

긴 꼬리 데이터셋에서 다중 레이블 분류를 위한 분포 균형 손실

Tong Wu, Qingqiu Huang, Ziwei Liu, Yu Wang, Dahua Lin
긴 꼬리 데이터셋에서 다중 레이블 분류를 위한 분포 균형 손실
초록

다양한 레이블이 동시에 존재하는 다중 레이블 인식 문제에서 긴 꼬리(class distribution) 구조를 보이는 경우에 적합한 새로운 손실 함수인 Distribution-Balanced Loss를 제안한다. 기존의 단일 레이블 분류 문제와 비교해 다중 레이블 인식 문제는 레이블의 동시 발생(co-occurrence)과 부정 레이블의 지배적 우세(여러 개의 이진 분류 문제로 처리할 때)라는 두 가지 주요한 문제로 인해 더욱 도전적이다. Distribution-Balanced Loss는 표준 이진 크로스엔트로피 손실 함수에 대해 두 가지 핵심적 개선을 통해 이러한 문제를 해결한다. 첫째, 레이블의 동시 발생이 초래하는 영향을 고려한 새로운 가중치 재균형 방식을 도입하고, 둘째, 부정 레이블의 과도한 억제를 완화하기 위한 부정 레이블에 대한 내성적 정규화(regularization)를 적용한다. Pascal VOC 및 COCO 데이터셋에서의 실험 결과, 본 손실 함수로 학습된 모델이 기존 방법들에 비해 유의미한 성능 향상을 보였다. 코드와 모델은 다음 주소에서 제공된다: https://github.com/wutong16/DistributionBalancedLoss.