11일 전

비대칭 손실을 통한 다중 레이블 분류

Emanuel Ben-Baruch, Tal Ridnik, Nadav Zamir, Asaf Noy, Itamar Friedman, Matan Protter, Lihi Zelnik-Manor
비대칭 손실을 통한 다중 레이블 분류
초록

다중 레이블 설정에서 일반적으로 한 이미지에는 평균적으로 몇 개의 긍정 레이블만 포함되어 있으며, 많은 수의 부정 레이블이 존재한다. 이러한 긍정-부정 불균형은 최적화 과정을 지배하며, 학습 중 긍정 레이블의 기울기(gradient)가 과도하게 약화되는 결과를 초래할 수 있어 정확도가 저하된다. 본 논문에서는 긍정 샘플과 부정 샘플에 대해 다르게 작동하는 새로운 비대칭 손실(ASL, Asymmetric Loss)을 제안한다. 이 손실은 쉽게 예측 가능한 부정 샘플을 동적으로 가중치를 낮추고, 어려운 부정 샘플에 대해 하드 임계값(hard-thresholding)을 적용함으로써, 잘못 레이블링된 샘플도 제거할 수 있다. 우리는 ASL이 다양한 샘플의 확률을 균형 있게 조정할 수 있음을 보여주며, 이러한 균형 조정이 더 높은 mAP 점수로 이어진다는 점을 설명한다. ASL을 사용함으로써, MS-COCO, Pascal-VOC, NUS-WIDE, Open Images 등 다양한 인기 있는 다중 레이블 데이터셋에서 최신 기준(SOTA) 성능을 달성하였다. 또한 ASL이 단일 레이블 분류 및 객체 탐지와 같은 다른 작업에도 적용 가능함을 보여주었다. ASL은 효과적이며 구현이 간단하며, 학습 시간이나 계산 복잡도를 증가시키지 않는다.구현 코드는 다음에서 확인할 수 있다: https://github.com/Alibaba-MIIL/ASL.

비대칭 손실을 통한 다중 레이블 분류 | 최신 연구 논문 | HyperAI초신경