11일 전
부분 레이블이 있는 다중 레이블 분류를 위한 클래스 인지 선택적 손실
Emanuel Ben-Baruch, Tal Ridnik, Itamar Friedman, Avi Ben-Cohen, Nadav Zamir, Asaf Noy, Lihi Zelnik-Manor

초록
대규모 다중 레이블 분류 데이터셋은 일반적으로 또는 어쩌면 피할 수 없이 부분적으로 레이블이 매겨진 상태로 제공된다. 즉, 각 샘플에 대해 전체 레이블 중 일부만 레이블링되어 있다. 누락된 레이블을 처리하는 다양한 방법들은 모델에 서로 다른 성질을 부여하며, 이는 모델의 정확도에 영향을 미친다. 본 연구에서는 부분 레이블링 문제를 분석한 후, 두 가지 핵심 아이디어를 기반으로 한 해결책을 제안한다. 첫째, 레이블링되지 않은 레이블은 전체 데이터셋의 클래스 분포와 특정 데이터 샘플에 대한 특정 레이블의 가능성을 기반으로 선택적으로 다뤄야 한다. 우리는 전용 임시 모델을 사용하여 클래스 분포를 추정하는 방법을 제안하며, 이 방법이 데이터셋의 부분 레이블링 정보를 직접 활용한 단순 추정 방식보다 더 높은 효율성을 보임을 보여준다. 둘째, 타깃 모델 학습 과정에서, 기존에 레이블링되지 않은 레이블보다 레이블링된 레이블의 기여도를 강조하기 위해 특별히 설계된 비대칭 손실 함수를 사용한다. 제안하는 새로운 접근 방식을 통해 OpenImages 데이터셋에서 최신 기준(SOTA) 성능을 달성하였으며(예: V6에서 87.3 mAP 달성), LVIS 및 시뮬레이션 기반 COCO 데이터셋에서의 실험을 통해 본 방법의 효과성을 입증하였다. 코드는 https://github.com/Alibaba-MIIL/PartialLabelingCSL 에 공개되어 있다.