10일 전

긴 꼬리 다중 레이블 이미지 분류를 위한 확률 가이드 손실

{Dekun Lin}
초록

최근 몇 년간 긴 꼬리(long-tailed) 학습에 대한 관심이 점차 증가하고 있다. 특히 긴 꼬리 다중 레이블 이미지 분류는 그 중 하나의 하위 과제이며, 여전히 도전적이며 연구가 부족한 상태이다. 본 논문에서는 이 문제를 확률(probability)의 관점에서 새롭게 접근한다. 구체적으로, 기존의 긴 꼬리 다중 레이블 분류를 위한 비용 감지(cost-sensitive) 학습 방법은 학습 과정에서 긍정 레이블과 부정 레이블의 예측 확률에 각각 다른 정도로 영향을 미친다는 점을 발견하였다. 이러한 확률 변화 과정의 차이는 최종 성능에 직접적인 영향을 미친다. 따라서 우리는 이러한 과정을 제어할 수 있도록 두 가지 구성 요소를 포함하는 확률 유도(loss)를 제안한다. 첫 번째는 확률 재균형(probability re-balancing)으로, 학습 시 확률의 변화 과정을 유연하게 조절할 수 있다. 두 번째는 적응형 확률 인식(focal) 항목으로, 긍정 레이블과 부정 레이블 간의 확률 차이를 추가로 줄이는 데 기여한다. 제안한 방법은 두 개의 긴 꼬리 다중 레이블 이미지 분류 데이터셋인 VOC-LT와 COCO-LT에서 광범위한 실험을 통해 검증되었으며, 실험 결과는 본 전략의 타당성과 우수성을 입증한다.