3달 전

잠재적 카테고리로부터 학습을 통한 긴 꼬리 인식

Weide Liu, Zhonghua Wu, Yiming Wang, Henghui Ding, Fayao Liu, Jie Lin, Guosheng Lin
잠재적 카테고리로부터 학습을 통한 긴 꼬리 인식
초록

본 연구에서는 장꼬리 이미지 인식이라는 도전적인 과제에 대응한다. 기존의 장꼬리 인식 방법들은 주로 꼬리 클래스(tail classes)에 대한 데이터 증강 또는 재균형 전략에 초점을 맞추어 모델 학습 과정에서 꼬리 클래스에 더 많은 주의를 기울이려 했다. 그러나 꼬리 클래스의 학습 이미지 수가 제한적이기 때문에, 꼬리 클래스 이미지의 다양성은 여전히 제한되어 있으며, 이로 인해 특징 표현이 부정확해지는 문제가 발생한다. 본 연구에서는 머리 클래스(head classes)와 꼬리 클래스 간에 공통적으로 존재하는 잠재적 특징( latent features)을 활용하면 더 나은 특징 표현이 가능할 것이라 가정한다. 이러한 통찰에 기반하여, 잠재적 카테고리 기반의 장꼬리 인식(Latent Categories based long-tail Recognition, LCReg) 방법을 제안한다. 구체적으로, 머리 클래스와 꼬리 클래스 간에 공유되는 클래스 무관(class-agnostic) 잠재적 특징을 학습하는 방식을 제안한다. 이후, 잠재적 특징에 의미 기반 데이터 증강(semantic data augmentation)을 적용하여 훈련 샘플의 다양성을 간접적으로 풍부하게 한다. 다섯 개의 장꼬리 이미지 인식 데이터셋에 대한 광범위한 실험 결과, 제안하는 LCReg 방법이 기존 방법들을 상당히 능가하며 최신 기술 수준(state-of-the-art)의 성능을 달성함을 입증하였다.