9일 전

MetaSAug: 장꼬리 시각 인식을 위한 메타 의미 증강

Shuang Li, Kaixiong Gong, Chi Harold Liu, Yulin Wang, Feng Qiao, Xinjing Cheng
MetaSAug: 장꼬리 시각 인식을 위한 메타 의미 증강
초록

실제 세계의 훈련 데이터는 일반적으로 긴 꼬리 분포(long-tailed distribution)를 보이며, 이는 일부 주요 클래스(majority classes)가 나머지 소수 클래스(minority classes)보다 훨씬 많은 샘플을 포함하고 있음을 의미한다. 이러한 불균형은 균형 잡힌 훈련 데이터를 가정한 전형적인 지도 학습 알고리즘의 성능을 저하시킨다. 본 논문에서는 최근 제안된 은유적 의미 데이터 증강(implicit semantic data augmentation, ISDA) 알고리즘을 활용하여 소수 클래스를 보강함으로써 이 문제를 해결한다. ISDA는 깊은 특징을 여러 의미적으로 유의미한 방향으로 변환함으로써 다양한 증강 샘플을 생성한다. 특히 ISDA는 클래스 조건부 통계를 추정하여 의미적 방향을 도출하지만, 소수 클래스의 경우 훈련 데이터가 부족하여 이러한 추정이 효과적이지 않다는 점을 발견하였다. 이를 해결하기 위해, 메타학습을 활용하여 변환된 의미적 방향을 자동으로 학습하는 새로운 접근법을 제안한다. 구체적으로, 훈련 중 증강 전략은 작은 균형 잡힌 검증 세트에서의 손실을 최소화하도록 동적으로 최적화되며, 이는 메타 업데이트 단계를 통해 근사된다. CIFAR-LT-10/100, ImageNet-LT, iNaturalist 2017/2018에서 수행한 광범위한 실험 결과를 통해 본 방법의 효과성을 입증하였다.

MetaSAug: 장꼬리 시각 인식을 위한 메타 의미 증강 | 최신 연구 논문 | HyperAI초신경