11일 전

소수 샘플 클래스 증강 학습을 위한 신경 붕괴 유도 특성-분류기 일치

{DaCheng Tao, Philip Torr, Zhouchen Lin, Xiangtai Li, Haobo Yuan, Yibo Yang}
소수 샘플 클래스 증강 학습을 위한 신경 붕괴 유도 특성-분류기 일치
초록

소수 샘플 증강 학습(Few-shot Class-Incremental Learning, FSCIL)은 새로운 세션에서 각 새로운 클래스에 대해 매우 제한된 학습 샘플만 제공되므로 도전적인 문제로 남아 있다. 기존 세션에서 학습된 백본을 미세조정하거나 분류기 프로토타입을 조정하는 것은 오래된 클래스의 특징과 분류기 간의 일치성 오류를 피할 수 없으며, 이는 잘 알려진 치명적인 망각(catastrophic forgetting) 문제를 설명한다. 본 논문에서는 최근 발견된 신경 붕괴(nerual collapse) 현상에 영감을 받아 FSCIL에서 발생하는 이러한 일치성 오류 문제를 해결한다. 신경 붕괴는 동일한 클래스의 마지막 층 특징들이 하나의 꼭짓점으로 수렴하며, 모든 클래스의 꼭짓점들이 분류기 프로토타입과 일치하게 정렬되어 등각 단순형(ETF, equiangular tight frame)을 형성함을 보여준다. 이는 피셔 판별 비율(Fisher Discriminant Ratio)을 최대화함으로써 분류에 최적의 기하학적 구조를 제공한다. 우리는 신경 붕괴의 특성을 활용한 FSCIL을 위한 새로운 프레임워크를 제안한다. 전체 레이블 공간(기본 세션 및 모든 증강 세션 포함)에 대해 사전에 단순형 ETF를 갖는 일련의 분류기 프로토타입을 할당한다. 학습 과정에서는 분류기 프로토타입을 학습 가능한 파라미터로 취급하지 않고, 특징이 각각의 프로토타입으로 수렴하도록 유도하는 새로운 손실 함수를 도입한다. 이론적 분석을 통해 제안하는 방법이 신경 붕괴의 최적성 조건을 유지하며, 증강 학습 방식에서도 특징과 분류기 간의 일치성을 깨지 않음을 입증하였다. miniImageNet, CUB-200, CIFAR-100 데이터셋에서 수행한 실험 결과, 제안하는 프레임워크가 기존 최고 성능을 초월함을 확인하였다. 코드는 공개 예정이다.

소수 샘플 클래스 증강 학습을 위한 신경 붕괴 유도 특성-분류기 일치 | 최신 연구 논문 | HyperAI초신경