17일 전

다중 스케일 적응형 작업 주의력 네트워크를 활용한 소량 학습

Haoxing Chen, Huaxiong Li, Yaohui Li, Chunlin Chen
다중 스케일 적응형 작업 주의력 네트워크를 활용한 소량 학습
초록

소수 샘플 학습(few-shot learning)의 목적은 적은 수의 레이블된 샘플을 통해 미지의 카테고리들을 분류하는 것이다. 최근, 저수준 정보 메트릭 학습 기반의 방법들이 만족스러운 성능을 달성하고 있는데, 이는 보이는 클래스와 보이지 않는 클래스 간에 국소적 표현(Local Representations, LRs)이 더 일관성을 가지기 때문이다. 그러나 이러한 방법들의 대부분은 지지 세트(support set) 내 각 카테고리에 대해 독립적으로 처리하기 때문에, 특히 특정 작업에서 특징 간의 관계를 충분히 측정하지 못한다는 한계가 있다. 또한, 복잡한 배경에서 다양한 크기의 주도적 객체(dominant objects)가 존재할 경우, 저수준 정보 기반의 메트릭 학습 방법은 성능 저하를 겪는다. 이러한 문제를 해결하기 위해 본 논문은 소수 샘플 학습을 위한 새로운 다중 해상도 적응형 작업 주의망(Multi-scale Adaptive Task Attention Network, MATANet)을 제안한다. 구체적으로, 먼저 다중 해상도 특징 생성기(multi-scale feature generator)를 사용하여 다양한 해상도에서 특징을 생성한다. 그 후, 전체 작업 내에서 가장 중요한 LRs를 적응적으로 선택하는 적응형 작업 주의 모듈(adaptive task attention module)을 제안한다. 이후, 클래스별 유사도 모듈(similarity-to-class module)과 융합 레이어(fusion layer)를 활용하여 쿼리 이미지와 지지 세트 사이의 통합적 다중 해상도 유사도를 계산한다. 주요 벤치마크에서 실시한 광범위한 실험을 통해 제안하는 MATANet이 최신 기술 대비 뛰어난 성능을 보임을 명확히 입증하였다.

다중 스케일 적응형 작업 주의력 네트워크를 활용한 소량 학습 | 최신 연구 논문 | HyperAI초신경