2달 전

동적 소수 샷 시각적 학습을 위한 망각 방지 방법

Spyros Gidaris; Nikos Komodakis
동적 소수 샷 시각적 학습을 위한 망각 방지 방법
초록

인간 시각 시스템은 몇 개의 예시만으로도 새로운 개념을 쉽게 학습할 수 있는 뛰어난 능력을 가지고 있습니다. 이와 같은 행동을 기계 학습 비전 시스템에서 모방하는 것은 실제 세계 비전 응용 프로그램에 많은 실질적인 이점을 제공하는 흥미롭고 매우 도전적인 연구 문제입니다. 이러한 맥락에서, 우리의 연구 목표는 테스트 시간 동안 단지 몇 개의 훈련 데이터로 새로운 범주를 효율적으로 학습하면서 동시에 초기 훈련된 범주(이하 기본 범주라고 함)를 잊지 않는 소수 샘플 비전 학습 시스템을 설계하는 것입니다. 이를 달성하기 위해 우리는 (a) 객체 인식 시스템을 주의 메커니즘 기반 소수 샘플 분류 가중치 생성기로 확장하고, (b) ConvNet 모델의 분류기를 특징 표현과 분류 가중치 벡터 간의 코사인 유사도 함수로 재설계하는 것을 제안합니다. 후자는 새로운 범주와 기본 범주의 인식을 통합하는 것뿐만 아니라 "비본" 범주에 대해 더 잘 일반화되는 특징 표현을 생성하기도 합니다. 우리는 Mini-ImageNet에서 우리의 접근 방식을 철저히 평가하여 소수 샘플 인식에서 이전 최신 연구보다 성능을 개선했습니다(즉, 1-shot 설정에서는 56.20%, 5-shot 설정에서는 73.00%를 달성했습니다). 또한, 대부분의 이전 접근 방식이 결여하고 있는 기본 범주의 정확성을 희생하지 않았습니다. 마지막으로, 우리는 최근 Bharath와 Girshick [4]가 소개한 소수 샘플enchmark에 우리의 접근 방식을 적용하여 최신 연구 결과를 달성했습니다. 본 논문의 코드와 모델은 다음 주소에서 공개될 예정입니다: https://github.com/gidariss/FewShotWithoutForgetting참고 사항:- "unseen"은 "비본"으로 번역되었습니다.- "few-shot benchmark of Bharath and Girshick [4]"은 "Bharath와 Girshick [4]가 소개한 소수 샘플enchmark"로 번역되었습니다.- "state-of-the-art"은 "최신 연구"로 번역되었습니다.