17일 전

다양한 도메인 간 소수 샘플 학습에 대한 보다 포괄적인 연구

Yunhui Guo, Noel C. Codella, Leonid Karlinsky, James V. Codella, John R. Smith, Kate Saenko, Tajana Rosing, Rogerio Feris
다양한 도메인 간 소수 샘플 학습에 대한 보다 포괄적인 연구
초록

최근 소수 샘플 학습(few-shot learning)의 진전은 메타학습(meta-learning)을 위한 레이블링된 데이터에 크게 의존하고 있으며, 이는 새로운 클래스(new class)와 동일한 도메인에서 샘플링된 기본 클래스(base class)를 기반으로 한다. 그러나 많은 응용 분야에서는 메타학습을 위한 데이터 수집이 불가능하거나 현실적으로 어렵다. 이로 인해 기본 클래스와 새로운 클래스 간 도메인 간 큰 차이가 존재하는 ‘교차 도메인 소수 샘플 학습(cross-domain few-shot learning)’ 문제로 이어진다. 현재까지 교차 도메인 소수 샘플 학습 시나리오에 대한 연구는 존재하지만, 이러한 연구들은 여전히 시각적으로 높은 유사성을 유지하는 자연 이미지(natural images)에 국한되어 있다. 실세계에서 흔히 볼 수 있는 다양한 영상 촬영 방법, 예를 들어 항공 영상과 의료 영상 간의 소수 샘플 학습에 관한 연구는 아직 존재하지 않는다. 본 논문에서는 다양한 영상 촬영 방법에서 얻은 이미지 데이터를 포함하는 ‘교차 도메인 소수 샘플 학습의 보다 광범위한 연구(Broader Study of Cross-Domain Few-Shot Learning, BSCD-FSL)’ 벤치마크를 제안한다. 이 벤치마크는 농작물 병해충 이미지와 같은 자연 이미지 외에도, 자연 이미지와 점점 더 큰 이질성을 보이는 위성 영상, 피부과 영상, 방사선 영상 등 다양한 영상 유형을 포함한다. 제안된 벤치마크를 기반으로 최신 메타학습 기법, 전이학습 기법, 그리고 교차 도메인 소수 샘플 학습을 위한 최신 방법들을 평가하기 위해 광범위한 실험을 수행하였다. 실험 결과, 최신 메타학습 기법이 예상보다 뒤처진 성능을 보였으며, 모든 메타학습 기법은 단순한 미세 조정(fine-tuning)에 비해 평균 12.8%의 정확도에서 떨어졌다. 기존에 교차 도메인 소수 샘플 학습에 특화된 방법들에서 관찰되었던 성능 향상은 이보다 더 도전적인 벤치마크에서는 사라졌다. 마지막으로, 모든 방법의 정확도는 데이터셋이 자연 이미지와 얼마나 유사한지에 따라 상관관계를 보였으며, 이는 본 벤치마크가 실제 적용 환경에서 관찰되는 데이터의 다양성을 더 잘 반영하고, 향후 연구 방향을 안내하는 데 가치가 있음을 입증한다.

다양한 도메인 간 소수 샘플 학습에 대한 보다 포괄적인 연구 | 최신 연구 논문 | HyperAI초신경