추론 기반 소수 샘플 학습의 현실적인 평가

전달 추론(Transductive inference)은 소수 샘플 학습(few-shot learning)에서 널리 사용되며, 소수 샘플 작업의 레이블이 없는 쿼리 세트의 통계 정보를 활용함으로써, 그 인덕티브(inductive) 대응 방식보다 훨씬 뛰어난 성능을 보이는 경우가 많다. 현재의 소수 샘플 벤치마크는 추론 시 완전히 클래스 균형(class-balanced)된 작업을 사용하고 있다. 그러나 우리는 이러한 인위적인 균형이 현실적이지 않다고 주장한다. 왜냐하면 이는 테스트 샘플의 주변 레이블 확률이 알려져 있고 균일 분포(uniform distribution)로 고정되어 있다고 가정하기 때문이다. 실제로 현실적인 상황에서는 레이블이 없는 쿼리 세트가 임의의, 그리고 알 수 없는 클래스 주변 확률을 가질 수 있다. 본 연구에서는 소수 샘플 작업의 쿼리 세트 내에서 임의의 클래스 분포를 도입하고, 이를 통해 클래스 균형이라는 인위적 편향을 제거한다. 구체적으로, 클래스의 주변 확률을 디리클레(Dirichlet) 분포를 따르는 랜덤 변수로 모델링함으로써 단순체(simplex) 내에서 원칙적이고 현실적인 샘플링을 가능하게 한다. 이 방법은 기존의 소수 샘플 벤치마크를 활용하여 임의의 클래스 분포를 가진 테스트 작업을 구성할 수 있다. 우리는 3개의 대표적인 데이터셋에서 최첨단 전달 추론 방법들을 실험적으로 평가한 결과, 놀랍게도 성능이 상당히 저하되는 현상을 관찰하였으며, 일부 경우에서는 인덕티브 방법보다도 성능이 낮아지는 결과도 나타났다. 또한, $α$-발산(α-divergences) 기반의 상호정보량 손실(mutual-information loss)의 일반화된 형태를 제안한다. 이는 클래스 분포의 변동을 효과적으로 다룰 수 있다. 실험적으로, 제안한 전달 추론 기반의 $α$-발산 최적화가 여러 데이터셋, 모델, 소수 샘플 설정에서 최첨단 기법들을 초월하는 성능을 보임을 입증하였다. 본 연구의 코드는 공개되어 있으며, https://github.com/oveilleux/Realistic_Transductive_Few_Shot 에서 확인할 수 있다.