
초록
의미 기술자 기반 일반화된 제로샷 학습(GZSL)은 테스트 단계에서 새로운 클래스를 인식하는 데 있어 도전 과제를 안고 있다. 최근 생성 모델의 발전으로 인해 기존의 GZSL 기법들은 의미-시각적 연결에 더 깊이 관여할 수 있게 되었으며, 생성기(generator)와 분류기(classifier)를 포함하는 이단계 구조로 발전하였다. 그러나 기존의 생성 기반 방법들은 생성기의 성능 향상에만 초점을 맞추며 분류기의 개선을 간과하고 있다. 본 논문에서는 생성된 가상의 미관측 샘플의 두 가지 성질인 편향(bias)과 동질성(homogeneity)을 처음으로 분석한다. 이후 변분 베이지안 추론을 통해 평가 지표를 역추론하여, 관측된 클래스와 미관측 클래스 간의 균형을 반영한다. 이러한 추론의 결과로, 앞서 언급한 두 가지 성질이 로짓 조정(logit adjustment)을 통해 분류기 학습 과정에 관측-미관측 사전(prior)으로 통합된다. 제로샷 로짓 조정(Zero-Shot Logit Adjustment)은 생성 기반 GZSL 환경에서 의미 기반 분류기의 효과를 더욱 극대화한다. 실험 결과, 제안한 기법은 기본 생성기와 결합했을 때 최신 기술 수준을 달성하며, 다양한 생성 기반 제로샷 학습 프레임워크의 성능을 향상시킬 수 있음을 입증하였다. 본 논문의 코드는 https://github.com/cdb342/IJCAI-2022-ZLA 에서 공개되어 있다.