11일 전

SHOT-VAE: 레이블 인지 ELBO 근사 기반의 반감독 딥 생성 모델

Hao-Zhe Feng, Kezhi Kong, Minghao Chen, Tianye Zhang, Minfeng Zhu, Wei Chen
SHOT-VAE: 레이블 인지 ELBO 근사 기반의 반감독 딥 생성 모델
초록

반감독 학습 변분 오토인코더(Variational Autoencoders, VAEs)는 우수한 성과를 거두었지만, 뛰어난 ELBO(Expectation Lower BOund) 값이 항상 정확한 추론 결과를 보장하지는 않는 문제에 직면해 있다. 본 논문에서는 이 문제의 두 가지 원인을 탐구하고 제안한다: (1) ELBO 목적함수는 레이블 정보를 직접 활용할 수 없다는 점, (2) ELBO 값에 대한 최적화가 특정 한계점 이후에도 지속될 경우 추론 정확도 향상이 이루어지지 않는 ' bottleneck 현상'이 존재한다는 점이다. 실험 결과를 바탕으로, 추가적인 사전 지식 없이도 이러한 문제를 해결할 수 있는 SHOT-VAE를 제안한다. SHOT-VAE는 다음과 같은 두 가지 기여를 한다: (1) 레이블 예측 손실을 ELBO에 통합한 새로운 ELBO 근사 기법인 smooth-ELBO를 제안한다. (2) 최적 보간법 기반의 근사 방식을 도입하여, ELBO와 데이터 가능도 사이의 간격을 줄여 ELBO 값의 한계를 극복한다. SHOT-VAE는 CIFAR-100에서 10,000개의 레이블을 사용할 때 25.30%의 오차율을 달성하며, CIFAR-10에서는 4,000개의 레이블로 6.11%의 오차율까지 감소시켰다.

SHOT-VAE: 레이블 인지 ELBO 근사 기반의 반감독 딥 생성 모델 | 최신 연구 논문 | HyperAI초신경