7日前

Efficient-VDVAE:少即是多

Louay Hazami, Rayhane Mama, Ragavan Thurairatnam
Efficient-VDVAE:少即是多
要約

近年、階層的VAE(Hierarchical VAEs)は最尤推定における信頼性の高い選択肢として注目されている。しかし、安定性の問題や高い計算資源の要求により、この分野の研究進展が阻害されてきた。本研究では、非常に深層なVAE(Very Deep VAE, VDVAE)に対して単純な修正を加えることで、学習の収束速度を最大で2.6倍に向上させ、メモリ使用量を最大20倍削減しつつ、訓練中の安定性も向上させることに成功した。これらの変更にもかかわらず、評価した7つの一般的な画像データセットすべてにおいて、現行の最先端モデルと同等あるいはより優れた負の対数尤度(negative log-likelihood)性能を達成した。また、5ビット量子化による不適切なバイアスの影響を考慮し、階層的VAEの性能評価に5ビットベンチマークを使用することに対して反論を展開した。さらに、実証的に、階層的VAEの潜在空間の約3%の次元数だけで、画像情報の大部分を損失なく表現できることを示した。これにより、下流タスクにおいて階層的VAEの潜在空間を効率的に活用する道が開かれた。本研究で開発したソースコードおよびモデルは、https://github.com/Rayhane-mamah/Efficient-VDVAE にて公開している。