17 天前

学习潜在空间分层EBM扩散模型

Jiali Cui, Tian Han
学习潜在空间分层EBM扩散模型
摘要

本研究探讨了基于能量的先验模型(energy-based prior model)与多层生成器模型(multi-layer generator model)的学习问题。多层生成器模型通常采用分层的自上而下结构,包含多层潜在变量,并假设其先验模型为高斯分布。然而,这种高斯先验模型在建模表达能力上存在局限,导致生成器后验分布与先验模型之间出现显著差异,这一现象被称为“先验空洞问题”(prior hole problem)。近期研究尝试将基于能量的模型(EBM)作为第二阶段的互补模型,以弥补该差距。然而,定义在多层潜在空间上的EBM往往具有高度多模态特性,使得从该边缘EBM先验中进行采样在实践中极具挑战性,从而导致EBM学习效果不佳。为应对这一难题,本文提出利用扩散概率框架(diffusion probabilistic scheme)来减轻EBM采样的负担,从而有效促进EBM的学习。大量实验结果表明,所提出的基于扩散学习的EBM先验模型在多项具有挑战性的任务中均展现出优越的性能。