7 个月前

计算机视觉

Ricky T. Q. Chen; Jens Behrmann; David Duvenaud; Jörn-Henrik Jacobsen

摘要

基于流的生成模型通过可逆变换参数化概率分布，并可以通过最大似然方法进行训练。可逆残差网络提供了一类灵活的变换，其中只需满足Lipschitz条件而非严格的架构约束即可保证可逆性。然而，先前的研究在使用可逆残差网络进行密度估计时依赖于有偏的对数密度估计，这些估计的偏差随着网络表达能力的增强而增加。我们提出了一种利用“俄罗斯轮盘”估计器的对数密度无偏估计方法，并通过使用替代的无穷级数来计算梯度，从而减少了训练过程中所需的内存。此外，我们通过引入避免导数饱和的激活函数以及将Lipschitz条件推广到诱导混合范数，改进了可逆残差块。所提出的这种方法称为残差流（Residual Flows），在基于流的模型中实现了最先进的密度估计性能，并且在联合生成和判别建模方面优于使用耦合块的网络。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

Ricky T. Q. Chen; Jens Behrmann; David Duvenaud; Jörn-Henrik Jacobsen

摘要

基于流的生成模型通过可逆变换参数化概率分布，并可以通过最大似然方法进行训练。可逆残差网络提供了一类灵活的变换，其中只需满足Lipschitz条件而非严格的架构约束即可保证可逆性。然而，先前的研究在使用可逆残差网络进行密度估计时依赖于有偏的对数密度估计，这些估计的偏差随着网络表达能力的增强而增加。我们提出了一种利用“俄罗斯轮盘”估计器的对数密度无偏估计方法，并通过使用替代的无穷级数来计算梯度，从而减少了训练过程中所需的内存。此外，我们通过引入避免导数饱和的激活函数以及将Lipschitz条件推广到诱导混合范数，改进了可逆残差块。所提出的这种方法称为残差流（Residual Flows），在基于流的模型中实现了最先进的密度估计性能，并且在联合生成和判别建模方面优于使用耦合块的网络。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供