2 个月前

可逆残差网络

Jens Behrmann; Will Grathwohl; Ricky T. Q. Chen; David Duvenaud; Jörn-Henrik Jacobsen
可逆残差网络
摘要

我们证明了标准的残差网络(ResNet)架构可以被设计为可逆的,从而允许同一模型用于分类、密度估计和生成任务。通常情况下,实现可逆性需要对维度进行划分或限制网络架构。相比之下,我们的方法仅需在训练过程中添加一个简单的归一化步骤,而这一步骤已经在标准框架中可用。可逆残差网络定义了一个生成模型,该模型可以通过最大似然估计在未标记数据上进行训练。为了计算似然值,我们引入了一种计算残差块雅可比行列式对数的可行近似方法。我们的实证评估表明,可逆残差网络在图像分类和基于流的生成模型方面均表现出与当前最先进的模型相当的性能,这是此前单一架构未能实现的。

可逆残差网络 | 最新论文 | HyperAI超神经