6 个月前

Chris Finlay Jörn-Henrik Jacobsen Levon Nurbekyan Adam M Oberman

摘要

在大规模数据集上训练神经微分方程（neural ODEs）长期以来面临挑战，其主要原因在于需要让自适应数值微分方程求解器将步长细化至极小值，这在实际中导致系统动态等效于数百甚至数千层的深度结构。本文通过提出一种具有理论依据的组合正则化方法，有效克服了这一难题：该方法结合了最优传输（optimal transport）与稳定性正则化，促使神经ODE在能够良好求解问题的所有动态中，优先选择更为简单的动态形式。更简单的动态不仅加速了收敛过程，还显著减少了求解器的离散化次数，从而大幅降低实际运行时间，同时不损失模型性能。我们的方法使基于神经ODE的生成模型能够达到与未加正则化动态相当的性能水平，且训练时间显著缩短。这一进展使神经ODE在大规模实际应用中的可行性得到了实质性提升。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

Chris Finlay Jörn-Henrik Jacobsen Levon Nurbekyan Adam M Oberman

摘要

在大规模数据集上训练神经微分方程（neural ODEs）长期以来面临挑战，其主要原因在于需要让自适应数值微分方程求解器将步长细化至极小值，这在实际中导致系统动态等效于数百甚至数千层的深度结构。本文通过提出一种具有理论依据的组合正则化方法，有效克服了这一难题：该方法结合了最优传输（optimal transport）与稳定性正则化，促使神经ODE在能够良好求解问题的所有动态中，优先选择更为简单的动态形式。更简单的动态不仅加速了收敛过程，还显著减少了求解器的离散化次数，从而大幅降低实际运行时间，同时不损失模型性能。我们的方法使基于神经ODE的生成模型能够达到与未加正则化动态相当的性能水平，且训练时间显著缩短。这一进展使神经ODE在大规模实际应用中的可行性得到了实质性提升。

源 PDF 查看代码

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供