HyperAIHyperAI

Command Palette

Search for a command to run...

Fishr:用于分布外泛化的不变梯度方差

Alexandre Rame Corentin Dancette Matthieu Cord

摘要

在数据分布发生变化的条件下,学习具备强鲁棒性且泛化能力优异的模型,对于真实世界的应用至关重要。为此,近年来研究者们日益关注如何从多个训练域中同时学习,同时在不同域之间施加各类不变性约束。然而,现有方法在受控评估协议下均未能展现出系统性的优势。本文提出一种新型正则化方法——Fishr,该方法在损失函数梯度空间中强制实现域不变性:具体而言,通过匹配不同训练域间梯度的域级方差,实现对梯度分布的一致性约束。我们的方法基于梯度协方差、Fisher信息矩阵与损失函数Hessian矩阵之间的紧密联系,尤其证明了Fishr最终将在模型最终权重附近局部对齐各域的损失景观。大量实验结果表明,Fishr在分布外泛化任务中具有显著有效性。值得注意的是,Fishr在DomainBed基准测试中超越了现有最优方法,并始终优于传统的经验风险最小化(Empirical Risk Minimization)策略。相关代码已开源,地址为:https://github.com/alexrame/fishr


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供