6 个月前

Harsh Rangwani Sumukh K Aithal Mayank Mishra R. Venkatesh Babu

摘要

现实世界的数据集普遍存在不同类型和程度的类别不平衡问题。为提升神经网络在少数类上的性能，通常采用基于损失重加权和边界调整的技术。本文通过分析采用重加权与基于边界技术训练的神经网络的损失景观（loss landscape），深入研究了类别不平衡学习问题。具体而言，我们考察了各类别损失的Hessian矩阵的谱密度，发现网络权重在少数类的损失景观中会收敛至鞍点（saddle point）。基于这一观察，我们进一步发现，旨在逃离鞍点的优化方法可有效提升少数类的泛化性能。我们从理论和实验两个层面进一步证明，近期提出的Sharpness-Aware Minimization（SAM）方法——该方法通过引导模型收敛至平坦的极小值点，能够有效帮助模型逃离少数类的鞍点。实验结果表明，相较于当前最先进的Vector Scaling Loss方法，采用SAM在少数类上的准确率提升了6.2%，在各类不平衡数据集上的整体平均准确率也提升了4%。相关代码已公开，地址为：https://github.com/val-iisc/Saddle-LongTail。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

Harsh Rangwani Sumukh K Aithal Mayank Mishra R. Venkatesh Babu

摘要

现实世界的数据集普遍存在不同类型和程度的类别不平衡问题。为提升神经网络在少数类上的性能，通常采用基于损失重加权和边界调整的技术。本文通过分析采用重加权与基于边界技术训练的神经网络的损失景观（loss landscape），深入研究了类别不平衡学习问题。具体而言，我们考察了各类别损失的Hessian矩阵的谱密度，发现网络权重在少数类的损失景观中会收敛至鞍点（saddle point）。基于这一观察，我们进一步发现，旨在逃离鞍点的优化方法可有效提升少数类的泛化性能。我们从理论和实验两个层面进一步证明，近期提出的Sharpness-Aware Minimization（SAM）方法——该方法通过引导模型收敛至平坦的极小值点，能够有效帮助模型逃离少数类的鞍点。实验结果表明，相较于当前最先进的Vector Scaling Loss方法，采用SAM在少数类上的准确率提升了6.2%，在各类不平衡数据集上的整体平均准确率也提升了4%。相关代码已公开，地址为：https://github.com/val-iisc/Saddle-LongTail。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供