HyperAIHyperAI

Command Palette

Search for a command to run...

通过组谱正则化提升GAN在长尾数据上的性能

Harsh Rangwani Naman Jaswani Tejan Karmali Varun Jampani R. Venkatesh Babu

摘要

深度长尾学习旨在针对现实世界中普遍存在的数据分布不平衡问题,训练出具有实用价值的深度神经网络,其中尾部类别(tail classes)的样本数量极为稀少。尽管已有大量研究致力于在长尾分布上训练具有判别能力的视觉识别模型,但本文的研究目标则聚焦于在长尾分布上训练条件生成对抗网络(conditional Generative Adversarial Networks, cGANs)——一类图像生成模型。我们发现,与图像识别任务类似,当前最先进的图像生成方法在尾部类别上同样面临性能下降的问题。这种性能退化主要源于尾部类别特有的模式崩溃(mode collapse)现象,而我们观察到该现象与条件参数矩阵的谱爆炸(spectral explosion)存在显著相关性。为此,本文提出一种新颖的分组谱正则化方法(group Spectral Regularizer, gSR),通过抑制条件参数矩阵的谱爆炸,有效缓解了模式崩溃问题,从而在尾部类别上也能生成多样且逼真的图像。实验表明,gSR能够与现有的数据增强与正则化技术良好结合,显著提升长尾数据上的图像生成性能,达到当前最优水平。大量实验证明,所提出的正则化方法在不同不平衡程度的长尾数据集上均展现出卓越的有效性。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供