6 个月前

卷积神经网络

计算机视觉

Rahul Vigneswaran Marc T. Law Vineeth N. Balasubramanian Makarand Tapaswi

摘要

视觉世界中的物体或场景实例数量天然存在不平衡，呈现出一种长尾分布（long-tailed distribution）。这种分布对基于深度学习的分类模型构成了重大挑战。尽管通过过采样尾部类别（tail classes）的样本可缓解这一不平衡问题，但受限于视觉多样性不足，往往导致模型的表征能力下降。一种简单的应对策略是将表征网络与分类器网络解耦，并仅使用过采样来训练分类器部分。本文提出了一种新方向：不再重复采样同一图像（从而导致特征重复），而是通过估计尾部类别的分布，生成具有意义的新增特征。受近期少样本学习（few-shot learning）相关思想的启发，我们构建了校准后的类别分布，用于采样额外的特征，进而用于分类器的训练。在具有不同不平衡因子的CIFAR-100-LT（长尾）数据集以及mini-ImageNet-LT（长尾）数据集上的多项实验表明，所提方法具有显著有效性，并达到了新的最先进（state-of-the-art）性能。此外，我们通过t-SNE可视化对生成特征进行了定性分析，并深入研究了用于校准尾部类别分布的最近邻样本。本文代码已开源，地址为：https://github.com/rahulvigneswaran/TailCalibX。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Rahul Vigneswaran Marc T. Law Vineeth N. Balasubramanian Makarand Tapaswi

摘要

视觉世界中的物体或场景实例数量天然存在不平衡，呈现出一种长尾分布（long-tailed distribution）。这种分布对基于深度学习的分类模型构成了重大挑战。尽管通过过采样尾部类别（tail classes）的样本可缓解这一不平衡问题，但受限于视觉多样性不足，往往导致模型的表征能力下降。一种简单的应对策略是将表征网络与分类器网络解耦，并仅使用过采样来训练分类器部分。本文提出了一种新方向：不再重复采样同一图像（从而导致特征重复），而是通过估计尾部类别的分布，生成具有意义的新增特征。受近期少样本学习（few-shot learning）相关思想的启发，我们构建了校准后的类别分布，用于采样额外的特征，进而用于分类器的训练。在具有不同不平衡因子的CIFAR-100-LT（长尾）数据集以及mini-ImageNet-LT（长尾）数据集上的多项实验表明，所提方法具有显著有效性，并达到了新的最先进（state-of-the-art）性能。此外，我们通过t-SNE可视化对生成特征进行了定性分析，并深入研究了用于校准尾部类别分布的最近邻样本。本文代码已开源，地址为：https://github.com/rahulvigneswaran/TailCalibX。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供