9 天前

长尾识别中的原型分类器学习

Saurabh Sharma, Yongqin Xian, Ning Yu, Ambuj Singh
长尾识别中的原型分类器学习
摘要

近年来,长尾识别(Long-Tailed Recognition, LTR)问题受到广泛关注,原因在于现实世界中物体的分布遵循基本的幂律分布。现有大多数LTR方法采用Softmax分类器,但这类分类器存在固有偏差:其分类器权重的范数与对应类别的训练数据量呈正相关,导致对尾部类别(即样本稀少的类别)识别性能下降。本文提出,通过学习原型分类器(Prototype Classifiers)可有效缓解Softmax分类器在LTR任务中的偏差问题。仅使用最近类均值(Nearest-Class-Mean, NCM)这一特殊情形——即原型为经验中心点(empirical centroids)——即可获得具有竞争力的识别性能。在此基础上,本文进一步提出一种联合学习原型的方法:将样本与原型在特征空间中的距离直接作为分类的logit得分,从而实现端到端的优化。此外,本文从理论上分析了基于欧氏距离的原型分类器所具备的性质,表明其能够支持稳定且对异常值具有鲁棒性的基于梯度的优化过程。为实现各通道独立的距离尺度调节,我们进一步引入通道依赖的温度参数(channel-dependent temperature parameters),以增强原型分类器的表达能力。理论与实验分析表明,原型分类器所学习得到的原型在特征空间中相比经验中心点具有更优的类间分离性。在四个主流长尾识别基准数据集上的实验结果表明,所提出的原型分类器在性能上优于或至少可媲美当前最先进的方法。相关代码已开源,地址为:https://github.com/saurabhsharma1993/prototype-classifier-ltr。

长尾识别中的原型分类器学习 | 最新论文 | HyperAI超神经