9 天前

HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络

{Yanming Ye, Fumiyo Fukumoto, Jiyi Li, Wenshuo Yang}
HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络
摘要

数据不平衡问题是多标签文本分类中一个关键挑战。尽管已有部分研究通过提出非平衡损失函数来替代传统的交叉熵损失以应对该问题,但在极端不平衡数据场景下,其性能仍存在局限。为此,我们提出一种混合解决方案:针对头部类别(高频类别)采用通用网络架构,针对尾部类别(低频类别)则引入少样本学习技术。我们进一步提出一种混合式孪生卷积神经网络(Hybrid-Siamese Convolutional Neural Network, HSCNN),并赋予其若干关键技术特性,包括基于单网络与孪生网络的多任务架构、孪生结构中针对类别特异性的相似性建模机制,以及专为训练HSCNN设计的特定采样策略。在两个基准数据集和三种损失函数下的实验结果表明,所提方法能够显著提升单一网络在尾部类别及全类别上的分类性能,且适用于多种损失函数配置。

HSCNN:一种用于极端不平衡多标签文本分类的混合孪生卷积神经网络 | 最新论文 | HyperAI超神经