摘要
在多标签文本分类(Multi-Label Text Classification, MLTC)任务中,一个样本可以同时属于多个类别。观察发现,大多数MLTC任务中,标签之间存在依赖关系或相关性,但现有方法往往忽视了标签间的这种关联。为此,本文提出一种基于图注意力网络(Graph Attention Network, GAT)的模型,以捕捉标签之间的注意力依赖结构。该模型利用特征矩阵和相关性矩阵,有效建模并探索标签间的关键依赖关系,并据此生成适用于分类任务的分类器。所生成的分类器作用于由文本特征提取网络(BiLSTM)提取的句子特征向量,从而实现端到端的训练。通过注意力机制,系统能够为每个标签的邻接节点分配不同的权重,从而隐式地学习标签之间的依赖关系。在五个真实世界MLTC数据集上的实验结果表明,所提出的模型在性能上达到或优于先前的最先进模型。