
摘要
现有大多数文本分类方法致力于提取具有高度判别性的文本表示,然而这类方法通常计算效率较低。为缓解这一问题,标签嵌入(label embedding)框架被提出,通过引入标签到文本的注意力机制,直接利用标签信息构建文本表示,从而实现更高效的文本分类。尽管这些标签嵌入方法已取得令人瞩目的成果,但在如何更有效地利用标签信息方面仍有较大探索空间。本文旨在通过进一步构建文本感知的标签表示(text-attended label representation),借助文本到标签的注意力机制,更充分地挖掘标签信息。为此,我们提出了一种融合标签嵌入的共注意力网络(Coattention Network with Label Embedding, CNLE),该模型能够联合编码文本与标签,生成彼此相互关注的表示。在此机制下,模型可同时关注文本与标签中相关的关键部分。实验结果表明,相较于先前的最先进方法,本方法在7个多分类基准数据集和2个多标签分类基准数据集上均取得了具有竞争力的性能表现。