11 天前

基于序列到序列学习的方面词项抽取研究

{Xing Xie, Dehong Ma, Houfeng Wang, Fangzhao Wu, Sujian Li}
基于序列到序列学习的方面词项抽取研究
摘要

方面词抽取(Aspect Term Extraction, ATE)旨在识别句子中的所有方面词,通常被建模为序列标注问题。然而,基于序列标注的方法难以充分利用整个句子的全局语义信息,且在处理标签间依赖关系方面存在局限性。为解决上述问题,本文首次尝试将ATE形式化为序列到序列(Sequence-to-Sequence, Seq2Seq)学习任务,其中源序列由词语构成,目标序列由标签构成。同时,为使Seq2Seq学习更适用于ATE任务中标签与词语一一对应的关系,本文设计了门控单元网络(gated unit networks),将对应的词表示信息引入解码器;并提出位置感知注意力机制(position-aware attention),使模型能够更加关注目标词邻近的上下文词语。在两个公开数据集上的实验结果表明,结合所提出的门控单元网络与位置感知注意力机制,Seq2Seq学习在方面词抽取任务中具有良好的有效性。

基于序列到序列学习的方面词项抽取研究 | 最新论文 | HyperAI超神经