2 个月前

词义嵌入学习用于词义归纳

Linfeng Song; Zhiguo Wang; Haitao Mi; Daniel Gildea
词义嵌入学习用于词义归纳
摘要

传统的词语义项诱导(Word Sense Induction, WSI)方法通常使用离散的语义特征或共现特征来表示每个实例,并为每个多义词单独训练一个模型。在本研究中,我们提出了一种用于WSI任务的意义嵌入学习方法。在训练阶段,我们的方法为每个多义词诱导出多个意义中心点(嵌入)。在测试阶段,我们的方法将每个实例表示为上下文向量,并通过在嵌入空间中找到最近的意义中心点来确定其意义。该方法的优势在于:(1) 分布式意义向量作为知识表示,以区分性的方式进行训练,通常比传统的基于计数的分布模型具有更好的性能;(2) 在多任务学习框架下联合训练一个通用模型,以诱导整个词汇表的意义中心点。我们在SemEval-2010 WSI数据集上对所提出的方法进行了评估,结果表明该方法优于所有参赛者及大多数近期的先进方法。此外,我们通过与精心设计的基线模型进行对比进一步验证了这两个优势。

词义嵌入学习用于词义归纳 | 最新论文 | HyperAI超神经