2 个月前

半监督神经模型词语义消歧

Dayu Yuan; Julian Richardson; Ryan Doherty; Colin Evans; Eric Altendorf
半监督神经模型词语义消歧
摘要

确定文本中词语的意图含义——词语义消歧(Word Sense Disambiguation, WSD)——是自然语言处理领域的一个长期问题。近期,研究人员在WSD算法中使用从神经网络语言模型中提取的词向量作为特征,取得了令人鼓舞的结果。然而,对文本中的每个词向量进行简单的平均或拼接会丢失文本的顺序和句法信息。本文研究了使用序列学习神经网络LSTM来更好地捕捉文本的顺序和句法模式的WSD方法。为了缓解全词语WSD训练数据不足的问题,我们采用了半监督标签传播分类器中的同一LSTM模型。实验结果表明,该方法在动词上的表现尤为出色,达到了当前最佳水平。

半监督神经模型词语义消歧 | 最新论文 | HyperAI超神经