6 个月前

摘要

词义消歧（Word Sense Disambiguation, WSD）模型呈现出多种不同的形式。尽管监督式模型在准确率方面通常表现最佳，但它们往往在实际应用中逊色于更具灵活性的知识驱动型解决方案，后者无需为每个消歧目标都由词义专家进行专门训练。为弥合这一差距，我们采用了一种新的视角，转而利用序列学习来构建消歧问题的框架：本文提出并深入研究了一系列专为该任务量身定制的端到端神经网络架构，涵盖双向长短期记忆网络（bidirectional LSTM）以及编码器-解码器（encoder-decoder）模型等。在多个语言上对标准基准数据集进行的广泛评估表明，序列学习能够实现更为通用的全词消歧模型，其性能持续达到当前最先进水平，即便在与依赖人工设计特征的词义专家模型相比时也表现出显著优势。

源 PDF