18 天前

利用上下文信息增强无监督生成式依存句法分析器

{Kewei Tu, Yong Jiang, Wenjuan Han}
利用上下文信息增强无监督生成式依存句法分析器
摘要

大多数无监督依存句法分析器基于概率生成模型,这些模型旨在学习给定句子及其句法分析之间的联合分布。传统的概率生成模型通常显式地将目标依存树分解为因子化的语法规则,但这类方法缺乏对整个句子全局语境特征的建模能力。本文提出一种新型概率模型——带价态的判别性神经依存模型(Discriminative Neural Dependency Model with Valence, D-NDMV),该模型通过一个连续的潜在表示来生成句子及其句法分析,该潜在表示能够编码生成句子的全局上下文信息。我们提出了两种建模潜在表示的方法:第一种方法是确定性地从句子中汇总潜在表示;第二种方法则是基于句子条件概率地建模潜在表示。本方法可被视为一种新型的无监督依存句法分析自编码器模型,融合了生成式与判别式方法的优势。特别地,该方法打破了以往生成式方法中对上下文无关独立性的假设,因而具备更强的表达能力。在来自多个来源的十七个数据集上的大量实验结果表明,我们的方法在准确率上与当前最先进的生成式和判别式无监督依存句法分析器相比均表现出竞争力。