17 天前

多源迁移依存句法分析的表示学习框架

{Ting Liu, Haifeng Wang, David Yarowsky, Wanxiang Che, Jiang Guo}
摘要

跨语言模型迁移已成为在缺乏标注语料库(如句法树库)的低资源语言中构建依存句法分析器的一种有前景的方法。该方法面临两大主要挑战:其一,词汇特征在不同语言间难以直接迁移;其二,目标语言特有的句法结构难以有效恢复。为应对上述挑战,本文提出一种新颖的多源迁移句法分析表示学习框架。该框架可直接利用完整的词汇特征实现多源迁移分析。在 Google 通用依存树库(v2.0)上的实验结果表明,我们提出的最优模型在平均带标签依存弧准确率(Labeled Attachment Score)上相比去词汇化(delexicalized)的多源迁移模型实现了 6.53% 的绝对提升,显著优于近期提出的最先进迁移系统。

多源迁移依存句法分析的表示学习框架 | 最新论文 | HyperAI超神经