11 天前

基于递归半马尔可夫模型的N元成分树解析

{Zeqi Tan, Jinlong Li, Xin Xin}
基于递归半马尔可夫模型的N元成分树解析
摘要

本文研究在未将句法树二叉化作为预处理步骤的设定下,基于图的成分句法分析任务,此时成分树中的节点可能具有超过两个子节点(即n元节点)。以往针对该设定的基于图的方法通常在n元节点内部引入带有虚拟标签的隐藏节点,以将原树转换为二叉树结构进行预测。然而,这种方法的局限在于,隐藏节点会破坏n元节点各子节点之间的兄弟关系,导致这些子成分之间的依赖关系无法被准确建模,甚至被忽略。为解决上述问题,本文提出一种新颖的基于图的框架——“递归半马尔可夫模型”(recursive semi-Markov model)。其核心思想是:利用一阶半马尔可夫模型预测某个成分候选节点的直接子节点序列,该序列随后递归地作为其父节点的子节点候选。通过这种方式,兄弟成分之间的依赖关系可通过一阶转移特征进行建模,从而有效克服了传统方法的缺陷。实验结果表明,所提出的框架在PTB和CTB 5.1数据集上的F1值分别达到95.92%和92.50%。特别地,在处理具有超过两个子节点的节点时,该模型展现出显著优势:在PTB数据集中,平均F1值提升0.3至1.1个百分点;在CTB 5.1数据集中,提升幅度达2.3至6.8个百分点。

基于递归半马尔可夫模型的N元成分树解析 | 最新论文 | HyperAI超神经