
摘要
本文提出通过改进AMR解析器中的两个核心组件——概念识别与词元到概念的对齐——来突破AMR解析的瓶颈。首先,我们构建了一个基于双向LSTM的概念识别模块,该模块能够利用更丰富的上下文信息,从而有效学习稀疏的AMR概念标签。随后,我们对基于隐马尔可夫模型(HMM)的词元到概念对齐模型进行了扩展,引入图距离畸变(graph distance distortion)机制,并在解码过程中采用重打分方法,以充分融合AMR图结构中的拓扑信息。实验结果表明,将上述两个组件整合至现有AMR解析器中,能够在多个数据集上持续超越当前最优水平,显著提升解析性能。