
摘要
从抽象意义表示(Abstract Meaning Representation, AMR)生成文本是一个最近引入到自然语言处理(NLP)社区的问题,其目标是从AMR图生成句子。序列到序列模型可以通过将AMR图转换为字符串来实现这一目标。直接在图上处理该问题则需要使用图到序列模型,这些模型将AMR图编码为向量表示。以往的研究表明,这种编码方法是有益的,而且与顺序编码不同的是,它能够显式地捕捉AMR图中的再入结构(reentrant structures)。我们通过比较图编码器和树编码器(其中再入结构未被保留)来研究再入节点(具有多个父节点的节点)对AMR到文本生成的影响程度。结果显示,改进再入结构和长距离依赖关系的处理有助于提高图编码器的整体得分。我们的最佳模型在LDC2015E86数据集上达到了24.40的BLEU分数,比现有最优方法高出1.1分;在LDC2017T10数据集上达到了24.54的BLEU分数,比现有最优方法高出1.24分。