
摘要
近年来,数据到文本生成领域的最新方法由于大规模数据集的使用和端到端训练的神经网络架构的应用而展现出巨大的潜力。这些模型依赖于表示学习来适当地选择内容、连贯地组织结构并语法正确地表达,将实体视为仅仅是词汇标记。在本研究中,我们提出了一种以实体为中心的神经架构用于数据到文本生成。我们的模型创建了特定于实体的表示,并对其进行动态更新。在每个时间步骤中,通过分层注意力机制,根据数据输入和实体记忆表示生成文本。我们在RotoWire基准数据集以及一个规模为其五倍的新棒球领域数据集上进行了实验。实验结果表明,所提出的模型在自动评估和人工评估中均优于竞争基线模型。