
摘要
本文总结了首次端到端(E2E)自然语言生成(NLG)在口语对话系统中共享任务的实验设置和结果。近年来,端到端生成系统因其减少了数据标注的需求而展现出巨大潜力。然而,目前这些系统主要局限于小型、去词汇化的数据集。E2E NLG 共享任务旨在评估这些新方法是否可以通过学习包含更高词汇丰富度、句法复杂性和多样话语现象的数据集来生成更高质量的输出。我们比较了来自17个机构提交的62个系统,涵盖了广泛的方法,包括机器学习架构——其中大多数实现了序列到序列模型(seq2seq)——以及基于语法规则和模板的系统。