
摘要
将结构化数据转化为自然语言描述已成为一项具有挑战性的任务,被称为“数据到文本”(data-to-text)。这类结构通常包含多个元素及其属性。目前大多数方法依赖于编码器-解码器的翻译框架,将数据元素线性化为序列,但这会丢失数据中蕴含的大部分结构信息。在本研究中,我们提出一种层次化模型,能够在元素层面和结构层面同时编码数据结构,从而克服上述局限性。在RotoWire数据集上的实验结果表明,该模型在定性和定量评估指标上均表现出优异性能。
将结构化数据转化为自然语言描述已成为一项具有挑战性的任务,被称为“数据到文本”(data-to-text)。这类结构通常包含多个元素及其属性。目前大多数方法依赖于编码器-解码器的翻译框架,将数据元素线性化为序列,但这会丢失数据中蕴含的大部分结构信息。在本研究中,我们提出一种层次化模型,能够在元素层面和结构层面同时编码数据结构,从而克服上述局限性。在RotoWire数据集上的实验结果表明,该模型在定性和定量评估指标上均表现出优异性能。