2 个月前

基于结构感知的序列到序列学习生成表格到文本

Tianyu Liu; Kexiang Wang; Lei Sha; Baobao Chang; Zhifang Sui
基于结构感知的序列到序列学习生成表格到文本
摘要

表格到文本生成的目标是为事实表格生成描述,这些表格可以被视为一系列字段-值记录。为了编码表格的内容和结构,我们提出了一种新颖的结构感知序列到序列(seq2seq)架构,该架构由字段门控编码器和具有双重注意力机制的描述生成器组成。在编码阶段,我们通过字段门和其对应的字段值来更新LSTM单元的单元记忆,以便将字段信息融入表格表示中。在解码阶段,提出了包含词级注意力和字段级注意力的双重注意力机制,以建模生成描述与表格之间的语义相关性。我们在包含超过70万篇维基百科传记及其对应信息框的\texttt{WIKIBIO}数据集上进行了实验。注意力可视化和案例研究显示,我们的模型能够基于对表格内容和结构的全面理解生成连贯且信息丰富的描述。自动评估也表明我们的模型在很大程度上优于基线模型。本工作的代码可在https://github.com/tyliupku/wiki2bio获取。

基于结构感知的序列到序列学习生成表格到文本 | 最新论文 | HyperAI超神经