摘要
近年来,基于编码器-解码器的主流方法通常采用字符串解码器,将图像转换为序列化字符串以实现图像到标记(markup)的映射。然而,对于具有树状结构表示的标记体系,字符串表示难以应对复杂的结构关系。在本工作中,我们通过一系列简化问题(toy problems)首先表明:随着结构复杂度的增加,字符串解码器在还原树结构方面表现出显著困难。为此,我们提出一种专为生成树状结构标记而设计的树形解码器。该解码器采用递归的序列化生成方式,在每一步同时生成一个子节点及其父节点,构成一个子树结构,并以此子树为基础,以递推方式逐步构建完整的树形结构。该树形解码器的成功关键在于两点:(i)严格遵循树结构中父子节点之间的层级关系;(ii)显式输出树形结构,而非线性字符串。在数学公式识别与化学式识别两个任务上的实验结果表明,所提出的树形解码器显著优于现有的强基线字符串解码器。