
摘要
我们提出了一种生成式改写(paraphrase generation)模型,该模型通过基于显式的句法草图(syntactic sketch)进行条件化,以促进句法结构的多样性。为此,我们引入了分层精炼量化变分自编码器(Hierarchical Refinement Quantized Variational Autoencoders, HRQ-VAE),这是一种将密集编码分解为一系列离散潜在变量的方法,这些变量通过逐步细化的方式实现粒度递增的迭代优化。该层级编码结构通过端到端训练自动学习,能够表征输入数据从细粒度到粗粒度的多层次信息。我们利用HRQ-VAE将输入句子的句法形式编码为层级结构中的一条路径,从而在测试阶段更高效地预测句法草图。大量实验,包括人工评估,结果表明,HRQ-VAE能够有效学习输入空间的分层表示,并生成质量优于以往系统的改写句。