
摘要
生成关于某一事件的不同视角的推理性文本,需要对事件发生的多种上下文进行推理。现有方法通常忽略未明确提供的上下文信息,导致生成的语义表征缺乏上下文依赖性,难以有效支持推理文本的生成。为解决这一问题,我们提出一种新方法:从大规模文本语料库中自动挖掘与事件相关的证据,并利用这些证据引导推理性文本的生成。该方法采用编码器-解码器架构,并引入向量量化变分自编码器(Vector Quantised-Variational Autoencoder),其中编码器输出基于离散变量分布的表示。这种离散表示能够自动筛选出与任务相关的证据,不仅有助于实现基于证据的生成,还为揭示生成过程背后的推理依据提供了自然途径。在Event2Mind和ATOMIC两个数据集上的实验结果表明,该方法达到了当前最优的性能。更重要的是,我们发现,借助离散表示,模型能够有选择性地利用不同证据,从而生成具有不同推理视角的文本。