
摘要
我们提出了一类作用于概率文法权重的先验分布,称为共享逻辑正态分布(shared logistic normal distribution)。该分布族扩展了分块逻辑正态分布(partitioned logistic normal distribution),能够在概率文法中不同推导事件的概率之间引入因子化协方差结构,从而为未知文法提供一种全新的先验知识编码方式。我们描述了一种基于该先验族的变分期望最大化(variational EM)算法,用于学习概率文法。随后,我们在无监督依存文法归纳任务中进行了实验,结果表明,无论是在单语学习还是在非平行多语言语料库上的双语学习场景中,所提出的模型均取得了显著的性能提升。