17 天前

基于深度内部-外部递归自编码器的无监督潜在树结构诱导

{Andrew McCallum, Patrick Verga, Mohit Yadav, Andrew Drozdov, Mohit Iyyer}
基于深度内部-外部递归自编码器的无监督潜在树结构诱导
摘要

我们提出了一种完全无监督的深度内外递归自编码器(Deep Inside-Outside Recursive Autoencoder, DIORA),用于同时发现句法结构并学习所生成句法树中各成分的表示。该方法通过条件化地预测输入句子中的每个词(以其余词为上下文)来建模语言结构。在训练过程中,我们采用动态规划算法枚举句子的所有可能二叉树结构;在推理阶段,则使用CKY算法提取得分最高的句法分析结果。在标准WSJ数据集上的实验表明,DIORA在无监督二叉句法分析任务上的表现优于此前报道的各类方法。