2 个月前

基于弱监督嵌入模型的开放问题回答

Antoine Bordes; Jason Weston; Nicolas Usunier
基于弱监督嵌入模型的开放问题回答
摘要

构建能够回答任何主题问题的计算机一直是人工智能领域的长期目标。近年来,通过学习将问题映射到逻辑形式或数据库查询的方法取得了令人鼓舞的进展。这些方法虽然有效,但需要大量的人工标注数据,或者由专家定义特定的词汇表和语法。在本文中,我们采取了一种激进的方法,即学习将问题映射到向量特征表示。通过将答案也映射到同一空间,可以独立于其模式查询任何知识库,而无需任何语法或词汇表。我们的方法采用了一种新的优化程序进行训练,该程序结合了随机梯度下降和利用自动和协作生成资源提供的弱监督进行微调的步骤。实验结果表明,我们的模型可以从其噪声监督中捕捉到有意义的信号,从而在类似弱标签数据上训练时显著优于Paralex(唯一现有的能够在类似弱标签数据上训练的方法)。