7 个月前

自然语言处理

自然语言处理

Antoine Bordes Jason Weston Nicolas Usunier

摘要

构建能够回答任何主题问题的计算机一直是人工智能领域的长期目标。近年来，通过学习将问题映射到逻辑形式或数据库查询的方法取得了令人鼓舞的进展。这些方法虽然有效，但需要大量的人工标注数据，或者由专家定义特定的词汇表和语法。在本文中，我们采取了一种激进的方法，即学习将问题映射到向量特征表示。通过将答案也映射到同一空间，可以独立于其模式查询任何知识库，而无需任何语法或词汇表。我们的方法采用了一种新的优化程序进行训练，该程序结合了随机梯度下降和利用自动和协作生成资源提供的弱监督进行微调的步骤。实验结果表明，我们的模型可以从其噪声监督中捕捉到有意义的信号，从而在类似弱标签数据上训练时显著优于Paralex（唯一现有的能够在类似弱标签数据上训练的方法）。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

自然语言处理

自然语言处理

Antoine Bordes Jason Weston Nicolas Usunier

摘要

构建能够回答任何主题问题的计算机一直是人工智能领域的长期目标。近年来，通过学习将问题映射到逻辑形式或数据库查询的方法取得了令人鼓舞的进展。这些方法虽然有效，但需要大量的人工标注数据，或者由专家定义特定的词汇表和语法。在本文中，我们采取了一种激进的方法，即学习将问题映射到向量特征表示。通过将答案也映射到同一空间，可以独立于其模式查询任何知识库，而无需任何语法或词汇表。我们的方法采用了一种新的优化程序进行训练，该程序结合了随机梯度下降和利用自动和协作生成资源提供的弱监督进行微调的步骤。实验结果表明，我们的模型可以从其噪声监督中捕捉到有意义的信号，从而在类似弱标签数据上训练时显著优于Paralex（唯一现有的能够在类似弱标签数据上训练的方法）。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供