6 个月前

自然语言处理

Pradeep Dasigi Kyle Lo Iz Beltagy Arman Cohan Noah A. Smith Matt Gardner

摘要

学术研究论文的读者在阅读时常怀有明确的问题目标。能够回答这些具体问题的问答系统，可显著提升内容的阅读效率。然而，构建此类工具需要反映论文中多部分信息之间复杂推理所带来的任务难度的真实数据。相比之下，现有的信息检索型问答数据集通常包含关于通用事实性信息的问题。为此，我们提出了QASPER，一个涵盖1,585篇自然语言处理（Natural Language Processing, NLP）论文的问答数据集，共包含5,049个问题。每个问题均由一位NLP从业者在仅阅读对应论文标题和摘要的基础上提出，其关注的信息均存在于论文全文中。随后，由另一组独立的NLP从业者对这些问题进行作答，并提供支持答案的证据。实验结果表明，现有在其他问答任务中表现优异的模型在QASPER上的表现较差，其F1分数相较人类答题者至少低27分，凸显了该任务的挑战性。这一结果进一步推动了面向文档支撑、信息检索型问答的深入研究，而QASPER数据集正是为此类研究量身设计的。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

自然语言处理

Pradeep Dasigi Kyle Lo Iz Beltagy Arman Cohan Noah A. Smith Matt Gardner

摘要

学术研究论文的读者在阅读时常怀有明确的问题目标。能够回答这些具体问题的问答系统，可显著提升内容的阅读效率。然而，构建此类工具需要反映论文中多部分信息之间复杂推理所带来的任务难度的真实数据。相比之下，现有的信息检索型问答数据集通常包含关于通用事实性信息的问题。为此，我们提出了QASPER，一个涵盖1,585篇自然语言处理（Natural Language Processing, NLP）论文的问答数据集，共包含5,049个问题。每个问题均由一位NLP从业者在仅阅读对应论文标题和摘要的基础上提出，其关注的信息均存在于论文全文中。随后，由另一组独立的NLP从业者对这些问题进行作答，并提供支持答案的证据。实验结果表明，现有在其他问答任务中表现优异的模型在QASPER上的表现较差，其F1分数相较人类答题者至少低27分，凸显了该任务的挑战性。这一结果进一步推动了面向文档支撑、信息检索型问答的深入研究，而QASPER数据集正是为此类研究量身设计的。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供