2 个月前

学习递归跨度表示以用于抽取式问答

Kenton Lee; Shimi Salant; Tom Kwiatkowski; Ankur Parikh; Dipanjan Das; Jonathan Berant
学习递归跨度表示以用于抽取式问答
摘要

阅读理解任务,即针对给定的证据文档提出问题,是自然语言理解中的一个核心问题。近年来,该任务的表述通常集中在从一组预先手动定义或通过外部自然语言处理(NLP)管道生成的候选答案中选择正确答案。然而,Rajpurkar等人(2016年)最近发布了SQuAD数据集,在该数据集中,答案可以是所提供文本中的任意字符串。本文聚焦于这一答案提取任务,提出了一种新颖的模型架构,该架构利用循环网络高效地构建证据文档中所有片段的固定长度表示。我们证明,对显式片段表示进行评分显著提高了性能,优于其他将预测分解为关于单词或起始和结束标记的单独预测的方法。我们的方法在Wang和Jiang(2016年)的最佳已发表结果基础上提升了5%,并将Rajpurkar等人基线模型的错误率降低了超过50%。

学习递归跨度表示以用于抽取式问答 | 最新论文 | HyperAI超神经