
摘要
本文提出了一种名为CorefQA的准确且可扩展的共指消解方法。我们将该任务建模为一个跨度预测问题,借鉴了问答系统的思路:针对每个候选提及项,利用其上下文生成一个查询(query),然后通过一个跨度预测模块,基于生成的查询从文档中提取出共指实体的文本跨度。该建模方式具有以下几项关键优势:(1)跨度预测策略具备灵活性,能够捕获在提及提议阶段被遗漏的提及项;(2)在问答框架中,通过查询显式编码提及项及其上下文,使得模型能够对共指提及项上下文中嵌入的线索进行深入而全面的分析;(3)可充分利用大量现有的问答数据集进行数据增强,从而提升模型的泛化能力。实验结果表明,该方法显著优于以往模型,在CoNLL-2012基准上取得了83.1(+3.5)的F1分数,在GAP基准上达到了87.5(+2.5)的F1分数。