17 天前

异构源上的对话式问答

Philipp Christmann, Rishiraj Saha Roy, Gerhard Weikum
异构源上的对话式问答
摘要

对话式问答(Conversational Question Answering, ConvQA)旨在处理序列化信息需求,其中后续问题中的上下文往往未明确表达。当前的ConvQA系统通常仅基于同质的信息源运行:要么是知识库(Knowledge Base, KB),要么是文本语料库,要么是表格集合。本文首次提出将这三类异构信息源联合利用的新问题,从而显著提升答案的覆盖范围与置信度。为此,我们提出了CONVINSE——一种面向异构信息源的端到端ConvQA流水线,包含三个阶段:i)学习输入问题及其对话上下文的显式结构化表示;ii)利用这种类框架(frame-like)的表示,统一地从知识库、文本和表格中捕获相关证据;iii)采用解码器内融合(fusion-in-decoder)模型生成最终答案。为推动该方向的研究,我们构建并发布了首个面向异构信息源的ConvQA基准数据集——ConvMix,包含3000条真实用户对话,共计16000个问题,附带实体标注、完整问题语句及问题改写版本。实验结果表明,与当前最先进的基线方法相比,我们的方法在有效性与性能上均展现出显著优势,验证了其可行性和优越性。

异构源上的对话式问答 | 最新论文 | HyperAI超神经