
摘要
来自不同应用领域的知识被组织为知识图谱(Knowledge Graphs, KGs),并存储在RDF引擎中,可通过SPARQL端点在互联网上访问。要编写一个语法正确的SPARQL查询,用户需掌握图谱的结构信息以及其组件的精确URI,这对普通用户而言极为不便。问答(Question Answering, QA)系统通过将自然语言问题转换为SPARQL查询,提供了有效支持。然而,现有的QA系统通常依赖于特定应用领域的人工规则,或需要针对每个目标知识图谱进行预先的信息收集、昂贵的预处理以及模型适配,导致其难以泛化到广泛的应用场景和知识图谱。本文提出KGQAn,一种无需针对每个目标知识图谱进行定制的通用问答系统。与依赖人工规则的方法不同,KGQAn将问题理解建模为一个文本生成任务,利用神经序列到序列(sequence-to-sequence)模型,将自然语言问题转化为一种中间抽象表示。此外,我们设计了一种“即时链接器”(just-in-time linker),在查询执行时,仅通过公开可访问的API接口和RDF存储现有的索引信息,即可将该抽象表示动态映射为特定知识图谱对应的SPARQL查询,无需任何预处理步骤。在多个真实知识图谱上的实验结果表明,KGQAn具有良好的部署便捷性,在答案质量与处理速度方面显著优于当前最先进的方法,尤其在训练阶段未见过的任意知识图谱上表现尤为突出。