16 天前

序列到序列的知识图谱补全与问答

Apoorv Saxena, Adrian Kochsiek, Rainer Gemulla
序列到序列的知识图谱补全与问答
摘要

知识图谱嵌入(Knowledge Graph Embedding, KGE)模型将知识图谱(KG)中的每个实体和关系表示为低维嵌入向量。近年来,这类方法已被广泛应用于不完整知识图谱的链接预测以及知识图谱问答(KGQA)任务。传统的KGE模型通常为图中的每个实体单独生成嵌入表示,导致在包含数百万实体的真实世界图谱上模型规模庞大。此外,这些原子化的实体表示在下游任务中往往需要集成到多阶段流水线中,限制了其实际应用价值。本文提出,直接使用现成的编码器-解码器Transformer模型即可作为高效且通用的KGE模型,在知识图谱链接预测与不完整知识图谱问答任务中均取得当前最优性能。我们通过将知识图谱链接预测建模为序列到序列(sequence-to-sequence)任务,并用自回归解码机制替代传统KGE方法中的三元组打分策略,实现了这一突破。该方法虽简单却极具威力,相较于传统KGE模型,可将模型规模压缩高达98%,同时保持可接受的推理效率。在对不完整知识图谱问答任务进行微调后,我们的方法在多个大规模数据集上显著超越现有基线模型,且无需繁琐的超参数调优。