11 天前

Falcon 2.0:面向Wikidata的实体与关系链接工具

Ahmad Sakor, Kuldeep Singh, Anery Patel, Maria-Esther Vidal
Falcon 2.0:面向Wikidata的实体与关系链接工具
摘要

自然语言处理(NLP)领域在从文本中识别实体与关系方面已取得显著进展,并在可能的情况下将这些识别结果与知识图谱(Knowledge Graphs, KGs)中的对应条目进行关联。以Wikidata作为背景知识图谱,目前仍缺乏有效的工具将文本中的知识内容准确链接至Wikidata。本文提出Falcon 2.0,这是首个面向Wikidata的联合实体与关系链接工具。该工具接收一段英文自然语言短文本作为输入,并输出一个按置信度排序的实体与关系候选列表,所有候选项均以Wikidata中的国际化的资源标识符(Internationalized Resource Identifier, IRI)形式表示。Falcon 2.0首先利用英文语言模型完成识别任务,采用如N-Gram拼贴(N-Gram tiling)与N-Gram切分等技术,随后通过一种优化方法实现链接任务。我们在Wikidata上对Falcon 2.0进行了实证评估,结果表明其性能优于所有现有基线方法。Falcon 2.0已开源,可供社区自由使用;相关使用说明与技术文档已完整发布于我们的GitHub仓库。此外,我们还提供了一个在线API接口,用户无需任何技术背景即可直接调用。Falcon 2.0及其所依赖的背景知识库资源现已开放获取,访问地址为:https://labs.tib.eu/falcon/falcon2/。

Falcon 2.0:面向Wikidata的实体与关系链接工具 | 最新论文 | HyperAI超神经