2 个月前

DeepType:基于神经类型系统演化的多语言实体链接

Jonathan Raiman; Olivier Raiman
DeepType:基于神经类型系统演化的多语言实体链接
摘要

当今世界拥有丰富的结构化数据(如Wikidata)和非结构化数据,这为未来的人工智能提供了巨大的机遇。迄今为止,将这两种不同模态的数据进行整合是一个复杂的过程,涉及许多关于如何最佳表示信息以使其被捕捉或具有实用性的决策,以及对大量数据进行人工标注。DeepType通过在神经网络的推理过程中显式地集成符号信息并引入类型系统来克服这一挑战。首先,我们构建一个类型系统;其次,利用该类型系统约束神经网络的输出以尊重符号结构。我们通过将设计问题重新表述为混合整数问题来实现这一点:创建一个类型系统,并随后使用该类型系统训练神经网络。在这种重新表述中,离散变量选择本体中的哪些父子关系作为类型系统的类型,而连续变量则控制拟合到类型系统的分类器。原始问题无法精确求解,因此我们提出了一种两步算法:1)基于Oracle和可学习性启发式的启发式搜索或离散变量上的随机优化,这些离散变量定义了类型系统;2)梯度下降以拟合分类器参数。我们将DeepType应用于三个标准数据集上的实体链接问题(即WikiDisamb30、CoNLL (YAGO)、TAC KBP 2010),发现它显著优于所有现有的解决方案,包括依赖人类设计的类型系统的方法和最近基于深度学习的实体嵌入方法。同时,显式使用符号信息使得DeepType能够在不重新训练的情况下集成新实体。