2 个月前

超关系抽取的数据集及立方体填充方法

Yew Ken Chia; Lidong Bing; Sharifah Mahani Aljunied; Luo Si; Soujanya Poria
超关系抽取的数据集及立方体填充方法
摘要

关系抽取在大规模知识图谱构建中具有巨大潜力,但目前的方法尚未考虑每个关系三元组的限定属性,如时间、数量或地点。这些限定属性构成了超关系事实,能够更好地捕捉丰富而复杂的知识图谱结构。例如,关系三元组(Leonard Parker, 就读于, Harvard University)可以通过添加限定属性(结束时间, 1967)来丰富其事实内容。因此,我们提出了超关系抽取任务,旨在从文本中提取更为具体和完整的事实。为了支持这一任务,我们构建了HyperRED,一个大规模且通用的数据集。现有的模型无法执行超关系抽取,因为这需要模型考虑三个实体之间的相互作用。为此,我们提出了一种受表格填充方法启发的立方体填充模型CubeRE,该模型显式地考虑了关系三元组与限定属性之间的相互作用。为了提高模型的可扩展性和减少负类不平衡问题,我们进一步提出了一种立方体剪枝方法。实验结果表明,CubeRE优于强大的基线模型,并揭示了未来研究的可能方向。我们的代码和数据可在github.com/declare-lab/HyperRED获取。