
摘要
基于聚类的无监督关系抽取方法已逐渐成为开放关系抽取(OpenRE)领域的重要技术之一。然而,高维向量虽能编码复杂的语言信息,却往往导致聚类结果难以与语义关系类别显式对齐。针对这一问题,本文提出一种面向关系的聚类模型,用于在无标签数据中识别新型关系。具体而言,为使模型具备聚类关系数据的能力,本方法利用预先定义关系的已有标注数据,学习一种面向关系的表示。通过将具有相同关系的样本向其对应的关系中心点聚集,构建紧凑的聚类结构,从而使得学习到的表示具有良好的聚类友好性。为进一步降低对预定义类别的聚类偏差,模型在标注数据与未标注数据上联合优化目标函数。实验结果表明,与当前最优方法相比,本方法在两个数据集上的错误率分别降低了29.2%和15.7%。