
摘要
实体之间的关系可作为分类敏感信息(如商业敏感信息)的可靠指标。例如,关系“人-担任董事-公司”可用于判断某个人的薪资是否属于敏感个人数据。此类关系的表示通常通过知识图谱学习得到,生成适用于不同实体对的通用关系嵌入(relation embeddings)。然而,某一关系类型是否具有敏感性,往往取决于参与该关系的具体实体。因此,通用的关系嵌入通常不足以准确支持敏感信息的分类。为此,本文提出一种新型方法,将实体与关系统一嵌入到单一向量空间中,以更精确地捕捉实体间的关系特征。此外,实验结果表明,与现有文献中基于关系嵌入的分类方法相比,所提出的“实体-关系-实体”嵌入方法在敏感性分类任务上显著提升性能(McNemar检验,p < 0.05),F1分数由0.413提升至0.426。