
要約
エンティティ間の関係性は、商業的に敏感な情報など、機密情報の分類において信頼性の高い指標となることがある。たとえば、「人物-会社における役員」の関係は、個人の給与が機密個人情報として扱われるべきかどうかを示す手がかりとなる。このような関係の表現は、通常、知識グラフを用いて関係タイプの埋め込み(embedding)を学習することで得られ、異なるエンティティペアに一般化される。しかし、関係タイプが機密性に対応するかどうかは、関係に参加するエンティティの種類によって異なり得る。そのため、一般化された関係埋め込みだけでは、機密情報の分類には不十分であることが多い。本研究では、エンティティと関係を一つの埋め込み表現で統合的に表現する新しい手法を提案する。さらに、従来の関係埋め込み手法を用いた分類アプローチと比較して、提案するエンティティ-関係-エンティティ埋め込みアプローチが、感度分類の効果を顕著に向上させることを示した(McNemar検定、p < 0.05)。F1スコアは0.426(提案手法)対0.413(従来手法)と、統計的に有意な改善が確認された。