
要約
ニューラル埋め込みに基づく機械学習モデルは、知識グラフにおける新しいリンク予測において有望な成果を示している。しかし、その実用性は解釈可能性の欠如により制限されている。近年、完全に解釈可能なルールベースのアルゴリズムであるAnyBURLは、多数の汎用リンク予測ベンチマークにおいて非常に競争力のある結果を達成した。しかしながら、複数のルールによる予測を統合する現在のアプローチは、重複するルールの影響を受けており、効率性に課題がある。本研究では、重複するルールを統合前に検出し、クラスタリングする新たな集約手法「Non-redundant Noisy-OR」を用いる、SAFRANルール適用フレームワークを提案することで、AnyBURLを改善した。SAFRANは、広く用いられる汎用ベンチマークであるFB15K-237、WN18RR、YAGO3-10において、完全に解釈可能なリンク予測で新たな最良結果を達成した。さらに、FB15K-237およびWN18RRでは、複数の既存の埋め込みベースのアルゴリズムを上回る性能を発揮し、YAGO3-10においてはルールベースと埋め込みベースのアルゴリズムの性能差を縮小した。