11日前

エンティティアライメントの速度を向上させる:正規化されたハードサンプルマイニングを用いたデュアルアテンションマッチングネットワーク

Xin Mao, Wenting Wang, Yuanbin Wu, Man Lan
エンティティアライメントの速度を向上させる:正規化されたハードサンプルマイニングを用いたデュアルアテンションマッチングネットワーク
要約

複数の情報源にまたがる知識グラフ(KG)間における同等エンティティの同定は、KG統合の鍵となるステップであり、いわゆる「エンティティアライメント(EA)」と呼ばれる。しかし、従来のEA手法の多くは計算効率が低く、スケーラビリティに欠けるという問題がある。最近の調査によれば、20万ノードを含むデータセット(DWY100K)を処理するためには、一部の手法で数日を要するケースすら存在する。本研究では、これら問題の主な原因として、過剰に複雑なグラフエンコーダーと非効率なネガティブサンプリング戦略を指摘する。本論文では、グラフ内情報とグラフ間情報を効果的にモデル化しつつ、計算複雑性を大幅に低減できる新しいKGエンコーダー「デュアルアテンションマッチングネットワーク(Dual-AMN)」を提案する。さらに、損失のシフトを低減しつつ、困難なネガティブサンプルを滑らかに選択できる「正規化ハードサンプルマイニング損失」を導入した。広く用いられる公開データセットにおける実験結果から、本手法は高い精度と高い効率の両方を達成していることが示された。特にDWY100Kにおいて、本手法の全体的な実行時間は1,100秒で完了し、従来手法よりも少なくとも10倍以上高速である。また、すべてのデータセットにおいて既存手法を上回る性能を示しており、Hits@1とMRRはそれぞれ6%から13%まで向上した。

エンティティアライメントの速度を向上させる:正規化されたハードサンプルマイニングを用いたデュアルアテンションマッチングネットワーク | 最新論文 | HyperAI超神経