3ヶ月前

大規模データセットにおける知識グラフ補完のためのペアワイズ出現情報の活用

Esma Balkir, Masha Naslidnyk, Dave Palfrey, Arpit Mittal
大規模データセットにおける知識グラフ補完のためのペアワイズ出現情報の活用
要約

DistMultやComplExといった二重線形モデルは、知識グラフ(KG)の完成において有効な手法である。しかし、これらのモデルは大きなバッチサイズを必要とし、大規模なデータセット上で学習する際にはメモリ制約により性能のボトルネックとなる。本論文では、データセット内のエンティティ-関係ペアの出現頻度を活用して共同学習モデルを構築し、学習中のサンプリングされたネガティブ例の品質を向上させる手法を提案する。3つの標準データセット上で、これらの技術を組み合わせた場合、特にデータセットサイズに対してバッチサイズや生成されるネガティブ例の数が小さい場合に、性能の顕著な向上が得られることを示した。さらに、200万エンティティを含むデータセットに本手法を適用した結果、ベースラインモデルに対してHits@1で2.8%の絶対的な性能向上を達成した。