11日前

偶然的な教師情報を用いた多言語エンティティアライメント

Muhao Chen, Weijia Shi, Ben Zhou, Dan Roth
偶然的な教師情報を用いた多言語エンティティアライメント
要約

多数の研究努力が、異なる言語固有の知識グラフ(KG)に存在するエンティティを、現実世界の同一オブジェクトを指すものとして一致させる「エンティティアライメント」タスクに対応する多言語知識グラフ埋め込み手法に向けられてきた。このような手法は、通常、KG間で提供される初期アライメント(seed alignment)の不足によって制約される。そこで本研究では、テキストから得られる偶然的(incidental)な教師信号を活用してエンティティアライメントを向上させる、偶然的教師付きモデル「JEANS」を提案する。JEANSは、多言語KGとテキストコーパスを共通の埋め込み空間に統合的に表現する。まず、各KGを単語言語テキストコーパスと結合するエンティティグランドイングプロセスを実施する。その後、2つの学習プロセスを実行する:(i)各言語のKGとテキストを一つの埋め込み空間に符号化する埋め込み学習プロセス、および(ii)自己学習に基づくアライメント学習プロセスで、埋め込み間におけるエンティティおよび語彙(lexeme)の対応関係を反復的に推定する。標準ベンチマークデータセットにおける実験結果から、JEANSは偶然的教師信号を活用することでエンティティアライメントにおいて顕著な性能向上を達成し、KG内部情報のみに依存する従来の最先端手法を大きく上回ることが示された。

偶然的な教師情報を用いた多言語エンティティアライメント | 最新論文 | HyperAI超神経