2ヶ月前

テキストからの知識グラフ生成

Igor Melnyk; Pierre Dognin; Payel Das
テキストからの知識グラフ生成
要約

本研究では、テキスト入力から知識グラフ(Knowledge Graph: KG)を生成する新しいエンドツーエンドの多段階システムを提案します。このシステムは全体のプロセスを2つの段階に分けています。まず、事前学習済み言語モデルを使用してグラフのノードを生成し、その後、単純なエッジ構築ヘッドによってエッジが形成されます。これにより、テキストからの効率的なKG抽出が可能となります。各段階において、利用可能な訓練リソースに応じて使用できる複数のアーキテクチャ選択肢を検討しています。我々は提案したモデルを最新のWebNLG 2020チャレンジデータセットで評価し、テキストからRDFへの変換タスクにおいて最先端の性能と同等の結果を得ました。また、ニューヨーク・タイムズ(NYT)および大規模なTekGenデータセットでも評価を行い、全体的に優れた性能を示し、既存のベースラインを超える結果を得ています。我々は、提案されたシステムが既存の線形化やサンプリングに基づくグラフ生成手法に対する実用的なKG構築の代替手段となり得ると考えています。当該コードはhttps://github.com/IBM/Grapher で公開されています。

テキストからの知識グラフ生成 | 最新論文 | HyperAI超神経