Command Palette
Search for a command to run...
WikiGraphs: Wikipediaのテキストと知識グラフをペアにしたデータセット
WikiGraphs: Wikipediaのテキストと知識グラフをペアにしたデータセット
Luyu Wang; Yujia Li; Ozlem Aslan; Oriol Vinyals
概要
私たちは、条件付きテキスト生成、グラフ生成およびグラフ表現学習の研究を促進するために、各記事に知識グラフが対応付けられた新しいWikipedia記事のデータセットを提示します。既存のグラフ-テキスト対応データセットは、通常小さなグラフと短いテキスト(1文または数文)しか含まないため、そのデータ上で学習できるモデルの能力が制限されています。私たちの新しいデータセットWikiGraphsは、確立されたWikiText-103ベンチマーク(Merityら, 2016)から各Wikipedia記事をFreebase知識グラフ(Bollackerら, 2008)の部分グラフと対応付けて収集しました。これにより、一貫性のある長い段落を生成できる最先端のテキスト生成モデルとのベンチマークが容易になります。このデータセットにおけるグラフとテキストデータは、以前のグラフ-テキスト対応データセットと比較して大幅に大規模です。私たちは、3つのタスク(グラフ → テキスト生成、グラフ → テキスト検索、テキスト → グラフ検索)について、当社のデータセット上の基準となるグラフニューラルネットワークおよびトランスフォーマーモデルの結果を示します。私たちは、より良いグラフに基づいた条件付けが生成品質と検索品質に改善をもたらすことを示していますが、まだ大きな改善余地があることがわかりました。