HyperAIHyperAI

Command Palette

Search for a command to run...

WikiGraphs: Wikipediaのテキストと知識グラフをペアにしたデータセット

Luyu Wang; Yujia Li; Ozlem Aslan; Oriol Vinyals

概要

私たちは、条件付きテキスト生成、グラフ生成およびグラフ表現学習の研究を促進するために、各記事に知識グラフが対応付けられた新しいWikipedia記事のデータセットを提示します。既存のグラフ-テキスト対応データセットは、通常小さなグラフと短いテキスト(1文または数文)しか含まないため、そのデータ上で学習できるモデルの能力が制限されています。私たちの新しいデータセットWikiGraphsは、確立されたWikiText-103ベンチマーク(Merityら, 2016)から各Wikipedia記事をFreebase知識グラフ(Bollackerら, 2008)の部分グラフと対応付けて収集しました。これにより、一貫性のある長い段落を生成できる最先端のテキスト生成モデルとのベンチマークが容易になります。このデータセットにおけるグラフとテキストデータは、以前のグラフ-テキスト対応データセットと比較して大幅に大規模です。私たちは、3つのタスク(グラフ → テキスト生成、グラフ → テキスト検索、テキスト → グラフ検索)について、当社のデータセット上の基準となるグラフニューラルネットワークおよびトランスフォーマーモデルの結果を示します。私たちは、より良いグラフに基づいた条件付けが生成品質と検索品質に改善をもたらすことを示していますが、まだ大きな改善余地があることがわかりました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています