17日前

ローカル知識グラフ構築を活用したSeq2Seqモデルの多文書入力へのスケーリング

Angela Fan, Claire Gardent, Chloe Braud, Antoine Bordes
ローカル知識グラフ構築を活用したSeq2Seqモデルの多文書入力へのスケーリング
要約

クエリベースのオープンドメイン自然言語処理タスクでは、長く多様なウェブ検索結果から情報を統合する必要がある。現在の手法は、TF-IDFランキングなどの方法を用いてウェブテキストの一部を抽出し、シーケンス・トゥ・シーケンスモデルの入力として利用している。本研究では、各クエリに対して局所的なグラフ構造の知識ベースを構築する手法を提案する。これにより、ウェブ検索結果の情報を圧縮し、重複を低減することができる。また、グラフを線形化して構造化された入力シーケンスに変換することで、標準的なシーケンス・トゥ・シーケンス設定内でグラフ表現をエンコード可能であることを示す。長文入力が必要な2つの生成型タスク、すなわち長文質問応答および複数文書要約において、抽出されたテキスト部分ではなくグラフ表現を入力として用いることで、より優れた性能が得られることを確認した。

ローカル知識グラフ構築を活用したSeq2Seqモデルの多文書入力へのスケーリング | 最新論文 | HyperAI超神経