17日前

複数スパン質問に答えるためのシンプルで効果的なモデル

Elad Segal, Avia Efrat, Mor Shoham, Amir Globerson, Jonathan Berant
複数スパン質問に答えるためのシンプルで効果的なモデル
要約

読解モデル(RC)は、学習の難易度を軽減し、明示的なテキスト生成モデルの必要性を回避するため、通常、出力空間を入力テキスト内のすべての連続したスパン(span)の集合に制限している。しかし、答えを単一のスパンに限定することは制約的であり、近年の一部のデータセットでは、複数の非連続スパンから構成される答えを必要とする「マルチスパン質問」も含まれている。当然ながら、単一スパンを返すモデルではこのような質問に答えられない。本研究では、この問題をシーケンスタグGING問題として定式化することで、マルチスパン質問に対応するシンプルなアーキテクチャを提案する。具体的には、入力の各トークンについて、それが出力に含まれるべきかどうかを予測する。本モデルは、DROPおよびQuorefデータセットにおけるスパン抽出質問において、それぞれ9.9点および5.5点のEM(Exact Match)スコアで著しく性能向上を達成した。

複数スパン質問に答えるためのシンプルで効果的なモデル | 最新論文 | HyperAI超神経