11日前

コアフレンス解決をためのseq2seq遷移ベースのシステム

Bernd Bohnet, Chris Alberti, Michael Collins
コアフレンス解決をためのseq2seq遷移ベースのシステム
要約

最近の共参照解決システムは、可能なスパンを探索するアルゴリズムを用いて参照表現を特定し、共参照関係を解決するものが多い。本研究では、代わりにテキストからテキストへの(seq2seq)枠組みを採用し、参照表現とリンクを同時に予測する共参照解決システムを提案する。本システムは遷移系(transition system)として実装し、多言語T5を基盤となる言語モデルとして用いる。訓練にはCoNLLデータのみを用いた場合でも、英語において83.3のF1スコア(前人研究(Dobrovolskii, 2021)より2.3ポイント向上)、アラビア語で68.5(+4.1ポイント)、中国語で74.3(+5.3ポイント)のSOTA(最先端)性能を達成した。さらに、SemEval-2010データセットを用いて、ゼロショット設定、フェイショット設定、およびすべての利用可能な訓練データを用いた教師あり設定での実験を行った。その結果、4言語中3言語について、前人研究よりも大幅に高いゼロショットF1スコアを達成し、また、検証した全5言語において、教師あり設定で前人研究を著しく上回るSOTA結果を実現した。

コアフレンス解決をためのseq2seq遷移ベースのシステム | 最新論文 | HyperAI超神経