11日前

共参照解決における一般化について

Shubham Toshniwal, Patrick Xia, Sam Wiseman, Karen Livescu, Kevin Gimpel
共参照解決における一般化について
要約

共参照解決(coreference resolution)はデータセットのドメインに依存せずに定義されるが、その実行に用いられる大多数のモデルは、未観測のドメインへの汎化能力に乏しい。本研究では、異なるドメインを対象とした8つの共参照解決データセットを統合し、モデルの即時利用(off-the-shelf)性能を評価した。さらに、ドメイン、アノテーションガイドライン、メタデータが異なる3つのデータセットを組み合わせて訓練に用いる。これら異種のデータ混合に対して、アノテーションの差異を補うためのデータ拡張と、データ量のバランスを取るためのサンプリングを用いて、単一モデルの共同学習手法を提案した。ゼロショット設定において、単一データセットで学習したモデルは著しく性能が劣る一方で、共同学習により全体的な性能が向上し、共参照解決モデルの一般化能力が改善されることが明らかになった。本研究は、堅牢な共参照解決を評価するための新しいベンチマークを提供するとともに、複数の新たな最先端(state-of-the-art)の成果を達成した。

共参照解決における一般化について | 最新論文 | HyperAI超神経