16日前

構造予測を拡張された自然言語間の翻訳として捉える

Giovanni Paolini, Ben Athiwaratkun, Jason Krone, Jie Ma, Alessandro Achille, Rishita Anubhai, Cicero Nogueira dos Santos, Bing Xiang, Stefano Soatto
構造予測を拡張された自然言語間の翻訳として捉える
要約

我々は、構造化予測言語タスク(共同エンティティ・リレーション抽出、ネストされた名前付きエンティティ認識、リレーション分類、意味的役割ラベリング、イベント抽出、コアファレンス解決、対話状態追跡など)を統一的に処理するための新しい枠組み「拡張自然言語間翻訳(Translation between Augmented Natural Languages: TANL)」を提案する。従来のタスク固有の判別型分類器を訓練するアプローチに代わり、本手法はタスクに関連する情報を容易に抽出できるように、拡張された自然言語間の翻訳問題として問題を定式化する。このアプローチは、すべてのタスクにおいてタスク固有モデルと同等またはそれ以上の性能を達成し、特に共同エンティティ・リレーション抽出(CoNLL04、ADE、NYT、ACE2005データセット)、リレーション分類(FewRel、TACRED)、意味的役割ラベリング(CoNLL-2005、CoNLL-2012)において、新たな最良結果(SOTA)を達成している。さらに、すべてのタスクに同一のアーキテクチャとハイパーパラメータを適用可能であり、一度にすべてのタスクを学習するマルチタスク学習の設定でも同様の高性能を実現している。最後に、ラベルの意味情報をより効果的に活用できる点から、低リソース環境下でも性能の顕著な向上が可能であることを示した。

構造予測を拡張された自然言語間の翻訳として捉える | 最新論文 | HyperAI超神経