HyperAIHyperAI

Command Palette

Search for a command to run...

構造予測を拡張された自然言語間の翻訳として捉える

Giovanni Paolini Ben Athiwaratkun Jason Krone Jie Ma Alessandro Achille Rishita Anubhai Cicero Nogueira dos Santos Bing Xiang Stefano Soatto

概要

我々は、構造化予測言語タスク(共同エンティティ・リレーション抽出、ネストされた名前付きエンティティ認識、リレーション分類、意味的役割ラベリング、イベント抽出、コアファレンス解決、対話状態追跡など)を統一的に処理するための新しい枠組み「拡張自然言語間翻訳(Translation between Augmented Natural Languages: TANL)」を提案する。従来のタスク固有の判別型分類器を訓練するアプローチに代わり、本手法はタスクに関連する情報を容易に抽出できるように、拡張された自然言語間の翻訳問題として問題を定式化する。このアプローチは、すべてのタスクにおいてタスク固有モデルと同等またはそれ以上の性能を達成し、特に共同エンティティ・リレーション抽出(CoNLL04、ADE、NYT、ACE2005データセット)、リレーション分類(FewRel、TACRED)、意味的役割ラベリング(CoNLL-2005、CoNLL-2012)において、新たな最良結果(SOTA)を達成している。さらに、すべてのタスクに同一のアーキテクチャとハイパーパラメータを適用可能であり、一度にすべてのタスクを学習するマルチタスク学習の設定でも同様の高性能を実現している。最後に、ラベルの意味情報をより効果的に活用できる点から、低リソース環境下でも性能の顕著な向上が可能であることを示した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています