2ヶ月前
InstructUIE: 多タスク指示調整による統合情報抽出
Xiao Wang; Weikang Zhou; Can Zu; Han Xia; Tianze Chen; Yuansen Zhang; Rui Zheng; Junjie Ye; Qi Zhang; Tao Gui; Jihua Kang; Jingsheng Yang; Siyuan Li; Chunsai Du

要約
大規模言語モデルは、指示プロンプトの読み取りから強力な多タスク能力を解放しました。しかし、最近の研究では、既存の大規模モデルが情報抽出タスクにおいて依然として困難を抱えていることが示されています。例えば、gpt-3.5-turbo は Ontonotes データセットで F1 スコア 18.22 を達成しましたが、これは最先端の性能よりも著しく低いものです。本論文では、InstructUIE(指示チューニングに基づく統一情報抽出フレームワーク)を提案します。このフレームワークは、さまざまな情報抽出タスクを統一的にモデル化し、タスク間の依存関係を捉えることができます。提案手法の有効性を検証するため、IE INSTRUCTIONS(専門家が書いた指示文付きで32種類の異なる情報抽出データセットを統一的なテキスト対テキスト形式にまとめたベンチマーク)を導入します。実験結果は、当手法が教師あり設定では BERT と同等の性能を達成し、ゼロショット設定では最先端手法および gpt-3.5 を大幅に上回ることを示しています。