2ヶ月前
GoLLIE: アノテーションガイドラインがゼロショット情報抽出を改善する
Oscar Sainz; Iker García-Ferrero; Rodrigo Agerri; Oier Lopez de Lacalle; German Rigau; Eneko Agirre

要約
大規模言語モデル(LLMs)と指示微調整の組み合わせは、未見のタスクへの汎化において著しい進歩を遂げています。しかし、情報抽出(IE)分野では、タスク固有のモデルに比べて成功が限定的であり、その性能は遅れを取っています。一般的に、IEタスクは複雑な注釈ガイドラインによって特徴付けられており、これらのガイドラインは人間に対してタスクの説明と例を提供します。これまでの試みでは、最大規模のモデルであっても、ガイドラインをそのまま適用することができず、その利用に失敗してきました。本論文では、GoLLIE(Guideline-following Large Language Model for IE)というモデルを提案します。このモデルは注釈ガイドラインに準拠するように微調整され、未見のIEタスクにおけるゼロショット結果を改善することができます。包括的な評価により実証された通り、GoLLIEは未見のガイドラインに従う能力を持ち、以前のゼロショット情報抽出の試みを上回る性能を示しています。アブレーション研究では、詳細なガイドラインが良好な結果を得る上で重要な役割を果たしていることが明らかになりました。