2ヶ月前
テキスト的意味包含関係のイベント引数抽出:多源学習を用いたゼロショットおよびファーソット手法
Oscar Sainz; Itziar Gonzalez-Dios; Oier Lopez de Lacalle; Bonan Min; Eneko Agirre
要約
最近の研究では、関係抽出(Relation Extraction, RE)などの自然言語処理タスクを、事前学習された包含関係モデルを使用して、包含関係タスクに再構成することで、ゼロショットやファウショット設定において高い性能が得られることを示しています。現在のREデータセットにおける関係が容易に言語化できることから、より複雑なタスクにおいて包含関係が効果的であるかどうか疑問視されています。本研究では、イベント引数抽出(Event Argument Extraction, EAE)においても包含関係が効果的であることを示し、ACEとWikiEventsデータセットで完全学習時の同等の性能を達成しながら、手動アノテーションの必要性をそれぞれ50%と20%に削減できることが確認されました。さらに重要なのは、EAEを包含関係に再構成することでスキーマへの依存が軽減され、ドメイン間でのアノテーション転送の障壁が低くなることです。包含関係のおかげで、ACEとWikiEvents間のマルチソース転移により、完全学習時の10%と5%(それぞれ)までアノテーション量を削減することが可能となりました。当方の分析によれば、良好な結果を得るためには複数の包含関係データセットを使用して包含関係モデルを事前学習することが重要です。以前の手法と同様に、当方の方法は手動での言語化に少々の労力が必要ですが、各イベント引数タイプにつき15分未満しか必要ではなく、異なる専門知識レベルを持つユーザーでも同等の結果を得ることができます。