2ヶ月前
Zero-shot Triplet Extraction by Template Infilling ゼロショット三項抽出によるテンプレート補完
Bosung Kim; Hayate Iso; Nikita Bhutani; Estevam Hruschka; Ndapa Nakashole; Tom Mitchell

要約
トリプレット抽出の目的は、非構造化テキストからエンティティのペアとそれらに対応する関係を抽出することである。既存の方法の多くは、特定の目標関係を含む訓練データでモデルを訓練し、訓練時に観測されなかった新しい関係を抽出することはできない。未見の関係に対するモデルの一般化には、しばしばノイジーで信頼性が低い合成訓練データでの微調整が必要となる。本研究では、事前学習された言語モデル(LM)を使用してトリプレット抽出をテンプレート補完タスクに還元することで、抽出モデルにゼロショット学習能力を付与し、追加の訓練データの必要性を排除できることが示された。私たちは、この新たな枠組みZETT(ZEro-shot Triplet extraction by Template infilling)を提案し、生成変換器の事前学習目的とタスク目的を一致させることで未見の関係への一般化を実現する。FewRelおよびWiki-ZSLデータセットにおける実験結果は、ZETTが一貫性と安定性を持ち、自動生成されたテンプレートを使用しても従来の最先端手法よりも優れた性能を発揮することを示している。https://github.com/megagonlabs/zett/