
要約
我々はFREDo(Few-shot Document-level Relation Extraction Benchmark)を提示します。既存のベンチマークが文レベルの関係抽出コーパスに基づいて構築されているのに対し、我々はドキュメントレベルのコーパスがより現実的であると主張します。特に、上記に該当しない(None-of-the-above, NOTA)分布に関してはその現実性が高いと考えられます。したがって、FSDLRE(Few-shot Document-level Relation Extraction)タスクのセットを提案し、既存の監督学習データセットであるDocREDとsciERCを基にベンチマークを構築しました。最先端の文レベル手法MNAVをドキュメントレベルに適応させ、さらに領域適応の改善のために開発を進めました。FSDLREは挑戦的な設定であり、サポートセットからNOTAインスタンスをサンプリングする能力など、興味深い新しい特性を持つことがわかりました。データ、コード、および学習済みモデルはオンラインで公開されています (https://github.com/nicpopovic/FREDo)。