2 个月前

少样本文档级关系抽取

Nicholas Popovic; Michael Färber
少样本文档级关系抽取
摘要

我们介绍了FREDo,一个少样本文档级关系抽取(FSDLRE)基准。与现有的基于句子级关系抽取语料库的基准不同,我们认为文档级语料库提供了更多的现实性,特别是在“以上都不是”(NOTA)分布方面。因此,我们提出了一组FSDLRE任务,并基于两个现有的监督学习数据集DocRED和sciERC构建了一个基准。我们将最先进的句子级方法MNAV适应到文档级,并进一步开发以提高领域适应性。我们发现FSDLRE是一个具有挑战性的设置,具有新的有趣特征,例如可以从支持集中采样NOTA实例。数据、代码和训练模型已在线提供(https://github.com/nicpopovic/FREDo)。