
摘要
鉴于许多关系跨越句子边界,文档级关系抽取(DocRE)引起了越来越多的关注。DocRE需要整合句内和句间的信息,捕捉实体提及之间的复杂交互。现有的大多数方法都是基于流水线的,需要实体作为输入。然而,联合学习实体抽取和关系抽取可以提高性能并更加高效,因为它们共享参数和训练步骤。在本文中,我们开发了一种序列到序列的方法——seq2rel,该方法可以端到端地学习DocRE的子任务(实体抽取、共指消解和关系抽取),取代了特定任务组件的流水线。通过一种称为“实体提示”(entity hinting)的简单策略,我们将我们的方法与现有基于流水线的方法在多个流行的生物医学数据集上进行了比较,在某些情况下超过了它们的表现。我们还报告了这些数据集上的首个端到端结果,以便未来进行对比。最后,我们证明在我们的模型下,端到端方法优于基于流水线的方法。我们的代码、数据和训练模型可在{\url{https://github.com/johngiorgi/seq2rel}}获取。在线演示可访问{\url{https://share.streamlit.io/johngiorgi/seq2rel/main/demo.py}}。