
摘要
近期的研究将实体-关系抽取任务转化为多轮问答(Multi-turn Question Answering, QA)任务,并基于机器阅读理解(Machine Reading Comprehension, MRC)模型提出了有效的解决方案。然而,这些方法通常仅使用单一问题来表征实体与关系的语义,由于上下文语义的多样性,这种做法在直观上显然不足。同时,现有模型在生成问题时需枚举所有可能的关系类型,导致效率低下,且容易产生语义混淆的问题。本文针对上述问题,通过引入多样化的问答机制对现有基于MRC的实体-关系抽取模型进行改进。首先,提出一种多样性问答机制,用于准确识别实体跨度,并设计两种答案选择策略以有效融合不同答案。其次,提出预测潜在关系的子集,并通过过滤无关关系来高效生成问题。最后,实现实体与关系抽取的端到端联合建模,并通过联合学习进行优化。实验结果表明,所提出的方法显著优于基线模型,在ACE05数据集上将关系F1值提升至62.1%(+1.9%),在CoNLL04数据集上达到71.9%(+3.0%)。相关代码已开源,可通过 https://github.com/TanyaZhao/MRC4ERE 获取。