
摘要
句级关系抽取(Sentence-level Relation Extraction, RE)旨在识别句子中两个实体之间的语义关系。尽管已有大量研究致力于该问题,但当前表现最优的方法仍存在明显不足。本文重新审视了影响现有RE模型性能的两个关键问题:实体表示与噪声或定义不清的标签。我们提出了一种改进的RE基线模型,通过引入带有类型标记的实体表示,其在TACRED数据集上的F1值达到74.6%,显著优于此前的最先进方法。此外,该新基线在经过优化的Re-TACRED数据集上取得了91.1%的F1值,表明预训练语言模型(Pretrained Language Models, PLMs)在该任务上已具备卓越的性能。我们已将代码开源,以支持后续研究工作。