6 个月前

摘要

信息抽取（Information Extraction, IE）是一项变革性技术，通过实体识别与关系抽取（Relation Extraction, RE）方法，将非结构化文本数据转化为结构化格式。在该框架中，识别实体对之间的语义关系起着至关重要的作用。尽管现有关系抽取技术种类繁多，但其性能高度依赖于标注数据的可获得性以及大量计算资源的支持。针对上述挑战，大型语言模型（Large Language Models, LLMs）展现出显著潜力；然而，由于其训练数据的局限性，LLMs 有时会产生幻觉性（hallucinating）输出。为克服这些局限，本文提出一种基于检索增强生成的关系抽取方法（Retrieved-Augmented Generation-based Relation Extraction, RAG4RE），旨在提升关系抽取任务的整体性能。本文通过多种主流大型语言模型对所提出的 RAG4RE 方法进行了系统评估。实验基于 TACRED、TACREV、Re-TACRED 以及 SemEval RE 等权威基准数据集，全面检验该方法的有效性。特别地，研究中采用了 Flan T5、Llama2 和 Mistral 等具有代表性的大型语言模型作为核心组件。实验结果表明，相较于仅依赖 LLM 的传统关系抽取方法，本文提出的 RAG4RE 方法在性能上显著更优，尤其在 TACRED 及其变体数据集上表现突出。此外，与以往的关系抽取方法相比，RAG4RE 在 TACRED 和 TACREV 两个数据集上均展现出卓越的性能，充分验证了其有效性与在自然语言处理领域推动关系抽取技术发展的巨大潜力。

源 PDF