5 天前

FinReflectKG:金融知识图谱的智能体构建与评估

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, Bhaskarjit Sarmah, Stefano Pasquali
FinReflectKG:金融知识图谱的智能体构建与评估
摘要

由于金融文档的复杂性与强监管特性,金融领域在大规模知识图谱(Knowledge Graph, KG)构建方面面临独特挑战。尽管结构化金融知识至关重要,但该领域仍缺乏大规模、开源的数据集,难以全面捕捉企业披露信息中的丰富语义关系。为此,我们推出一个开源的、大规模的金融知识图谱数据集,其构建基础为标普100指数公司最新的年度SEC 10-K披露文件——这一综合性资源旨在推动金融人工智能领域的研究发展。我们提出了一种稳健且具备良好泛化能力的知识图谱构建框架,该框架融合了智能文档解析、面向表格的文本分块、基于模式引导的迭代式信息抽取,并引入了以反思驱动的反馈机制。我们的系统配备了一套全面的评估流程,结合基于规则的校验、统计验证以及“大语言模型作为裁判”(LLM-as-a-Judge)的评估方式,从多维度综合衡量信息抽取的质量。系统支持三种抽取模式:单次遍历、多次遍历以及基于反思代理(reflection agent)的模式,用户可根据效率、准确性和可靠性之间的不同需求灵活选择。实证评估结果表明,基于反思代理的抽取模式在各项关键指标上均表现最优,实现了对所有基于规则策略(CheckRules)的64.8%合规率,并在大语言模型引导的评估中,于精确率、全面性与相关性等核心指标上显著优于基线方法(单次遍历与多次遍历模式)。