HyperAIHyperAI

Command Palette

Search for a command to run...

BenchIE:一个面向多维度事实型开放信息抽取的评估框架

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

摘要

对开放信息抽取(OIE)系统的内在评估通常采用两种方式:人工评估(由人工评价者判断抽取结果的正确性)或基于标准化基准的自动评估。后者虽然成本更低,但可靠性较差,主要原因在于现有OIE基准数据集的不完整性:其标准答案(ground truth)并未涵盖同一事实的所有可接受表达形式,从而导致对模型性能的评估不可靠。此外,现有的OIE基准仅适用于英语。为此,本文提出BenchIE:一个面向英语、中文和德语的OIE系统全面评估基准与评估框架。与现有基准不同,BenchIE采用基于事实的评估范式,即充分考虑抽取结果的信息等价性——其标准答案以“事实同义词集”(fact synsets)的形式组织,每个同义词集全面列举了同一事实的所有可接受表面表达形式。同时,考虑到OIE在实际下游任务中的常见应用需求,BenchIE具有多维度特性:我们构建了多个针对不同评估维度的基准变体,例如抽取结果的紧凑性或最小性等。利用BenchIE对多个前沿OIE系统进行评测,我们发现这些系统在实际表现上显著低于现有基准所显示的水平。BenchIE(包含数据与评估代码)已公开发布于 https://github.com/gkiril/benchie


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供