E-KAR 全称 Benchmark for Explainable Knowledge-intensive Analogical Reasoning,是一个可解释知识密集型类比推理的基准。
识别类比的能力是人类认知的基础。现有的词语类比测试基准并不能揭示神经模型类比推理的底层过程。出于认为具有推理能力的模型应该是以正确的理由为基础的信念,我们提出了首个知识性可解释类比推理基准 (E-KAR) 。
我们的基准数据集包括来自公务员考试的 1,655 个(中文)和 1,251 个(英文)问题, 解决这些问题需要密集的背景知识。我们设计了一个自由文本解释方案,用于解释是否应该进行类比推理,并为每个问题和候选答案进行了手动标注。
实证结果表明,对于一些最先进的模型来说,这个基准数据集对于解释生成和类比问题回答任务都具有很大挑战性, 这引发了进一步的研究。
做种 0
下载中 2
已完成 48
总下载 200