HyperAI超神经

Open Domain Question Answering On Kilt 1

评估指标

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称EMF1KILT-EMKILT-F1R-PrecRecall@5
模型 131.6441.550.00.00.00.0
kilt-a-benchmark-for-knowledge-intensive12.6419.570.00.00.00.0
模型 30.00.00.00.042.9228.39
模型 415.3721.970.00.00.00.0
模型 50.00.00.00.051.2734.03
模型 611.2917.350.741.2625.0410.4
模型 731.7741.569.5311.2742.9228.39
模型 840.4651.4418.0621.4258.8351.03
模型 90.00.00.00.053.1235.48
模型 1036.947.6611.7113.8845.3835.75
模型 1126.9736.033.214.130.5912.59
模型 1225.1834.071.962.5325.0410.4
模型 133.296.840.00.00.00.0
模型 140.00.00.00.051.834.57