HyperAI超神经

Open Domain Question Answering On Kilt 2

评估指标

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称EMF1KILT-EMKILT-F1R-PrecRecall@5
模型 172.7379.5445.5549.5758.8571.55
模型 232.3939.850.00.00.00.0
模型 359.666.5342.3646.1961.4968.33
kilt-a-benchmark-for-knowledge-intensive18.1127.830.00.00.00.0
模型 50.00.00.00.069.1675.07
模型 658.5567.7931.435.3444.4956.99
模型 771.2775.8838.1340.1548.6857.13
模型 873.0680.330.00.00.00.0
模型 90.00.00.00.070.1975.64
re2g-retrieve-rerank-generate-276.2781.457.9161.7872.6874.23
模型 1160.9966.5542.8546.0860.4963.54
模型 120.00.00.00.061.4968.33
模型 130.00.00.00.070.3669.16
模型 1470.3874.4134.4836.2843.431.45
模型 1570.8677.2950.5654.9968.3676.36