Open Domain Question Answering On Kilt 1
评估指标
EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | EM | F1 | KILT-EM | KILT-F1 | R-Prec | Recall@5 |
---|---|---|---|---|---|---|
模型 1 | 31.64 | 41.55 | 0.0 | 0.0 | 0.0 | 0.0 |
kilt-a-benchmark-for-knowledge-intensive | 12.64 | 19.57 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 3 | 0.0 | 0.0 | 0.0 | 0.0 | 42.92 | 28.39 |
模型 4 | 15.37 | 21.97 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 5 | 0.0 | 0.0 | 0.0 | 0.0 | 51.27 | 34.03 |
模型 6 | 11.29 | 17.35 | 0.74 | 1.26 | 25.04 | 10.4 |
模型 7 | 31.77 | 41.56 | 9.53 | 11.27 | 42.92 | 28.39 |
模型 8 | 40.46 | 51.44 | 18.06 | 21.42 | 58.83 | 51.03 |
模型 9 | 0.0 | 0.0 | 0.0 | 0.0 | 53.12 | 35.48 |
模型 10 | 36.9 | 47.66 | 11.71 | 13.88 | 45.38 | 35.75 |
模型 11 | 26.97 | 36.03 | 3.21 | 4.1 | 30.59 | 12.59 |
模型 12 | 25.18 | 34.07 | 1.96 | 2.53 | 25.04 | 10.4 |
模型 13 | 3.29 | 6.84 | 0.0 | 0.0 | 0.0 | 0.0 |
模型 14 | 0.0 | 0.0 | 0.0 | 0.0 | 51.8 | 34.57 |