HyperAI超神経

Open Domain Question Answering On Kilt

評価指標

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名EMF1KILT-EMKILT-F1R-PrecRecall@5
モデル 139.7548.4329.0934.759.4268.24
モデル 246.0556.570.00.00.00.0
モデル 345.2253.3836.3641.8363.7170.17
モデル 453.7462.2438.7844.463.1668.19
モデル 50.00.00.00.059.4268.24
モデル 641.2749.5430.0634.7254.2965.52
モデル 738.6447.0931.9937.5860.6646.79
モデル 80.353.720.00.00.00.0
re2g-retrieve-rerank-generate-251.7360.9743.5649.870.7876.63
モデル 1021.7528.690.00.00.00.0
モデル 1151.5960.8335.3240.7359.8371.17
モデル 120.00.00.00.062.664.95
kilt-a-benchmark-for-knowledge-intensive19.627.730.00.00.00.0
モデル 140.00.00.00.060.3261.21
モデル 150.00.00.00.060.2561.36
モデル 1644.3952.3532.6937.9159.4967.06