HyperAI

Open Domain Question Answering On Kilt

Métriques

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleEMF1KILT-EMKILT-F1R-PrecRecall@5
Modèle 139.7548.4329.0934.759.4268.24
Modèle 246.0556.570.00.00.00.0
Modèle 345.2253.3836.3641.8363.7170.17
Modèle 453.7462.2438.7844.463.1668.19
Modèle 50.00.00.00.059.4268.24
Modèle 641.2749.5430.0634.7254.2965.52
Modèle 738.6447.0931.9937.5860.6646.79
Modèle 80.353.720.00.00.00.0
re2g-retrieve-rerank-generate-251.7360.9743.5649.870.7876.63
Modèle 1021.7528.690.00.00.00.0
Modèle 1151.5960.8335.3240.7359.8371.17
Modèle 120.00.00.00.062.664.95
kilt-a-benchmark-for-knowledge-intensive19.627.730.00.00.00.0
Modèle 140.00.00.00.060.3261.21
Modèle 150.00.00.00.060.2561.36
Modèle 1644.3952.3532.6937.9159.4967.06