HyperAI

Open Domain Question Answering On Kilt Eli5

Métriques

F1
KILT-F1
KILT-RL
R-Prec
ROUGE-L
Recall@5

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleF1KILT-F1KILT-RLR-PrecROUGE-LRecall@5
kilt-a-benchmark-for-knowledge-intensive16.10.00.00.019.080.0
Modèle 20.00.00.015.830.025.49
Modèle 30.00.00.017.50.025.54
Modèle 415.912.382.4614.8316.4527.69
Modèle 514.511.791.6911.014.0522.92
hurdles-to-progress-in-long-form-question22.882.342.3610.6723.1924.56
Modèle 719.230.00.00.020.550.0
Modèle 821.620.00.00.018.660.0
Modèle 915.290.00.00.015.760.0
Modèle 1027.133.02.6210.8324.5327.25
Modèle 110.00.00.018.330.028.21
Modèle 1216.40.00.00.017.670.0
Modèle 1317.882.011.910.6717.4126.92
Modèle 1414.80.00.00.016.880.0
Modèle 1517.070.00.00.015.450.0
Modèle 160.00.00.015.50.027.51