HyperAI

Open Domain Question Answering On Kilt 2

Métriques

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleEMF1KILT-EMKILT-F1R-PrecRecall@5
Modèle 172.7379.5445.5549.5758.8571.55
Modèle 232.3939.850.00.00.00.0
Modèle 359.666.5342.3646.1961.4968.33
kilt-a-benchmark-for-knowledge-intensive18.1127.830.00.00.00.0
Modèle 50.00.00.00.069.1675.07
Modèle 658.5567.7931.435.3444.4956.99
Modèle 771.2775.8838.1340.1548.6857.13
Modèle 873.0680.330.00.00.00.0
Modèle 90.00.00.00.070.1975.64
re2g-retrieve-rerank-generate-276.2781.457.9161.7872.6874.23
Modèle 1160.9966.5542.8546.0860.4963.54
Modèle 120.00.00.00.061.4968.33
Modèle 130.00.00.00.070.3669.16
Modèle 1470.3874.4134.4836.2843.431.45
Modèle 1570.8677.2950.5654.9968.3676.36