HyperAI

Open Domain Question Answering On Kilt

Metriken

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameEMF1KILT-EMKILT-F1R-PrecRecall@5
Modell 139.7548.4329.0934.759.4268.24
Modell 246.0556.570.00.00.00.0
Modell 345.2253.3836.3641.8363.7170.17
Modell 453.7462.2438.7844.463.1668.19
Modell 50.00.00.00.059.4268.24
Modell 641.2749.5430.0634.7254.2965.52
Modell 738.6447.0931.9937.5860.6646.79
Modell 80.353.720.00.00.00.0
re2g-retrieve-rerank-generate-251.7360.9743.5649.870.7876.63
Modell 1021.7528.690.00.00.00.0
Modell 1151.5960.8335.3240.7359.8371.17
Modell 120.00.00.00.062.664.95
kilt-a-benchmark-for-knowledge-intensive19.627.730.00.00.00.0
Modell 140.00.00.00.060.3261.21
Modell 150.00.00.00.060.2561.36
Modell 1644.3952.3532.6937.9159.4967.06