HyperAI

Open Domain Question Answering On Kilt Eli5

Metriken

F1
KILT-F1
KILT-RL
R-Prec
ROUGE-L
Recall@5

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameF1KILT-F1KILT-RLR-PrecROUGE-LRecall@5
kilt-a-benchmark-for-knowledge-intensive16.10.00.00.019.080.0
Modell 20.00.00.015.830.025.49
Modell 30.00.00.017.50.025.54
Modell 415.912.382.4614.8316.4527.69
Modell 514.511.791.6911.014.0522.92
hurdles-to-progress-in-long-form-question22.882.342.3610.6723.1924.56
Modell 719.230.00.00.020.550.0
Modell 821.620.00.00.018.660.0
Modell 915.290.00.00.015.760.0
Modell 1027.133.02.6210.8324.5327.25
Modell 110.00.00.018.330.028.21
Modell 1216.40.00.00.017.670.0
Modell 1317.882.011.910.6717.4126.92
Modell 1414.80.00.00.016.880.0
Modell 1517.070.00.00.015.450.0
Modell 160.00.00.015.50.027.51