HyperAI

Open Domain Question Answering On Kilt 2

Metriken

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameEMF1KILT-EMKILT-F1R-PrecRecall@5
Modell 172.7379.5445.5549.5758.8571.55
Modell 232.3939.850.00.00.00.0
Modell 359.666.5342.3646.1961.4968.33
kilt-a-benchmark-for-knowledge-intensive18.1127.830.00.00.00.0
Modell 50.00.00.00.069.1675.07
Modell 658.5567.7931.435.3444.4956.99
Modell 771.2775.8838.1340.1548.6857.13
Modell 873.0680.330.00.00.00.0
Modell 90.00.00.00.070.1975.64
re2g-retrieve-rerank-generate-276.2781.457.9161.7872.6874.23
Modell 1160.9966.5542.8546.0860.4963.54
Modell 120.00.00.00.061.4968.33
Modell 130.00.00.00.070.3669.16
Modell 1470.3874.4134.4836.2843.431.45
Modell 1570.8677.2950.5654.9968.3676.36