HyperAI

Fact Verification On Kilt Fever

Métriques

Accuracy
KILT-AC
R-Prec
Recall@5

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracyKILT-ACR-PrecRecall@5
Modèle 185.5864.4175.684.95
Modèle 289.5471.2881.4589.56
Modèle 366.141.8849.2470.16
Modèle 469.410.00.00.0
Modèle 570.710.00.00.0
Modèle 612.570.00.00.0
Modèle 778.930.00.00.0
Modèle 871.420.00.00.0
Modèle 988.9965.6874.7787.89
Modèle 1072.340.00.00.0
kilt-a-benchmark-for-knowledge-intensive76.30.00.00.0
kilt-a-benchmark-for-knowledge-intensive86.3153.4561.9475.55
Modèle 1371.380.00.00.0
Modèle 1469.6858.5872.9373.52
re2g-retrieve-rerank-generate-289.5578.5388.9292.52
Modèle 1623.010.00.00.0
Modèle 1786.7447.6855.3374.29
Modèle 1871.120.00.00.0
Modèle 1986.3263.9474.4887.52
Modèle 200.00.074.4887.52
Modèle 210.00.083.6488.15
Modèle 2288.450.00.00.0
Modèle 2361.60.00.00.0
Modèle 2471.240.00.00.0
Modèle 2571.580.00.00.0
Modèle 2667.980.00.00.0
Modèle 2768.430.00.00.0
Modèle 280.00.084.4588.62
Modèle 2933.580.00.00.0
Modèle 3069.710.00.00.0
Modèle 3189.120.00.00.0
Modèle 3276.260.00.00.0
Modèle 330.00.084.0789.41