HyperAI超神经

Fact Verification On Kilt Fever

评估指标

Accuracy
KILT-AC
R-Prec
Recall@5

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称AccuracyKILT-ACR-PrecRecall@5
模型 185.5864.4175.684.95
模型 289.5471.2881.4589.56
模型 366.141.8849.2470.16
模型 469.410.00.00.0
模型 570.710.00.00.0
模型 612.570.00.00.0
模型 778.930.00.00.0
模型 871.420.00.00.0
模型 988.9965.6874.7787.89
模型 1072.340.00.00.0
kilt-a-benchmark-for-knowledge-intensive76.30.00.00.0
kilt-a-benchmark-for-knowledge-intensive86.3153.4561.9475.55
模型 1371.380.00.00.0
模型 1469.6858.5872.9373.52
re2g-retrieve-rerank-generate-289.5578.5388.9292.52
模型 1623.010.00.00.0
模型 1786.7447.6855.3374.29
模型 1871.120.00.00.0
模型 1986.3263.9474.4887.52
模型 200.00.074.4887.52
模型 210.00.083.6488.15
模型 2288.450.00.00.0
模型 2361.60.00.00.0
模型 2471.240.00.00.0
模型 2571.580.00.00.0
模型 2667.980.00.00.0
模型 2768.430.00.00.0
模型 280.00.084.4588.62
模型 2933.580.00.00.0
模型 3069.710.00.00.0
模型 3189.120.00.00.0
模型 3276.260.00.00.0
模型 330.00.084.0789.41