HyperAI超神経

Fact Verification On Kilt Fever

評価指標

Accuracy
KILT-AC
R-Prec
Recall@5

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名AccuracyKILT-ACR-PrecRecall@5
モデル 185.5864.4175.684.95
モデル 289.5471.2881.4589.56
モデル 366.141.8849.2470.16
モデル 469.410.00.00.0
モデル 570.710.00.00.0
モデル 612.570.00.00.0
モデル 778.930.00.00.0
モデル 871.420.00.00.0
モデル 988.9965.6874.7787.89
モデル 1072.340.00.00.0
kilt-a-benchmark-for-knowledge-intensive76.30.00.00.0
kilt-a-benchmark-for-knowledge-intensive86.3153.4561.9475.55
モデル 1371.380.00.00.0
モデル 1469.6858.5872.9373.52
re2g-retrieve-rerank-generate-289.5578.5388.9292.52
モデル 1623.010.00.00.0
モデル 1786.7447.6855.3374.29
モデル 1871.120.00.00.0
モデル 1986.3263.9474.4887.52
モデル 200.00.074.4887.52
モデル 210.00.083.6488.15
モデル 2288.450.00.00.0
モデル 2361.60.00.00.0
モデル 2471.240.00.00.0
モデル 2571.580.00.00.0
モデル 2667.980.00.00.0
モデル 2768.430.00.00.0
モデル 280.00.084.4588.62
モデル 2933.580.00.00.0
モデル 3069.710.00.00.0
モデル 3189.120.00.00.0
モデル 3276.260.00.00.0
モデル 330.00.084.0789.41