HyperAI초신경

Fact Verification On Kilt Fever

평가 지표

Accuracy
KILT-AC
R-Prec
Recall@5

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름AccuracyKILT-ACR-PrecRecall@5
모델 185.5864.4175.684.95
모델 289.5471.2881.4589.56
모델 366.141.8849.2470.16
모델 469.410.00.00.0
모델 570.710.00.00.0
모델 612.570.00.00.0
모델 778.930.00.00.0
모델 871.420.00.00.0
모델 988.9965.6874.7787.89
모델 1072.340.00.00.0
kilt-a-benchmark-for-knowledge-intensive76.30.00.00.0
kilt-a-benchmark-for-knowledge-intensive86.3153.4561.9475.55
모델 1371.380.00.00.0
모델 1469.6858.5872.9373.52
re2g-retrieve-rerank-generate-289.5578.5388.9292.52
모델 1623.010.00.00.0
모델 1786.7447.6855.3374.29
모델 1871.120.00.00.0
모델 1986.3263.9474.4887.52
모델 200.00.074.4887.52
모델 210.00.083.6488.15
모델 2288.450.00.00.0
모델 2361.60.00.00.0
모델 2471.240.00.00.0
모델 2571.580.00.00.0
모델 2667.980.00.00.0
모델 2768.430.00.00.0
모델 280.00.084.4588.62
모델 2933.580.00.00.0
모델 3069.710.00.00.0
모델 3189.120.00.00.0
모델 3276.260.00.00.0
모델 330.00.084.0789.41