HyperAI초신경

Open Domain Question Answering On Kilt

평가 지표

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름EMF1KILT-EMKILT-F1R-PrecRecall@5
모델 139.7548.4329.0934.759.4268.24
모델 246.0556.570.00.00.00.0
모델 345.2253.3836.3641.8363.7170.17
모델 453.7462.2438.7844.463.1668.19
모델 50.00.00.00.059.4268.24
모델 641.2749.5430.0634.7254.2965.52
모델 738.6447.0931.9937.5860.6646.79
모델 80.353.720.00.00.00.0
re2g-retrieve-rerank-generate-251.7360.9743.5649.870.7876.63
모델 1021.7528.690.00.00.00.0
모델 1151.5960.8335.3240.7359.8371.17
모델 120.00.00.00.062.664.95
kilt-a-benchmark-for-knowledge-intensive19.627.730.00.00.00.0
모델 140.00.00.00.060.3261.21
모델 150.00.00.00.060.2561.36
모델 1644.3952.3532.6937.9159.4967.06