HyperAI초신경

Open Domain Question Answering On Kilt 1

평가 지표

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름EMF1KILT-EMKILT-F1R-PrecRecall@5
모델 131.6441.550.00.00.00.0
kilt-a-benchmark-for-knowledge-intensive12.6419.570.00.00.00.0
모델 30.00.00.00.042.9228.39
모델 415.3721.970.00.00.00.0
모델 50.00.00.00.051.2734.03
모델 611.2917.350.741.2625.0410.4
모델 731.7741.569.5311.2742.9228.39
모델 840.4651.4418.0621.4258.8351.03
모델 90.00.00.00.053.1235.48
모델 1036.947.6611.7113.8845.3835.75
모델 1126.9736.033.214.130.5912.59
모델 1225.1834.071.962.5325.0410.4
모델 133.296.840.00.00.00.0
모델 140.00.00.00.051.834.57