HyperAI초신경

Open Domain Question Answering On Kilt Eli5

평가 지표

F1
KILT-F1
KILT-RL
R-Prec
ROUGE-L
Recall@5

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름F1KILT-F1KILT-RLR-PrecROUGE-LRecall@5
kilt-a-benchmark-for-knowledge-intensive16.10.00.00.019.080.0
모델 20.00.00.015.830.025.49
모델 30.00.00.017.50.025.54
모델 415.912.382.4614.8316.4527.69
모델 514.511.791.6911.014.0522.92
hurdles-to-progress-in-long-form-question22.882.342.3610.6723.1924.56
모델 719.230.00.00.020.550.0
모델 821.620.00.00.018.660.0
모델 915.290.00.00.015.760.0
모델 1027.133.02.6210.8324.5327.25
모델 110.00.00.018.330.028.21
모델 1216.40.00.00.017.670.0
모델 1317.882.011.910.6717.4126.92
모델 1414.80.00.00.016.880.0
모델 1517.070.00.00.015.450.0
모델 160.00.00.015.50.027.51