HyperAI超神経

Open Domain Question Answering On Kilt 1

評価指標

EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名EMF1KILT-EMKILT-F1R-PrecRecall@5
モデル 131.6441.550.00.00.00.0
kilt-a-benchmark-for-knowledge-intensive12.6419.570.00.00.00.0
モデル 30.00.00.00.042.9228.39
モデル 415.3721.970.00.00.00.0
モデル 50.00.00.00.051.2734.03
モデル 611.2917.350.741.2625.0410.4
モデル 731.7741.569.5311.2742.9228.39
モデル 840.4651.4418.0621.4258.8351.03
モデル 90.00.00.00.053.1235.48
モデル 1036.947.6611.7113.8845.3835.75
モデル 1126.9736.033.214.130.5912.59
モデル 1225.1834.071.962.5325.0410.4
モデル 133.296.840.00.00.00.0
モデル 140.00.00.00.051.834.57