HyperAI超神経

Reading Comprehension On Muserc

評価指標

Average F1
EM

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Average F1EM
russiansuperglue-a-russian-language0.587 0.242
russiansuperglue-a-russian-language0.8060.42
モデル 30.6870.278
モデル 40.760.427
unreasonable-effectiveness-of-rule-based0.450.071
モデル 60.7690.446
モデル 70.6460.327
mt5-a-massively-multilingual-pre-trained-text0.8440.543
モデル 90.830.561
モデル 100.7420.399
モデル 110.7290.333
モデル 120.6730.364
モデル 130.706 0.308
モデル 140.6420.319
モデル 150.9410.819
モデル 160.639 0.239
モデル 170.8150.537
モデル 180.6530.221
unreasonable-effectiveness-of-rule-based0.6710.237
モデル 200.740.546
unreasonable-effectiveness-of-rule-based0.0 0.0
モデル 220.711 0.324