HyperAI超神経

Common Sense Reasoning On Parus

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
モデル 10.574
unreasonable-effectiveness-of-rule-based0.498
russiansuperglue-a-russian-language0.486
モデル 40.908
モデル 50.508
モデル 60.766
モデル 70.528
unreasonable-effectiveness-of-rule-based0.478
モデル 90.598
モデル 100.508
モデル 110.584
mt5-a-massively-multilingual-pre-trained-text0.504
unreasonable-effectiveness-of-rule-based0.48
モデル 140.562
russiansuperglue-a-russian-language0.982
モデル 160.492
モデル 170.66
モデル 180.498
モデル 190.498
モデル 200.476
モデル 210.676
モデル 220.554