HyperAI超神経

Common Sense Reasoning On Rwsd

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
モデル 10.669
モデル 20.571
モデル 30.669
russiansuperglue-a-russian-language0.662
russiansuperglue-a-russian-language0.84
モデル 60.636
モデル 70.649
モデル 80.545
モデル 90.669
モデル 100.675
mt5-a-massively-multilingual-pre-trained-text0.669
モデル 120.669
unreasonable-effectiveness-of-rule-based0.669
モデル 140.669
unreasonable-effectiveness-of-rule-based0.597
モデル 160.669
モデル 170.662
モデル 180.669
モデル 190.669
unreasonable-effectiveness-of-rule-based0.669
モデル 210.669
モデル 220.669