HyperAI超神经

Common Sense Reasoning On Rwsd

评估指标

Accuracy

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Accuracy
模型 10.669
模型 20.571
模型 30.669
russiansuperglue-a-russian-language0.662
russiansuperglue-a-russian-language0.84
模型 60.636
模型 70.649
模型 80.545
模型 90.669
模型 100.675
mt5-a-massively-multilingual-pre-trained-text0.669
模型 120.669
unreasonable-effectiveness-of-rule-based0.669
模型 140.669
unreasonable-effectiveness-of-rule-based0.597
模型 160.669
模型 170.662
模型 180.669
模型 190.669
unreasonable-effectiveness-of-rule-based0.669
模型 210.669
模型 220.669