HyperAI超神经

Common Sense Reasoning On Parus

评估指标

Accuracy

评测结果

各个模型在此基准测试上的表现结果

比较表格
模型名称Accuracy
模型 10.574
unreasonable-effectiveness-of-rule-based0.498
russiansuperglue-a-russian-language0.486
模型 40.908
模型 50.508
模型 60.766
模型 70.528
unreasonable-effectiveness-of-rule-based0.478
模型 90.598
模型 100.508
模型 110.584
mt5-a-massively-multilingual-pre-trained-text0.504
unreasonable-effectiveness-of-rule-based0.48
模型 140.562
russiansuperglue-a-russian-language0.982
模型 160.492
模型 170.66
模型 180.498
模型 190.498
模型 200.476
模型 210.676
模型 220.554