Common Sense Reasoning On Rwsd
评估指标
Accuracy
评测结果
各个模型在此基准测试上的表现结果
比较表格
模型名称 | Accuracy |
---|---|
模型 1 | 0.669 |
模型 2 | 0.571 |
模型 3 | 0.669 |
russiansuperglue-a-russian-language | 0.662 |
russiansuperglue-a-russian-language | 0.84 |
模型 6 | 0.636 |
模型 7 | 0.649 |
模型 8 | 0.545 |
模型 9 | 0.669 |
模型 10 | 0.675 |
mt5-a-massively-multilingual-pre-trained-text | 0.669 |
模型 12 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.669 |
模型 14 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.597 |
模型 16 | 0.669 |
模型 17 | 0.662 |
模型 18 | 0.669 |
模型 19 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.669 |
模型 21 | 0.669 |
模型 22 | 0.669 |