Common Sense Reasoning On Rwsd
평가 지표
Accuracy
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Accuracy |
---|---|
모델 1 | 0.669 |
모델 2 | 0.571 |
모델 3 | 0.669 |
russiansuperglue-a-russian-language | 0.662 |
russiansuperglue-a-russian-language | 0.84 |
모델 6 | 0.636 |
모델 7 | 0.649 |
모델 8 | 0.545 |
모델 9 | 0.669 |
모델 10 | 0.675 |
mt5-a-massively-multilingual-pre-trained-text | 0.669 |
모델 12 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.669 |
모델 14 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.597 |
모델 16 | 0.669 |
모델 17 | 0.662 |
모델 18 | 0.669 |
모델 19 | 0.669 |
unreasonable-effectiveness-of-rule-based | 0.669 |
모델 21 | 0.669 |
모델 22 | 0.669 |