Natural Language Inference On Lidirus
평가 지표
MCC
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | MCC |
---|---|
모델 1 | 0.218 |
모델 2 | 0.209 |
모델 3 | 0.01 |
모델 4 | -0.013 |
모델 5 | 0.178 |
unreasonable-effectiveness-of-rule-based | 0 |
모델 7 | 0.096 |
unreasonable-effectiveness-of-rule-based | 0 |
mt5-a-massively-multilingual-pre-trained-text | 0.061 |
모델 10 | 0.231 |
모델 11 | 0.224 |
모델 12 | 0.124 |
모델 13 | 0.189 |
모델 14 | 0 |
unreasonable-effectiveness-of-rule-based | 0.147 |
모델 16 | 0.32 |
모델 17 | 0.267 |
모델 18 | 0.235 |
모델 19 | 0.191 |
모델 20 | 0.339 |
russiansuperglue-a-russian-language | 0.626 |
russiansuperglue-a-russian-language | 0.06 |