HyperAI초신경

Common Sense Reasoning On Parus

평가 지표

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy
모델 10.574
unreasonable-effectiveness-of-rule-based0.498
russiansuperglue-a-russian-language0.486
모델 40.908
모델 50.508
모델 60.766
모델 70.528
unreasonable-effectiveness-of-rule-based0.478
모델 90.598
모델 100.508
모델 110.584
mt5-a-massively-multilingual-pre-trained-text0.504
unreasonable-effectiveness-of-rule-based0.48
모델 140.562
russiansuperglue-a-russian-language0.982
모델 160.492
모델 170.66
모델 180.498
모델 190.498
모델 200.476
모델 210.676
모델 220.554