HyperAI

Common Sense Reasoning On Rucos

المقاييس

Average F1
EM

النتائج

نتائج أداء النماذج المختلفة على هذا المعيار القياسي

جدول المقارنة
اسم النموذجAverage F1EM
النموذج 10.740.716
النموذج 20.210.202
النموذج 30.290.29
النموذج 40.680.658
النموذج 50.920.924
النموذج 60.730.716
النموذج 70.860.859
النموذج 80.210.204
النموذج 90.670.665
mt5-a-massively-multilingual-pre-trained-text0.570.562
russiansuperglue-a-russian-language0.930.89
النموذج 120.790.752
unreasonable-effectiveness-of-rule-based0.250.247
النموذج 140.230.224
russiansuperglue-a-russian-language0.260.252
unreasonable-effectiveness-of-rule-based0.260.257
النموذج 170.320.314
النموذج 180.350.347
النموذج 190.360.351
النموذج 200.810.764
النموذج 210.220.218
unreasonable-effectiveness-of-rule-based0.250.247