Common Sense Reasoning On Rucos
المقاييس
Average F1
EM
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Average F1 | EM |
---|---|---|
النموذج 1 | 0.74 | 0.716 |
النموذج 2 | 0.21 | 0.202 |
النموذج 3 | 0.29 | 0.29 |
النموذج 4 | 0.68 | 0.658 |
النموذج 5 | 0.92 | 0.924 |
النموذج 6 | 0.73 | 0.716 |
النموذج 7 | 0.86 | 0.859 |
النموذج 8 | 0.21 | 0.204 |
النموذج 9 | 0.67 | 0.665 |
mt5-a-massively-multilingual-pre-trained-text | 0.57 | 0.562 |
russiansuperglue-a-russian-language | 0.93 | 0.89 |
النموذج 12 | 0.79 | 0.752 |
unreasonable-effectiveness-of-rule-based | 0.25 | 0.247 |
النموذج 14 | 0.23 | 0.224 |
russiansuperglue-a-russian-language | 0.26 | 0.252 |
unreasonable-effectiveness-of-rule-based | 0.26 | 0.257 |
النموذج 17 | 0.32 | 0.314 |
النموذج 18 | 0.35 | 0.347 |
النموذج 19 | 0.36 | 0.351 |
النموذج 20 | 0.81 | 0.764 |
النموذج 21 | 0.22 | 0.218 |
unreasonable-effectiveness-of-rule-based | 0.25 | 0.247 |