Reading Comprehension On Muserc
المقاييس
Average F1
EM
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Average F1 | EM |
---|---|---|
russiansuperglue-a-russian-language | 0.587 | 0.242 |
russiansuperglue-a-russian-language | 0.806 | 0.42 |
النموذج 3 | 0.687 | 0.278 |
النموذج 4 | 0.76 | 0.427 |
unreasonable-effectiveness-of-rule-based | 0.45 | 0.071 |
النموذج 6 | 0.769 | 0.446 |
النموذج 7 | 0.646 | 0.327 |
mt5-a-massively-multilingual-pre-trained-text | 0.844 | 0.543 |
النموذج 9 | 0.83 | 0.561 |
النموذج 10 | 0.742 | 0.399 |
النموذج 11 | 0.729 | 0.333 |
النموذج 12 | 0.673 | 0.364 |
النموذج 13 | 0.706 | 0.308 |
النموذج 14 | 0.642 | 0.319 |
النموذج 15 | 0.941 | 0.819 |
النموذج 16 | 0.639 | 0.239 |
النموذج 17 | 0.815 | 0.537 |
النموذج 18 | 0.653 | 0.221 |
unreasonable-effectiveness-of-rule-based | 0.671 | 0.237 |
النموذج 20 | 0.74 | 0.546 |
unreasonable-effectiveness-of-rule-based | 0.0 | 0.0 |
النموذج 22 | 0.711 | 0.324 |