Common Sense Reasoning On Swag
المقاييس
Test
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Test |
---|---|
roberta-a-robustly-optimized-bert-pretraining | 89.9 |
swag-a-large-scale-adversarial-dataset-for | 52.7 |
swag-a-large-scale-adversarial-dataset-for | 59.2 |
bert-pre-training-of-deep-bidirectional | 86.3 |
deberta-decoding-enhanced-bert-with | 90.8 |