Mathematical Reasoning On Frontiermath
المقاييس
Accuracy
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Accuracy |
---|---|
النموذج 1 | 0.01 |
النموذج 2 | 0.01 |
النموذج 3 | 0.01 |
النموذج 4 | 0.01 |
النموذج 5 | 0.252 |
frontiermath-a-benchmark-for-evaluating | 0.02 |