Multi Task Language Understanding On Bbh Nlp
المقاييس
Average (%)
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | Average (%) |
---|---|
النموذج 1 | 86.3 |
scaling-instruction-finetuned-language-models | 71.2 |
orca-2-teaching-small-language-models-how-to | 45.93 |
scaling-instruction-finetuned-language-models | 62.7 |
scaling-instruction-finetuned-language-models | 70.0 |
scaling-instruction-finetuned-language-models | 78.4 |
scaling-instruction-finetuned-language-models | 78.2 |
orca-2-teaching-small-language-models-how-to | 50.18 |
evaluating-large-language-models-trained-on | 73.5 |
النموذج 10 | 82.4 |
النموذج 11 | 86.1 |
scaling-instruction-finetuned-language-models | 72.4 |
النموذج 13 | 85.9 |
النموذج 14 | 84.07 |
النموذج 15 | 81.0 |