HyperAI
الرئيسية
الأخبار
أحدث الأوراق البحثية
الدروس
مجموعات البيانات
الفعاليات
الموسوعة
SOTA
نماذج LLM
البحث
حول
العربية
HyperAI
Toggle sidebar
البحث في الموقع...
⌘
K
الرئيسية
SOTA
Multi Task Language Understanding
Multi Task Language Understanding
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
bbh-alg
أفضل نموذج: code-davinci-002 175B (CoT)
المقاييس
عرض التفاصيل
bbh-nlp
أفضل نموذج: Flan-PaLM 540B (3-shot, fine-tuned, CoT + SC)
المقاييس
عرض التفاصيل
mgsm
المقاييس
عرض التفاصيل
mmlu
أفضل نموذج: ds-r1(671b)
المقاييس
عرض التفاصيل
mmlu-5-shot
أفضل نموذج: Sakalti/ultiima-78B
المقاييس
عرض التفاصيل