Math Word Problem Solving
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
asdiv-a
أفضل نموذج: ATHENA (roberta-large)
المقاييس
عرض التفاصيل
gsm-plus
أفضل نموذج: GPT-4
المقاييس
عرض التفاصيل
math-minival
أفضل نموذج: Process Supervision (GPT-4)
المقاييس
عرض التفاصيل
math23k
أفضل نموذج: Roberta-DeductReasoner
المقاييس
عرض التفاصيل
mathqa
أفضل نموذج: ELASTIC (RoBERTa-large)
المقاييس
عرض التفاصيل
mawps
أفضل نموذج: OpenMath-CodeLlama-70B (w/ code)
المقاييس
عرض التفاصيل
paramawps
أفضل نموذج: DeBERTa (VM)
المقاييس
عرض التفاصيل
pen
أفضل نموذج: EPT-X
المقاييس
عرض التفاصيل
svamp
أفضل نموذج: GPT-4 (Teaching-Inspired)
المقاييس
عرض التفاصيل
svamp-1-n
أفضل نموذج: ATHENA (roberta-large)
المقاييس
عرض التفاصيل
alg514
المقاييس
عرض التفاصيل
draw-1k
المقاييس
عرض التفاصيل
math
المقاييس
عرض التفاصيل