Logical Reasoning
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
lingoly
أفضل نموذج: Claude Opus
المقاييس
عرض التفاصيل
big-bench-formal-fallacies-syllogisms
المقاييس
عرض التفاصيل
big-bench-logic-grid-puzzle
المقاييس
عرض التفاصيل
big-bench-logical-fallacy-detection
المقاييس
عرض التفاصيل
big-bench-penguins-in-a-table
المقاييس
عرض التفاصيل
big-bench-reasoning-about-colored-objects
المقاييس
عرض التفاصيل
big-bench-strategyqa
المقاييس
عرض التفاصيل
big-bench-temporal-sequences
المقاييس
عرض التفاصيل
ruworldtree
المقاييس
عرض التفاصيل
winograd-automatic
المقاييس
عرض التفاصيل