HyperAI

Common Sense Reasoning

قائمة المعايير القياسية

جميع المعايير القياسية المتعلقة بهذه المهمة

arc-easy
أفضل نموذج: GAL 120B (0-shot)

المقاييس

عرض التفاصيل
big-bench-known-unknowns
أفضل نموذج: PaLM-540B (few-shot, k=5)

المقاييس

عرض التفاصيل
big-bench-logical-sequence
أفضل نموذج: Chinchilla-70B (few-shot, k=5)

المقاييس

عرض التفاصيل
codah
أفضل نموذج: BERT Large

المقاييس

عرض التفاصيل
commonsenseqa
أفضل نموذج: QA-GNN

المقاييس

عرض التفاصيل
event2mind-test
أفضل نموذج: EA-VQ-VAE

المقاييس

عرض التفاصيل
record
أفضل نموذج: ST-MoE-32B 269B (fine-tuned)

المقاييس

عرض التفاصيل
russian-event2mind
أفضل نموذج: araneum word2vec (skipgram) + GRU

المقاييس

عرض التفاصيل
swag
أفضل نموذج: DeBERTalarge

المقاييس

عرض التفاصيل
visual-dialog-v0-9-1
أفضل نموذج: NMN [kottur2018visual]

المقاييس

عرض التفاصيل
winogavil
أفضل نموذج: ViLT

المقاييس

عرض التفاصيل
winogrande
أفضل نموذج: PaLM 540B (0-shot)

المقاييس

عرض التفاصيل
arc-challenge

المقاييس

عرض التفاصيل
big-bench-disambiguation-qa

المقاييس

عرض التفاصيل
big-bench-causal-judgment

المقاييس

عرض التفاصيل
big-bench-date-understanding

المقاييس

عرض التفاصيل
big-bench-sports-understanding

المقاييس

عرض التفاصيل
big-bench-winowhy

المقاييس

عرض التفاصيل
crowdsource-qa

المقاييس

عرض التفاصيل
event2mind-dev

المقاييس

عرض التفاصيل
parus

المقاييس

عرض التفاصيل
rucos

المقاييس

عرض التفاصيل
rwsd

المقاييس

عرض التفاصيل
visual-dialog-v0-9

المقاييس

عرض التفاصيل