Common Sense Reasoning
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
arc-easy
أفضل نموذج: GAL 120B (0-shot)
المقاييس
عرض التفاصيل
big-bench-known-unknowns
أفضل نموذج: PaLM-540B (few-shot, k=5)
المقاييس
عرض التفاصيل
big-bench-logical-sequence
أفضل نموذج: Chinchilla-70B (few-shot, k=5)
المقاييس
عرض التفاصيل
codah
أفضل نموذج: BERT Large
المقاييس
عرض التفاصيل
commonsenseqa
أفضل نموذج: QA-GNN
المقاييس
عرض التفاصيل
event2mind-test
أفضل نموذج: EA-VQ-VAE
المقاييس
عرض التفاصيل
record
أفضل نموذج: ST-MoE-32B 269B (fine-tuned)
المقاييس
عرض التفاصيل
russian-event2mind
أفضل نموذج: araneum word2vec (skipgram) + GRU
المقاييس
عرض التفاصيل
swag
أفضل نموذج: DeBERTalarge
المقاييس
عرض التفاصيل
visual-dialog-v0-9-1
أفضل نموذج: NMN [kottur2018visual]
المقاييس
عرض التفاصيل
winogavil
أفضل نموذج: ViLT
المقاييس
عرض التفاصيل
winogrande
أفضل نموذج: PaLM 540B (0-shot)
المقاييس
عرض التفاصيل
arc-challenge
المقاييس
عرض التفاصيل
big-bench-disambiguation-qa
المقاييس
عرض التفاصيل
big-bench-causal-judgment
المقاييس
عرض التفاصيل
big-bench-date-understanding
المقاييس
عرض التفاصيل
big-bench-sports-understanding
المقاييس
عرض التفاصيل
big-bench-winowhy
المقاييس
عرض التفاصيل
crowdsource-qa
المقاييس
عرض التفاصيل
event2mind-dev
المقاييس
عرض التفاصيل
parus
المقاييس
عرض التفاصيل
rucos
المقاييس
عرض التفاصيل
rwsd
المقاييس
عرض التفاصيل
visual-dialog-v0-9
المقاييس
عرض التفاصيل