الاستدلال بالحدس
الهدف من مهام الاستدلال بالحدس هو تمكين النماذج من التخطي فوق التعرف على الأنماط واستخدام الحدس أو المعرفة العالمية في الاستدلال. هذا يهدف إلى السماح للنماذج بفهم المواقف المعقدة، وإصدار أحكام وتنبؤات معقولة، وبالتالي رفع مستوى الذكاء وتحسين تأثيرات التطبيقات في مجالات مثل معالجة اللغة الطبيعية وأنظمة الحوار.
WinoGrande
PaLM 540B (0-shot)
ARC (Challenge)
ARC (Easy)
ST-MoE-32B 269B (fine-tuned)
ReCoRD
DeBERTa-1.5B
CommonsenseQA
MUPPET Roberta Large
RWSD
PARus
RuCoS
BIG-bench (Causal Judgment)
BIG-bench (Date Understanding)
BIG-bench (Disambiguation QA)
BIG-bench (Sports Understanding)
Event2Mind test
EA-VQ-VAE
Russian Event2Mind
araneum word2vec (skipgram) + GRU
SWAG
DeBERTalarge
BIG-bench (Winowhy)
BIG-bench (Known Unknowns)
PaLM-540B (few-shot, k=5)
BIG-bench (Logical Sequence)
Chinchilla-70B (few-shot, k=5)
Event2Mind dev
CrowdSource QA
CODAH
BERT Large
Visual Dialog v0.9
WinoGAViL
ViLT
Visual Dialog v0.9
NMN [kottur2018visual]