الاستدلال بالحدس
الهدف من مهام الاستدلال بالحدس هو تمكين النماذج من التخطي فوق التعرف على الأنماط واستخدام الحدس أو المعرفة العالمية في الاستدلال. هذا يهدف إلى السماح للنماذج بفهم المواقف المعقدة، وإصدار أحكام وتنبؤات معقولة، وبالتالي رفع مستوى الذكاء وتحسين تأثيرات التطبيقات في مجالات مثل معالجة اللغة الطبيعية وأنظمة الحوار.
WinoGrande
PaLM 540B (0-shot)
ARC (Challenge)
ARC (Easy)
ST-MoE-32B 269B (fine-tuned)
ReCoRD
DeBERTa-1.5B
CommonsenseQA
MUPPET Roberta Large
PARus
RuCoS
RWSD
BIG-bench (Disambiguation QA)
BIG-bench (Causal Judgment)
BIG-bench (Date Understanding)
BIG-bench (Sports Understanding)
Event2Mind test
EA-VQ-VAE
Russian Event2Mind
araneum word2vec (skipgram) + GRU
SWAG
DeBERTalarge
BIG-bench (Winowhy)
BIG-bench (Known Unknowns)
PaLM-540B (few-shot, k=5)
BIG-bench (Logical Sequence)
Chinchilla-70B (few-shot, k=5)
Event2Mind dev
CODAH
BERT Large
CrowdSource QA
Visual Dialog v0.9
NMN [kottur2018visual]
Visual Dialog v0.9
WinoGAViL
ViLT