Common Sense Reasoning
共通感覚推論の課題の目標は、モデルがパターン認識を超えて共通感覚や世界の知識を用いて推論を行うことを可能にすることです。これにより、モデルは複雑な状況を理解し、合理的な判断や予測を行えるようになり、自然言語処理や対話システムなどの分野での知能レベルと応用効果が向上します。
ARC (Challenge)
ARC (Easy)
GAL 120B (0-shot)
BIG-bench (Causal Judgment)
BIG-bench (Date Understanding)
BIG-bench (Disambiguation QA)
BIG-bench (Known Unknowns)
PaLM-540B (few-shot, k=5)
BIG-bench (Logical Sequence)
Chinchilla-70B (few-shot, k=5)
BIG-bench (Sports Understanding)
BIG-bench (Winowhy)
CODAH
BERT Large
CommonsenseQA
QA-GNN
CrowdSource QA
Event2Mind dev
Event2Mind test
EA-VQ-VAE
PARus
ReCoRD
ST-MoE-32B 269B (fine-tuned)
RuCoS
Russian Event2Mind
araneum word2vec (skipgram) + GRU
RWSD
SWAG
DeBERTalarge
Visual Dialog v0.9
Visual Dialog v0.9
NMN [kottur2018visual]
WinoGAViL
ViLT
WinoGrande
PaLM 540B (0-shot)