Common Sense Reasoning
Das Ziel von Aufgaben zur Alltagslogik ist es, Modellen zu ermöglichen, über die Mustererkennung hinauszugehen und Allgemeinwissen oder Weltwissen für das Schließen zu nutzen. Dies soll den Modellen ermöglichen, komplexe Situationen zu verstehen, fundierte Urteile und Vorhersagen zu treffen, wodurch die Intelligenz und die Anwendungseffekte in Bereichen wie der Natürlichsprachverarbeitung und Dialogsysteme gesteigert werden.
ARC (Challenge)
ARC (Easy)
GAL 120B (0-shot)
BIG-bench (Causal Judgment)
BIG-bench (Date Understanding)
BIG-bench (Disambiguation QA)
BIG-bench (Known Unknowns)
PaLM-540B (few-shot, k=5)
BIG-bench (Logical Sequence)
Chinchilla-70B (few-shot, k=5)
BIG-bench (Sports Understanding)
BIG-bench (Winowhy)
CODAH
BERT Large
CommonsenseQA
QA-GNN
CrowdSource QA
Event2Mind dev
Event2Mind test
EA-VQ-VAE
PARus
ReCoRD
ST-MoE-32B 269B (fine-tuned)
RuCoS
Russian Event2Mind
araneum word2vec (skipgram) + GRU
RWSD
SWAG
DeBERTalarge
Visual Dialog v0.9
Visual Dialog v0.9
NMN [kottur2018visual]
WinoGAViL
ViLT
WinoGrande
PaLM 540B (0-shot)