Alltagswissen
Das Ziel von Aufgaben zur Alltagslogik ist es, Modellen zu ermöglichen, über die Mustererkennung hinauszugehen und Allgemeinwissen oder Weltwissen für das Schließen zu nutzen. Dies soll den Modellen ermöglichen, komplexe Situationen zu verstehen, fundierte Urteile und Vorhersagen zu treffen, wodurch die Intelligenz und die Anwendungseffekte in Bereichen wie der Natürlichsprachverarbeitung und Dialogsysteme gesteigert werden.
WinoGrande
PaLM 540B (0-shot)
ARC (Challenge)
ARC (Easy)
ST-MoE-32B 269B (fine-tuned)
ReCoRD
DeBERTa-1.5B
CommonsenseQA
MUPPET Roberta Large
PARus
RuCoS
RWSD
BIG-bench (Disambiguation QA)
BIG-bench (Causal Judgment)
BIG-bench (Date Understanding)
BIG-bench (Sports Understanding)
Event2Mind test
EA-VQ-VAE
Russian Event2Mind
araneum word2vec (skipgram) + GRU
SWAG
DeBERTalarge
BIG-bench (Winowhy)
BIG-bench (Known Unknowns)
PaLM-540B (few-shot, k=5)
BIG-bench (Logical Sequence)
Chinchilla-70B (few-shot, k=5)
Event2Mind dev
CODAH
BERT Large
CrowdSource QA
Visual Dialog v0.9
NMN [kottur2018visual]
Visual Dialog v0.9
WinoGAViL
ViLT