Common Sense Reasoning
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
arc-easy
Bestes Modell: GAL 120B (0-shot)
Metriken
Details anzeigen
big-bench-known-unknowns
Bestes Modell: PaLM-540B (few-shot, k=5)
Metriken
Details anzeigen
big-bench-logical-sequence
Bestes Modell: Chinchilla-70B (few-shot, k=5)
Metriken
Details anzeigen
codah
Bestes Modell: BERT Large
Metriken
Details anzeigen
commonsenseqa
Bestes Modell: QA-GNN
Metriken
Details anzeigen
event2mind-test
Bestes Modell: EA-VQ-VAE
Metriken
Details anzeigen
record
Bestes Modell: ST-MoE-32B 269B (fine-tuned)
Metriken
Details anzeigen
russian-event2mind
Bestes Modell: araneum word2vec (skipgram) + GRU
Metriken
Details anzeigen
swag
Bestes Modell: DeBERTalarge
Metriken
Details anzeigen
visual-dialog-v0-9-1
Bestes Modell: NMN [kottur2018visual]
Metriken
Details anzeigen
winogavil
Bestes Modell: ViLT
Metriken
Details anzeigen
winogrande
Bestes Modell: PaLM 540B (0-shot)
Metriken
Details anzeigen
arc-challenge
Metriken
Details anzeigen
big-bench-disambiguation-qa
Metriken
Details anzeigen
big-bench-causal-judgment
Metriken
Details anzeigen
big-bench-date-understanding
Metriken
Details anzeigen
big-bench-sports-understanding
Metriken
Details anzeigen
big-bench-winowhy
Metriken
Details anzeigen
crowdsource-qa
Metriken
Details anzeigen
event2mind-dev
Metriken
Details anzeigen
parus
Metriken
Details anzeigen
rucos
Metriken
Details anzeigen
rwsd
Metriken
Details anzeigen
visual-dialog-v0-9
Metriken
Details anzeigen