Language Modelling
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
100-sleep-nights-of-8-caregivers
Bestes Modell: Gpt3
Metriken
Details anzeigen
2000-hub5-english
Bestes Modell: MMLU
Metriken
Details anzeigen
big-bench-lite-1
Bestes Modell: GLM-130B (3-shot)
Metriken
Details anzeigen
c4
Bestes Modell: Primer
Metriken
Details anzeigen
clue-cmrc2018
Bestes Modell: GLM-130B
Metriken
Details anzeigen
clue-ocnli-50k
Bestes Modell: GLM-130B
Metriken
Details anzeigen
enwik8-dev
Bestes Modell: Transformer-LS (small)
Metriken
Details anzeigen
enwik8
Bestes Modell: GPT-2 (48 layers, h=1600)
Metriken
Details anzeigen
enwiki8
Bestes Modell: PAR Transformer 24B
Metriken
Details anzeigen
hutter-prize
Bestes Modell: Transformer-XL + RMS dynamic eval
Metriken
Details anzeigen
lambada
Bestes Modell: GPT-3 175B (Few-Shot)
Metriken
Details anzeigen
language-modeling-recommendation
Bestes Modell: GPT2
Metriken
Details anzeigen
one-billion-word
Bestes Modell: MDLM (AR baseline)
Metriken
Details anzeigen
openwebtext
Bestes Modell: GPT2-Hermite
Metriken
Details anzeigen
penn-treebank-character-level
Bestes Modell: Mogrifier LSTM + dynamic eval
Metriken
Details anzeigen
penn-treebank-word-level
Bestes Modell: GPT-3 (Zero-Shot)
Metriken
Details anzeigen
ptb
Bestes Modell: I-DARTS
Metriken
Details anzeigen
salmon
Bestes Modell: Spirit-LM (Expr.)
Metriken
Details anzeigen
stackexchange
Bestes Modell: Gopher
Metriken
Details anzeigen
text8
Bestes Modell: GPT-2
Metriken
Details anzeigen
text8-dev
Bestes Modell: Transformer-LS (small)
Metriken
Details anzeigen
the-pile
Bestes Modell: Test-Time Fine-Tuning with SIFT + Llama-3.2 (3B)
Metriken
Details anzeigen
vietmed
Bestes Modell: Hybrid 4-gram VietMed-Train + ExtraText
Metriken
Details anzeigen
wiki-40b
Bestes Modell: FLASH-Quad-8k
Metriken
Details anzeigen
wikitext-103
Bestes Modell: RETRO (7.5B)
Metriken
Details anzeigen
wikitext-2
Bestes Modell: SparseGPT (175B, 50% Sparsity)
Metriken
Details anzeigen
-5
Metriken
Details anzeigen
arxiv
Metriken
Details anzeigen
bookcorpus2
Metriken
Details anzeigen
books3
Metriken
Details anzeigen
clue-afqmc
Metriken
Details anzeigen
clue-c3
Metriken
Details anzeigen
clue-cmnli
Metriken
Details anzeigen
clue-drcd
Metriken
Details anzeigen
clue-wsc1-1
Metriken
Details anzeigen
curation-corpus
Metriken
Details anzeigen
dm-mathematics
Metriken
Details anzeigen
fewclue-bustm
Metriken
Details anzeigen
fewclue-chid-fc
Metriken
Details anzeigen
fewclue-cluewsc-fc
Metriken
Details anzeigen
fewclue-eprstmt
Metriken
Details anzeigen
fewclue-ocnli-fc
Metriken
Details anzeigen
freelaw
Metriken
Details anzeigen
github
Metriken
Details anzeigen
gutenberg-pg-19
Metriken
Details anzeigen
hackernews
Metriken
Details anzeigen
nih-exporter
Metriken
Details anzeigen
opensubtitles-1
Metriken
Details anzeigen
openwebtext2
Metriken
Details anzeigen
philpapers
Metriken
Details anzeigen
pile-cc
Metriken
Details anzeigen
pubmed-abstracts
Metriken
Details anzeigen
pubmed-central
Metriken
Details anzeigen
ubuntu-irc
Metriken
Details anzeigen
uspto-backgrounds
Metriken
Details anzeigen